1006 天前

08月08日,星期二 01:00

研究发现:ChatGPT 回答编程问题的错误率超过 50%

火讯财经讯,据IT之家8月8日消息,美国普渡大学的研究发现,OpenAI开发的人工智能聊天机器人ChatGPT在回答软件编程问题时,错误率超过一半,且能骗过三分之一的提问者。该研究团队分析了ChatGPT对517个StackOverflow网站上的问题的回答,评估了其正确性、一致性、全面性和简洁性。他们还对回答进行了语言和情感分析,并对12名志愿参与者进行了问卷调查。研究报告的结论是:ChatGPT的回答虽然语言风格良好,但52%的回答是错误的,77%是冗长的。参与者只有在回答中的错误很明显时,才能识别出来。否则,他们会被ChatGPT的友好、权威和细致的语言风格所误导。StackOverflow是一个专门为程序员提供问答服务的网站,被认为是开发者获取代码片段和解决问题的重要来源。此外,OpenAI在其ChatGPT网站上承认其软件“可能会产生关于人、地点或事实的不准确信息。”

1
0
  • Polymarket 上线多项功能更新,整治幽灵成交并封禁违规账户

    火讯财经讯,Polymarket公布最新进展与功能更新,推出延迟垃圾请求缓解措施保障订单下达与取消操作,修复“余额/授权不足”报错问题,影响限价买单的核心问题预计未来几天完成修复。平台已识别并封禁多个早于充值钱包系统上线前创建、存在“幽灵成交”行为的账户集群,相关行为会被实时识别封禁,充值钱包系统将阻止其批量注册新账号,未来一周还将发布更多更新解决遗留问题。

    29 分钟前

  • Solana 链上 Meme 币 TROLL 市值突破 9000 万美元,24 小时涨超 77%

    火讯财经讯,据监测数据,Solana生态Meme币TROLL市值大幅拉升突破9000万美元,暂报9147万美元,24小时涨幅77%,24小时成交量达1220万美元。需注意Meme币交易波动极大,多依赖市场情绪与概念炒作,无实际价值或用例,投资者需警惕风险。

    39 分钟前

  • 比特币矿企 MARA 就 Long Ridge 的 6 亿美元票据发起同意征求程序,以推进资产收购

    火讯财经讯,纳斯达克上市比特币矿企MARA Holdings就Long Ridge Energy的6亿美元高级担保票据发起持有人同意征求程序,以修改相关契约条款。MARA此前已于4月29日签署协议拟收购Long Ridge母公司100%股权,该交易将触发票据中的“控制权变更”条款,理论上需以101%价格现金回购全部未偿票据。MARA此次寻求票据持有人同意,将该交易排除在“控制权变更”定义之外,并将MARA及其关联方列为“许可持有人”。

    1 小时前

  • USDT0 公布安全架构细节,采用 3/3 验证机制并推出 600 万美元漏洞赏金计划

    火讯财经讯,Kelp安全事件后,Tether旗下资产互操作性协议USDT0公布安全架构细节:当前系统采用专有DVN(去中心化验证网络)并拥有消息否决权,跨链消息需3个基于不同代码库的独立验证器达成3/3一致共识才可完成结算,现有验证节点包含USDT0专有DVN、LayerZero及Canary,未来拟扩展至4/4、5/5验证机制。此外,所有多签交易提交签名前需经内部团队、外部安全团队及审计机构多重审核,相关合约已获Guardian、OpenZeppelin等机构审计,还在Immunefi上线了600万美元漏洞赏金计划。

    1 小时前

  • 报告:Coinbase 与 Kraken 占美国加密行业 AI 引用量 22%,IBIT 主导比特币 ETF 相关回答

    火讯财经讯,市场分析报告显示,Coinbase与Kraken合计占所有加密类别AI引用量的22%,其中Coinbase占13%,Kraken占9%,领先优势超过其他美国交易平台三倍。Gemini以5.5%排名第三,Robinhood Crypto以5%排名第四,BlackRock旗下现货比特币ETF IBIT以4.5%排名第五,并在“比特币ETF”相关提问中占据主导地位。分析指出,硬件钱包在AI回答中的影响力正在减弱,Ledger与Trezor虽仍主导“最佳加密钱包”相关问题,但在“最佳加密资产存储方式”问题中,AI越来越倾向推荐受监管交易平台托管方案。报告认为,FTX事件后兴起的“自托管叙事”已不再是AI引用的主导框架。此外,AI正在快速塑造美国散户加密金融品牌格局,“当用户询问ChatGPT在哪里购买比特币时,被AI优先展示的平台,将有机会定义未来十年的行业格局。”

    1 小时前