471 天前

02月23日,星期天 11:45

OpenAI员工公开指责Grok3的基准测试结果具有误导性

火讯财经讯,2月23日消息,据金十报道,近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(IgorBabushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3ReasoningBeta和Grok3miniReasoning——在AIME2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

0
0
  • 投行 TD Cowen 重申 Strategy 目标价为 400 美元,维持“买入”评级

    火讯财经讯,投资银行TD Cowen分析师Lance Vitanza重申对比特币财库公司Strategy(MSTR)的买入评级,目标价维持400美元不变。

    19 分钟前

  • 数据:某巨鲸将 SP500 空单增至 1.476 亿美元,浮盈 97.7 万美元

    火讯财经讯,据链上监测数据,某巨鲸将标普500指数空单规模扩大至1.476亿美元,当前该头寸已录得97.7万美元浮盈,清算价格为8067.34美元。

    20 分钟前

  • 数据:过去 24 小时全网爆仓 3.51 亿美元,主爆多单

    火讯财经讯,过去24小时内加密货币市场总爆仓金额达3.51亿美元,其中多单爆仓2.54亿美元,空单爆仓9649.37万美元。BTC爆仓1.04亿美元(多单8622.96万美元,空单1777.08万美元),ETH爆仓7749.42万美元(多单5019.63万美元,空单2729.79万美元),SOL爆仓1075.48万美元(多单822.2万美元,空单253.28万美元)。期间共114869人被爆仓,最大单笔爆仓为Binance的BTCUSDT交易对,价值805.13万美元。

    20 分钟前

  • 欧洲斯托克 600 指数转跌,日内曾涨 0.8%

    火讯财经讯,据Gate行情数据,欧洲斯托克600指数由涨转跌,此前该指数一度上涨0.8%。

    41 分钟前

  • 美国众议院筹款委员会推出六项加密税务法案,聚焦挖矿、质押与申报规则

    火讯财经讯,美国众议院筹款委员会召开加密税务听证会,会前推出六项涉及加密捐赠、挖矿质押税收、报告要求等领域的法案,及一份针对离岸加密避税行为的讨论草案。相关法案旨在为数字资产建立清晰公平的税收规则,维护美国全球加密中心地位,Fidelity、Coinbase等机构代表出席听证。

    54 分钟前