441 天前

10月12日,星期六 06:30

OpenAI推出名为MLE-bench的新基准,用于评估AI代理开发机器学习解决方案的能力

火讯财经讯,10月12日消息,据TheDecoder报道,OpenAI推出了名为MLE-bench的新基准,旨在评估AI代理在机器学习解决方案开发中的表现。该基准涵盖75项Kaggle竞赛,重点评估当前机器学习开发的挑战性任务,并将AI结果与人类表现进行比较。初步测试中,o1-preview模型与AIDE框架结合表现最佳,在16.9%的竞赛中获得铜牌,超过了Anthropic的Claude3.5Sonnet。通过增加尝试次数,o1-preview的成功率翻倍至34.1%。OpenAI认为,MLE-bench有助于评估核心ML工程技能,尽管它并未涵盖所有AI研究领域。

0
0
  • Flow基金会宣布正在调查可能影响网络安全的事件

    火讯财经讯,12月27日消息,Flow官方在X平台发文宣布,Flow基金会目前正在调查可能影响Flow网络的安全事件,目前工程团队正与网络合作伙伴积极协作以缓解问题影响,并且将尽快提供经核实的最新信息。此前消息,FLOW价格短时出现暴跌,疑似出现网络安全,Bithumb和Upbit均宣布将暂停FLOW的存款和取款。

    28 分钟前

  • FLOW跌破0.13 USDT,24小时跌幅27.42%

    火讯财经讯,12月27日消息,OKX行情显示,FLOW跌破0.13USDT,现报0.1268USDT,24小时跌幅27.42%。

    58 分钟前

  • Hyperliquid上ZEC多头持仓TOP2地址已浮盈148万美元

    火讯财经讯,12月27日消息,据链上分析师Ai姨监测,地址0x8de…92dae(也是HyperliquidZEC多头持仓TOP2)昨天以均价446.48美元开启了ZEC10x多单,目前持仓22,457.57枚代币,价值1150万美元,随着ZEC再次突破510美元,他已浮盈148万美元。

    58 分钟前

  • Bithumb宣布将暂时中止FLOW存款和取款

    火讯财经讯,12月27日消息,据官方公告,Bithumb宣布由于FLOW系统维护,将于2025年12月27日星期六晚上9点暂时中止FLOW存款和取款。

    58 分钟前

  • Hyperliquid上ZEC多头持仓TOP1地址已浮盈494.9万美元

    火讯财经讯,12月27日消息,据链上分析师Ai姨监测,Hyperliquid上ZEC多头持仓TOP1地址已浮盈494.9万美元,他目前持有48,000.89枚ZEC,价值2462万美元,开仓价409.87美元;开仓应该已经有段时间了(资金费都付了8万美元),最后一次加仓是在12月15日。

    58 分钟前