866 天前

11月25日,星期六 12:45

LeCun 发文质疑 LLM 推理能力,大模型涌现离不开上下文学习

火讯财经讯,据站长之家11月24日报道,近期,Meta首席人工智能科学家杨立昆(YannLeCun)在推特上引发了关于大语言模型(LLM)推理能力的讨论,强调LLM缺乏真正的规划推理能力,其涌现能力实际上是上下文学习的结果。研究表明,针对复杂规划任务,如国际规划大赛中的问题,LLM的性能较差,其推理能力在特定领域受限,而涌现能力主要体现在简单任务和事先知道答案的情境中。文章还提到,对于LLM的规划任务研究存在一些问题,包括领域知识和实际执行计划的混淆。研究团队通过混淆规划问题中的动作和对象的名称来降低近似检索的有效性,挑战LLM的经验表现。

5
0
  • Base 公布 Base Batch 003 加速器入选名单,12 个 AI 与 DeFi 等领域项目入围

    火讯财经讯,Base宣布正式启动第三期初创企业加速器项目Base Batch 003。本期项目为期7周,时间为4月6日至5月19日;经过对1175份申请的筛选,最终有12支团队入选,入选项目聚焦DeFi、AI、稳定币和预测市场等领域。 以下为12支入围团队及项目介绍: - Blockrun.ai:AI代理访问大语言模型(LLM)及数据的基础设施 - Stealth:新型预测市场杠杆原语 - 4Mica:代理微交易结算基础设施 - OPAL:主打隐私保护的永续合约去中心化交易所(支持加密货币与现实世界资产RWA) - Onsight:游戏化社交预测平台 - Credifi:基于零知识传输层安全协议(zktls)与信用评分的无抵押借贷协议 - Tomorrow:面向创作者经济的担保稳定币借贷平台 - Agently:供AI协调与交易的路由层 - Nivo:面向中小企业的链上外汇对冲平台 - JPEG App:基于图片内容的意见市场 - Floe Labs:面向AI代理与机构的信贷网络 - Liminal:自托管的AI原生新银行 入选团队在加速器期间将获得来自Coinbase内外部专家的专属指导及合作伙伴福利,并有机会获得Base生态基金的直接投资。本期项目将于5月19日在旧金山举办线下Demo Day闭幕。

    18 分钟前

  • 币安将调整 BTCUSDT 等 U 本位合约最低名义价值

    火讯财经讯,为提升市场流动性及用户体验,币安将调整BTCUSDT与BTCUSDC的USDⓈ-M永续合约订单最低名义价值,从100 USDT/USDC下调至50 USDT/USDC。此次调整预计在4小时内完成,且不会影响现有订单及正常交易。

    18 分钟前

  • 币安将下架 BIFI、FIO、FUN、MDT、OXT、WAN

    火讯财经讯,币安将于2026年4月23日11:00停止交易并下架以下币种:Beefy.Finance(BIFI)、FIO Protocol(FIO)、FunToken(FUN)、Measurable Data Token(MDT)、Orchid(OXT)、Wanchain(WAN)。请用户留意相关交易对的变动,提前做好资产管理。

    35 分钟前

  • 中本聪协议 Layer2 上线,链上计算与治理机制完成升级

    火讯财经讯,中本聪协议Layer2结算网络于4月6日正式上线,在链上数据统计与计算能力上实现优化升级。 技术层面,该Layer2支持链上深度累计计算,能更准确反映链上团队规模与业务数据,提升复杂场景下的处理效率。 治理层面,协议已将核心权限移交至多签合约,同时采用开发者与社区核心成员各占50%的双轨治理模式,执行门槛为65%,进一步提升去中心化程度。 此次升级完成了协议向社区自治的过渡,为DeFi领域提供技术与治理参考。

    52 分钟前

  • 分析师:美国 3 月 CPI 数据将反映伊朗能源冲击影响

    火讯财经讯,美国第一公民银行分析师在一份报告中表示,周五即将公布的美国CPI数据预计将首次实质性体现伊朗能源冲击的传导效应,受能源成本飙升推动,总体通胀将加速上行。该行市场与经济研究主管指出,尽管核心通胀受到的影响更为温和,但美联储将“忽视”能源驱动的通胀飙升,这一情况会强化美联储长期按兵不动的立场,且潜在降息将与能源价格正常化紧密挂钩。

    1 小时前