874 天前

11月13日,星期一 10:00

智源研究院开源裁判模型“JudgeLM”,可评测各类大模型并输出评分

火讯财经讯,据站长之家11月13日报道,智源研究院开源了一种名为JudgeLM的裁判模型,可以高效准确地评判各类大模型。与GPT-4相比,JudgeLM仅需1/120的成本,就能达到90%以上的评判结果一致性。它可以应用于纯文本、多模态等多种评判场景,并可以输出评分、判断和阐述理由。通过创新方法,JudgeLM与参考答案的一致性最高超过了90%,接近人类表现。JudgeLM有三个不同参数版本,分别为70亿、130亿和330亿参数,能力和表现随着参数规模的增大而提升。此外,智源研究院还开源了一个包含训练和验证样本的数据集,用于深入研究大语言模型裁判。JudgeLM的评判效率高,成本低于基于API的评判方法。

2
0
  • 数据:过去 24 小时全网爆仓 1.29 亿美元,多单爆仓 7,025.55 万美元,空单爆仓 5,852.15 万美元

    火讯财经讯,过去24小时全网爆仓1.29亿美元,其中多单爆仓7025.55万美元,空单爆仓5852.15万美元。具体来看,比特币多单爆仓871.31万美元,空单爆仓2287.26万美元;以太坊多单爆仓3060.72万美元,空单爆仓1548.65万美元。

    1 小时前

  • 数据:BTC 当前全网 8 小时平均资金费率为 -0%

    火讯财经讯,据最新数据显示,BTC当前全网8小时平均资金费率为-0%;主流交易所中,Binance费率为0.0019%,OKX费率为0.0021%,Bybit费率为0.0017%,Gate费率为0.0001%。

    2 小时前

  • 分析:美伊对峙缺乏退路,升级风险上升

    火讯财经讯,中东问题学者Mohammad Ali Shabani表示,美国总统特朗普已准备兑现其打击伊朗关键基础设施的威胁,这将带来地区局势严重升级的风险。伊朗方面则通过对科威特基础设施发动攻击,向美国传递“不会退缩”的信号。他补充称,当前局势某种程度上类似一场对峙,双方都没有能够体面退场的路径,未来24小时内地区出现严重升级的可能性很高。

    2 小时前

  • 某巨鲸疑似卖出 3099 万枚 STO,错失超 5000 万美元利润

    火讯财经讯,链上数据显示,地址0x78F…07a2B一小时前收到3099万枚STO,按当前价格约合598万美元;随后45分钟前,该地址向Binge充值1000万枚STO,价值约192万美元。 回溯上述3099万枚STO的资金来源,系两个地址在2025年10月至2026年1月期间以均价0.1713美元囤积。本次操作中,相关方卖出将获利20.7万美元;不过,这批代币在币价峰值时曾浮盈5233万美元。

    4 小时前

  • Michael Saylor 驳斥看衰比特币言论,2020 年 8 月以来,比特币一直是表现最佳的主流资产

    火讯财经讯,经济学家兼加密货币批评者Peter Schiff发文呼吁抛售比特币,Strategy创始人Michael Saylor对此予以驳斥。 Schiff稍早前指出,过去五年比特币价格仅上涨12%;同期,纳斯达克上涨57.4%,标普500上涨59.4%,黄金上涨163%,白银上涨181%。他质疑,若比特币吸引力在于更优越的长期表现,为何还有人继续持有。 Saylor回复称,时间框架至关重要。自2020年8月以来,比特币一直是表现最佳的主流资产,且优势非常明显;若将时间跨度拉长,这种差距只会更大。

    4 小时前