智源研究院开源裁判模型“JudgeLM”，可评测各类大模型并输出评分

874 天前

11月13日，星期一 10:00

智源研究院开源裁判模型“JudgeLM”，可评测各类大模型并输出评分

火讯财经讯，据站长之家11月13日报道，智源研究院开源了一种名为JudgeLM的裁判模型，可以高效准确地评判各类大模型。与GPT-4相比，JudgeLM仅需1/120的成本，就能达到90%以上的评判结果一致性。它可以应用于纯文本、多模态等多种评判场景，并可以输出评分、判断和阐述理由。通过创新方法，JudgeLM与参考答案的一致性最高超过了90%，接近人类表现。JudgeLM有三个不同参数版本，分别为70亿、130亿和330亿参数，能力和表现随着参数规模的增大而提升。此外，智源研究院还开源了一个包含训练和验证样本的数据集，用于深入研究大语言模型裁判。JudgeLM的评判效率高，成本低于基于API的评判方法。

数据：过去 24 小时全网爆仓 1.29 亿美元，多单爆仓 7,025.55 万美元，空单爆仓 5,852.15 万美元

火讯财经讯，过去24小时全网爆仓1.29亿美元，其中多单爆仓7025.55万美元，空单爆仓5852.15万美元。具体来看，比特币多单爆仓871.31万美元，空单爆仓2287.26万美元；以太坊多单爆仓3060.72万美元，空单爆仓1548.65万美元。

1 小时前
数据：BTC 当前全网 8 小时平均资金费率为 -0%

火讯财经讯，据最新数据显示，BTC当前全网8小时平均资金费率为-0%；主流交易所中，Binance费率为0.0019%，OKX费率为0.0021%，Bybit费率为0.0017%，Gate费率为0.0001%。

2 小时前
分析：美伊对峙缺乏退路，升级风险上升

火讯财经讯，中东问题学者Mohammad Ali Shabani表示，美国总统特朗普已准备兑现其打击伊朗关键基础设施的威胁，这将带来地区局势严重升级的风险。伊朗方面则通过对科威特基础设施发动攻击，向美国传递“不会退缩”的信号。他补充称，当前局势某种程度上类似一场对峙，双方都没有能够体面退场的路径，未来24小时内地区出现严重升级的可能性很高。

2 小时前
某巨鲸疑似卖出 3099 万枚 STO，错失超 5000 万美元利润

火讯财经讯，链上数据显示，地址0x78F…07a2B一小时前收到3099万枚STO，按当前价格约合598万美元；随后45分钟前，该地址向Binge充值1000万枚STO，价值约192万美元。回溯上述3099万枚STO的资金来源，系两个地址在2025年10月至2026年1月期间以均价0.1713美元囤积。本次操作中，相关方卖出将获利20.7万美元；不过，这批代币在币价峰值时曾浮盈5233万美元。

4 小时前
Michael Saylor 驳斥看衰比特币言论，2020 年 8 月以来，比特币一直是表现最佳的主流资产

火讯财经讯，经济学家兼加密货币批评者Peter Schiff发文呼吁抛售比特币，Strategy创始人Michael Saylor对此予以驳斥。 Schiff稍早前指出，过去五年比特币价格仅上涨12%；同期，纳斯达克上涨57.4%，标普500上涨59.4%，黄金上涨163%，白银上涨181%。他质疑，若比特币吸引力在于更优越的长期表现，为何还有人继续持有。 Saylor回复称，时间框架至关重要。自2020年8月以来，比特币一直是表现最佳的主流资产，且优势非常明显；若将时间跨度拉长，这种差距只会更大。

4 小时前

874 天前

智源研究院开源裁判模型“JudgeLM”，可评测各类大模型并输出评分

数据：过去 24 小时全网爆仓 1.29 亿美元，多单爆仓 7,025.55 万美元，空单爆仓 5,852.15 万美元

数据：BTC 当前全网 8 小时平均资金费率为 -0%

分析：美伊对峙缺乏退路，升级风险上升

某巨鲸疑似卖出 3099 万枚 STO，错失超 5000 万美元利润

Michael Saylor 驳斥看衰比特币言论，2020 年 8 月以来，比特币一直是表现最佳的主流资产

友情链接：