825 天前

12月28日,星期四 05:45

SuperCLUE 发布中文大模型基准测评 2023 年度报告:国内外差距依然明显

火讯财经讯,据北京商报报道,12月28日,国内中文模型评测机构SuperCLUE发布中文大模型基准测评2023年度报告。根据报告,过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从7月份与GPT3.5的20分差距,每个月都有稳定且巨大的提升,到11月份测评时已经完成总分上对GPT3.5的超越。据介绍,本次测评数据选取了SuperCLUE-12月测评结果,模型选取了国内外有代表性的26个大模型在12月份的版本。测评结果显示,国内外差距依然明显。GPT4-Turbo总分90.63分遥遥领先,高于其他国内大模型及国外大模型。其中国内最好模型文心一言4.0(API)总分79.02分,距离GPT4-Turbo有11.61分,距离GPT4(网页)有4.9分的差距。但过去1年国内大模型已经有了长足的进步。综合能力超过GPT3.5和Gemini-Pro的模型有11个,比如百度的文心一言4.0、阿里云的通义千问2.0和Qwen-72B-Chat、OPPO的AndesGPT、清华&智谱AI的智谱清言、字节跳动的云雀大模型等都有比较好的表现。另外国内开源模型在中文上表现要好于国外开源模型,如百川智能的Baichuan2-13B-Chat、阿里云的Qwen-72B、Yi-34B-Chat均优于Llama2-13B-Chat。

4
0
  • 数据:89 枚 BTC 转入 Cumberland DRW,价值约 606 万美元

    火讯财经讯,据Arkham数据,在02:36,89枚BTC(价值约606万美元)从以168Bve...开头的匿名地址转入Cumberland DRW。

    32 分钟前

  • 数据:若 ETH 跌破 2,021 美元,主流 CEX 累计多单清算强度将达 10.76 亿美元

    火讯财经讯,数据显示,若ETH跌破2021美元,主流中心化交易所(CEX)累计多单清算强度将达10.76亿美元;反之,若ETH突破2231美元,主流CEX累计空单清算强度将达6.33亿美元。

    45 分钟前

  • 数据:若 BTC 跌破 64,938 美元,主流 CEX 累计多单清算强度将达 15.37 亿美元

    火讯财经讯,若BTC跌破64,938美元,主流CEX累计多单清算强度将达15.37亿美元;反之,若BTC突破71,398美元,主流CEX累计空单清算强度将达13.93亿美元。

    45 分钟前

  • 安全警报,Drift 遭重大攻击超 2.2 亿美元资产被可疑转移

    火讯财经讯,Solana生态去中心化金融(DeFi)协议Drift Protocol近期遭受重大攻击,约2.2亿至2.7亿美元资产被可疑转移至地址“HkGz4K”。随后,部分被盗资产被桥接至以太坊链上,已买入19,913枚ETH,当前价值约4260万美元;另有部分SOL被转入Hyperliquid兑换为ETH,部分SOL被转入Binance。 被盗资产明细显示:USDC价值1.03亿美元,SOL价值5400万美元,WBTC价值1900万美元,WETH价值1200万美元,cbBTC价值1100万美元,USDT价值600万美元,USDS价值500万美元,SYRUPUSDC价值300万美元,JLP价值200万美元。 Drift Protocol官方已发文回应,称注意到协议存在异常活动,目前正在开展调查;调查期间请用户不要向Drift存入资金,此次事件并非愚人节玩笑;请用户谨慎行事,直至另行通知,后续最新消息将通过官方渠道发布。

    50 分钟前

  • 数据:过去 1 小时 Binance 净流入 3,034.36 万 USDT

    火讯财经讯,Binance在过去1小时内净流入3,034.36万USDT

    1 小时前