北京深度求索公司推出首个国产开源MoE大模型

809 天前

01月13日，星期六 02:30

北京深度求索公司推出首个国产开源MoE大模型

火讯财经讯，据量子位报道，北京深度求索公司推出首个国产开源MoE大模型DeepSeekMoE，性能媲美Llama2-7B，计算量降低60%。DeepSeekMoE目前推出的版本参数量为160亿，实际激活参数量大约是28亿。此外，深度求索团队还透露，DeepSeekMoE模型还有145B版本正在研发。阶段性的初步试验显示，145B的DeepSeekMoE对GShard137B具有极大的领先优势，同时能够以28.5%的计算量达到与密集版DeepSeek67B模型相当的性能。

数据：若 ETH 突破 2,156 美元，主流 CEX 累计空单清算强度将达 7.6 亿美元

火讯财经讯，据数据显示，若ETH突破2156美元，主流CEX累计空单清算强度将达7.6亿美元；反之，若ETH跌破1969美元，主流CEX累计多单清算强度将达1.66亿美元。

9 分钟前
数据：若 BTC 突破 69,807 美元，主流 CEX 累计空单清算强度将达 13.89 亿美元

火讯财经讯，BTC若突破69,807美元，主流CEX累计空单清算强度将达13.89亿美元；反之，若BTC跌破63,903美元，主流CEX累计多单清算强度将达4.16亿美元。

9 分钟前
数据：某新建钱包从币安提取 1176 万枚 STO，不到 24 小时浮盈 405 万美元

火讯财经讯，据链上监测数据显示，过去24小时内，STO价格上涨超200%。某新建钱包从币安提取1176万枚STO，提取时价值294万美元；目前该笔代币价值699万美元，该钱包在不到24小时内浮盈405万美元。

12 分钟前
美元指数 DXY 站上 100，日内涨幅 0.43%

火讯财经讯，根据 Gate 行情数据，美元指数 DXY 已站上 100 关口，日内涨幅达 0.43%。

12 分钟前
数据：麻吉大哥 ETH 多单面临清算，距清算价仅差 13 美元

火讯财经讯，麻吉大哥（地址0x020...872）当前持有6000枚ETH的25倍多单，开仓价为2084.5美元，清算价为2040.5美元，距离清算价仅剩13美元。此前，其已平仓1700枚ETH，亏损48000美元。

20 分钟前

809 天前

北京深度求索公司推出首个国产开源MoE大模型

数据：若 ETH 突破 2,156 美元，主流 CEX 累计空单清算强度将达 7.6 亿美元

数据：若 BTC 突破 69,807 美元，主流 CEX 累计空单清算强度将达 13.89 亿美元

数据：某新建钱包从币安提取 1176 万枚 STO，不到 24 小时浮盈 405 万美元

美元指数 DXY 站上 100，日内涨幅 0.43%

数据：麻吉大哥 ETH 多单面临清算，距清算价仅差 13 美元

友情链接：