1021 天前

06月25日,星期天 03:00

AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,并称训练成本仅为竞品零头

火讯财经讯,据IT之家6月25日报道,AI创业公司MosaicML近日发布了其语言模型MPT-30B,该模型具有300亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大AI模型在更广泛领域的运用。MosaicML公司的首席执行官兼联合创始人NaveenRao表示,MPT-30B的训练成本为70万美元(约502.44万元人民币),远低于GPT-3等同类产品所需的数千万美元训练成本。此外,由于MPT-30B的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。据悉,MosaicML使用了Alibi和FlashAttention技术来优化模型,可以实现更长的文本长度和对GPU计算的更高利用率。MosaicML也是少数几个能够使用NvidiaH100GPU的实验室,相比以往成果,当下每块GPU的吞吐量增加了2.4倍以上,可带来更快的完成时间。

1
0
  • 数据:过去 24 小时全网爆仓 1.99 亿美元,多单爆仓 5,485.93 万美元,空单爆仓 1.44 亿美元

    火讯财经讯,过去24小时全网加密货币市场爆仓金额达1.99亿美元,其中多单爆仓5485.93万美元,空单爆仓1.44亿美元。 比特币方面,多单爆仓389.59万美元,空单爆仓4067.4万美元;以太坊多单爆仓525.65万美元,空单爆仓6329.27万美元。 此外,过去24小时全球共有95161人遭遇爆仓,最大单笔爆仓单发生在BTCUSDT交易对,价值378.89万美元。

    3 小时前

  • 数据:ETH 突破 2300 美元

    火讯财经讯,ETH/USDT现报2305.47美元,24小时涨幅2.65%。

    4 小时前

  • 数据:若 ETH 跌破 2,150 美元,主流 CEX 累计多单清算强度将达 6.99 亿美元

    火讯财经讯,数据显示,若ETH跌破2150美元,主流CEX累计多单清算强度将达6.99亿美元;反之,若ETH突破2358美元,主流CEX累计空单清算强度将达5.73亿美元。

    4 小时前

  • 数据:若 BTC 突破 76,291 美元,主流 CEX 累计空单清算强度将达 10.57 亿美元

    火讯财经讯,BTC若突破76291美元,主流CEX累计空单清算强度将达10.57亿美元;若跌破69679美元,主流CEX累计多单清算强度将达10.4亿美元。

    4 小时前

  • 数据:过去 24 小时全网爆仓 9,850.84 万美元,多单爆仓 4,121.51 万美元,空单爆仓 5,729.32 万美元

    火讯财经讯,过去24小时全网爆仓金额为9,850.84万美元,其中多单爆仓4,121.51万美元,空单爆仓5,729.32万美元。具体来看,比特币多单爆仓566.1万美元,空单爆仓969.73万美元;以太坊多单爆仓397.68万美元,空单爆仓889.4万美元。此外,最近24小时全球共有82,863人被爆仓,最大单笔爆仓单发生在Binance平台的AVAXUSDT交易对,价值449.26万美元。

    6 小时前