1022 天前

07月13日,星期四 12:45

GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型

火讯财经讯,据IT之家7月13日报道,外媒Semianalysis近日对OpenAI今年3月发布的GPT-4大模型进行了揭秘,其中包括GPT-4模型架构、训练和推理的基础设施、参数量、训练数据集、token数、成本、混合专家模型(MixtureofExperts)等具体的参数和信息。外媒表示,GPT-4在120层中总共包含了1.8万亿参数,而GPT-3只有约1750亿个参数。而为了保持合理的成本,OpenAI采用混合专家模型来进行构建。据悉,GPT-4使用了16个混合专家模型(mixtureofexperts),每个有1110亿个参数,每次前向传递路由经过两个专家模型。此外,它有550亿个共享注意力参数,使用了包含13万亿tokens的数据集训练,tokens不是唯一的,根据迭代次数计算为更多的tokens。GPT-4预训练阶段的上下文长度为8k,32k版本是对8k微调的结果,训练成本相当高,外媒表示,8xH100也无法以每秒33.33个Token的速度提供所需的密集参数模型,因此训练该模型需要导致极高的推理成本,以H100物理机每小时1美元计算,那么一次的训练成本就高达6300万美元(约4.51亿元人民币)。对此,OpenAI选择使用云端的A100GPU训练模型,将最终训练成本降至2150万美元(约1.54亿元人民币)左右,用稍微更长的时间,降低了训练成本。

0
0
  • 数据:过去 24h Binance 净流出 12.33 亿 USDT

    火讯财经讯,据 Coinglass 数据显示,Binance 在过去 24 小时内净流出 12.33 亿 USDT。

    37 分钟前

  • Syndicate Labs 私钥泄露遭攻击,约 1850 万枚 SYND 被转移,承诺全额赔付用户

    火讯财经讯,Syndicate Labs 披露,因私钥泄露导致其跨链桥合约在两条链上被恶意升级,攻击者转移并出售约 1,850 万枚 SYND(约合 33 万美元)及约 5 万美元的用户代币,事件仅影响特定链,其他链未受波及。此次攻击经过多阶段侦察、基础设施映射及精心执行,技术复杂度较高,且排除内部人员参与。根本原因是私钥存储在密码管理工具中且缺乏额外加密层,升级流程未采用多签或硬件签名机制,也未设置合约升级的预警与熔断措施。Syndicate Labs 将对所有受影响用户进行全额赔付,包括返还 1,850 万枚 SYND 并提供额外补偿,同时对受影响的应用链客户进行全额补偿。公司现已启动安全升级,包括加强私钥加密、收紧访问权限,并计划引入硬件或多签签名机制及升级路径监控,以防类似事件再次发生。

    52 分钟前

  • 特朗普家族支持的无人机公司 Powerus 与美国军方签署武器采购协议

    火讯财经讯,美国空军已决定采购由特朗普总统之子支持的企业所生产的拦截无人机,具体数量未公开。正值美伊冲突进入第三个月,这一采购行动进一步强化了美国军方与特朗普家族关联的防务承包商的合作。Powerus 公司联合创始人韦利科维奇表示,在完成亚利桑那州的演示后,该公司将向五角大楼交付这批无人机,这标志着 Powerus 首次获得向美军供应此类装备的合同。公司方面未透露交易细节及规模,但指出军方在测试新型武器系统时通常会采取类似做法。该举措契合美国运用低成本拦截无人机应对伊朗攻击无人机的战略,以替代高价的导弹防御方案。另据报道,美国军方已将乌克兰研发的 1 万架配备 AI 的 Merops 拦截无人机部署至中东地区。

    1 小时前

  • 数据:过去 24 小时全网爆仓 3.73 亿美元,主爆多单

    火讯财经讯,过去 24 小时全网爆仓 3.73 亿美元,其中多单爆仓 2.73 亿美元,空单爆仓 1 亿美元。

    1 小时前

  • 马斯克在 OpenAI 诉讼庭审中称“多数加密货币是骗局”,再度引发市场关注

    火讯财经讯,在马斯克与 OpenAI 的诉讼庭审交叉询问环节中,案件涉及 OpenAI 早期曾考虑通过 ICO 融资的计划。马斯克表示,部分加密货币有价值,但大多数属于骗局,并指出加密资产领域存在大量投机与欺诈行为,引发市场关注。马斯克对加密市场的态度长期波动:2021 年牛市期间,他推动特斯拉购入约 15 亿美元比特币,并多次公开提及 Dogecoin,带动相关资产价格上涨;2022 年特斯拉减持 75% 比特币持仓,并在 2026 年一季度对剩余持仓计提约 2.22 亿美元减值。截至最新财报,特斯拉仍持有约 11,509 枚比特币,账面价值约 7.86 亿美元。

    1 小时前