大模型要占你多少内存？这个神器一键测量，误差低至0.5MB，免费可用

转载

1009 天前

2627

AI梦工厂

文章转载来源：AI梦工厂

原文来源：量子位

图片来源：由无界 AI‌ 生成

大模型训练推理要用多少内存？

打开这个网页一测便知，测量误差小至0.5MB。

比如模型bert-base-case Int8估计占用413.18 MB内存，实际占用为413.68MB，相差0.5MB，误差仅有0.1%。

操作也很简单，输入模型名称，选择数据类型即可。

这就是HuggingFace Space上的最新火起来工具——Model Memory Calculator，模型内存测量器，在网页端人人可体验。

要知道，跑大模型最头疼的问题莫过于：GPU内存够吗？

现在能先预估一波、误差很小，让不少人大呼“Great”！

实际推理内存建议多加20%

使用第一步，需要输入模型的名称。

目前支持搜索在HuggingFace Transformers库和TIMM库中的模型。

比如想要看GLM-6B的情况，可以输入“THUDM/chatglm-6b”。

不过有一些模型会存在限制，需要获取API token后才能开始计算，比如Llama-2-7b。

我们找了几个大模型实测，可以看到当模型规模达到百亿参数后，内存要求被直线拉高。

基础版的BERT还是对GPU相当友好滴

。

而在实际推理过程，EleutherAI发现需要在预测数据基础上，预留20%的内存。具体举例如下：

作者小哥热衷开源项目

最后来介绍一下带来这个项目的小哥Zach Mueller。

他本科毕业于西佛罗里达大学，主修软件设计与开发，热衷开源，在GitHub有1k粉丝。之前做过很多和Fast.ai框架有关的开源项目。

传送门：
https://huggingface.co/spaces/hf-accelerate/model-memory-usage

关键词：

来源：AI梦工厂

发布人：暖色

声明：该文观点仅代表作者本人，不代表火讯财经立场。火讯财经系信息发布平台，仅提供信息存储空间服务。

如文章涉及侵权，请及时致函告之，本站将第⼀时间删除⽂章。邮箱：840034348@qq.com

上一篇：1句指令+5美元+20分钟，就能训练出小型专业模型，Prompt2Model了解一下

下一篇：RWA研究院携手Conflux，共探2026香港Web3嘉年华新范式

大模型要占你多少内存？这个神器一键测量，误差低至0.5MB，免费可用

实际推理内存建议多加20%

作者小哥热衷开源项目

18256篇

124464478

新闻排行

RWA研究院携手Conflux，共探2026香港Web3嘉年华新范式

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

数字人民币2.0全景：从16.7万亿交易额之后的制度化跃迁

催生万亿新资产：AI代理如何拥有、赚取和交易

250亿美元RWA市场背后的政策红线：42号文的“境内严禁”到底划在哪？

GPT-5.4与百万token时代：上市公司的AI转型窗口还剩多久

美国资本重注拉美：赌的不是增长，是金融体系的"关键节点"

对话美财长ScottBessent，解构2026宏观迷雾下的“世界想象力”

友情链接：