欲与英伟达决高下？英特尔推云端AI芯片拟联手国内厂商开发AI服务器

转载

1081 天前

3888

AI之势

文章转载来源：AI之势

原文来源：科创板日报

图片来源：由无界 AI ‌生成

7月11日，英特尔在中国市场推出云端AI训练芯片——Habana® Gaudi®2。该芯片可满足大规模语言模、多模态模型及生成式AI模型的需求。据现场介绍，该芯片性能在一些关键指标上胜过英伟达A100。

据了解，该Gaudi2处理器及Gaudi2夹层卡HL-225B，以第一代Gaudi高性能架构为基础，具有24个可编程Tensor处理器核心（TPCs）。

每颗芯片集成了21个专用于内部互联的100Gbps（RoCEv2 RDMA）以太网接口，配备配置96GB HBM高速内存及2.4TB/秒的总内存带宽，满足大规模语言模型、多模态模型及生成式AI模型的需求。

据现场介绍，英特尔Gaudi2运行ResNet-50的每瓦性能约是英伟达A100的2倍，运行1760亿参数BLOOMZ模型的每瓦性能约达A100的1.6倍。

在发布会上，浪潮信息高级副总裁、AI和HPC总经理刘军现场发布搭载Gaudi2的新一代AI服务器NF5698G7。

目前，英特尔已与浪潮信息合作，打造基于Gaudi2深度学习加速器的AI服务器NF5698G7。该服务器集成了8颗Gaudi2加速卡HL-225B，还包含双路第四代英特尔至强可扩展处理器，支持AMX/DSA等AI加速引擎。当日，该款AI服务器也正式发布。

浪潮信息高级产品经理王磊强调，NF5698G7是专为面向生成式AI市场开发的新一代AI服务器，支持8颗OAM高速互联的Gaudi2加速器，将为AI客户提供大模型训练和推理能力。

新华三集团计算存储产品线副总裁刘宏程表示，基于英特尔Gaudi2 AI加速器，新华三正与英特尔合作，开发适合大模型训练和推理的高性能AI服务器。

同时，超聚变数字技术有限公司算力基础设施领域总裁唐启明指出，超聚变将与英特尔，共同推出基于Gaudi2的全新产品与解决方案。

此前，英特尔中国区董事长王锐在接受《科创板日报》记者采访时指出，ChatGPT浪潮带来计算需求的大幅度提升，目前正与包括百度、阿里等在内的中国的客户开展共同研究。王锐透露，不管是高性能的计算还是分布式的计算，都已经进行了布局。

一位英特尔技术专家《科创板日报》记者分享了英特尔在大模型领域的布局情况。在训练层面，针对CPU、GPU、IPU、Habana等异构计算，英特尔用oneAPI以及XPU平台来提供更多的选择。在推理方面，第四代Sapphire Rapids发布后，基于AMX加速器，可在行业中解决80%以上的客户推理需求。同时，也充分利用CPU，包括用于训练的Ponte Vecchio，和用于推理的Arctic Sound等。

伴随着大模型的热潮，云计算的商业模式正朝着MaaS（模型即服务）的方向演进，其所带来的算力需求也值得关注。

“它的理念是利用预训练模型，对行业数据进行训练，从而形成针对特定场景的、面向各行业的细分模型。我们知道通用模型的参数量非常大，例如GPT-3可达到1750亿，部署这些模型会比较麻烦，因此，可能需要对大模型进行蒸馏和压缩，形成行业可部署的模型。”上述技术专家称。

此外，把大模型进行私有化部署是不少行业的潜在需求。“很多细分行业不接受SaaS服务，尤其金融等行业。因此，英特尔正在探讨如何把这个模型小型化之后，在本土落地做私有化部署，使其真正在行业落地。”

关键词：

来源：AI之势

发布人：暖色

声明：该文观点仅代表作者本人，不代表火讯财经立场。火讯财经系信息发布平台，仅提供信息存储空间服务。

如文章涉及侵权，请及时致函告之，本站将第⼀时间删除⽂章。邮箱：840034348@qq.com

上一篇：人工智能，真的不在乎人类的阻拦

下一篇：杨斌丨既已“如神”，何以“善任”？——重温斯图尔特·布兰德的警示

欲与英伟达决高下？英特尔推云端AI芯片拟联手国内厂商开发AI服务器

18256篇

125113840

新闻排行

李国飞：繁荣越令人沉醉，危机往往埋得越深|《1929》推荐序

RWA研究院携手Conflux，共探2026香港Web3嘉年华新范式

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

数字人民币2.0全景：从16.7万亿交易额之后的制度化跃迁

催生万亿新资产：AI代理如何拥有、赚取和交易

250亿美元RWA市场背后的政策红线：42号文的“境内严禁”到底划在哪？

GPT-5.4与百万token时代：上市公司的AI转型窗口还剩多久

美国资本重注拉美：赌的不是增长，是金融体系的"关键节点"

友情链接：