文章转载来源:硅星人
原文来源:硅星人
图片来源:由无界 AI生成
美国芯片老大英伟达最近越来越“高处不胜寒”了。
不久前的SC23超算大会上,AI芯片独角兽公司Cerebras 首席执行官Andrew Feldman公开批评英伟达为规避美国对华半导体出口限制采取的一系列举措,认为这样做无异于AI军火商,“不符合美国精神”。
Andrew Feldman本身来头不小,早在2012年,他创立的低功耗服务器先驱公司SeeMicro就被AMD收购,他本人负责监管 AMD服务器芯片业务。2021年他领导Cerebras造出全球最大AI芯片WSE-2,打破在单个设备上训练拥有200亿参数的最大AI模型纪录,还推出了世界上第一个人脑规模AI解决方案CS-2 AI计算机。
这也不是 Andrew第一次抨击英伟达,10月英伟达意外发布24-26年GPU新品路线图,Andrew就曾称之为“掠夺性预告”,并说这是利用欺骗性做法和行业主导地位阻碍竞争。这次,Andrew更是毫不客气地指责英伟达“单方面地武装了中国”,“这符合法律规定,但并不意味着不需承担道德责任。”
Andrew Feldman(右一)与团队见证WSE-2芯片入选加州山景城计算机博物馆展出。图片来自Cerebras
去年和今年10月,美国政府两次以维护国家安全为由,加强人工智能芯片和半导体制造设备对中国等几十个国家地区的出口管制。致使包括英伟达、AMD、英特尔在内的许多厂商业务严重受挫。
英伟达本月发布第三季度财报后,虽然营收数据继续飙升,但反映投资者信心的股价却一路疲软下跌,也明显投射出外界对英伟达未来在华市场前景的隐忧。
对于这些禁令,Andrew表示理解,“这是一项强大的新技术,我们并不完全确定它将走向何方。让‘友敌’在游戏初期就获得我们最好的技术是不明智的。这一切都合理,我也支持。”
尽管可能会对Cerebras与中东的业务往来造成影响,他仍然认为当规则制订时,应该遵循精神而不仅仅是字面意义,“政府说我们不希望你向中国出货,你就跑到它的边缘,然后试图通过漏洞来规避意图,这让你看起来很不美国。”
而对于英伟达来说,虽然在管制边缘的“蛇皮走位”是大实话,但面对占收入总额高达47%的中国市场,换了谁这种调整也都不得不做。
去年10月,美国政府突然宣布对华半导体出口管制新规,规定高性能计算芯片出口必须低于4800 TOPS算力上限和600 GB/s的带宽上限,直接导致NVIDIA A100/H100系列和AMD MI200/300系列AI芯片无法对华出售。
当时国内许多高端场景和主流厂商都采用NVIDIA A100,也预定了大批计划下半年发货的H100,新规的出台让人措手不及。
为了填补市场缺口,解决中国客户需求,英伟达一个月后就宣布推出符合美国出口规则的“中国特供版”A800和H800。前者将NVLink传输速率由A100的600GB/s降至400GB/s,其它参数基本保持不变,后者则把芯片间数据传输速度改为 H100 的一半。据称,阿里巴巴、百度、腾讯这传统BAT三巨头和互联网大厂字节跳动都已用上了800系列产品。
然而今年10月17日,禁令再次升级。美国商务部修订芯片出口新规,引入“性能密度”参数并调整先进芯片划定标准,禁止向中国出售每秒能进行3亿次及以上运算的数据中心GPU;要求企业申请许可后才能向40多个国家和地区出售芯片,同时将需要申请半导体制造设备许可证的国家数量扩大到21个;并把包括壁仞科技、摩尔线程在内的13家中国公司列入出口管制名单。这并不是结束,美国商务部长雷蒙多表示,随着技术的进步,这些规则至少每年都会更新一次。
美国此举是为了防止英伟达等全球领先芯片公司寻求变通方案,也切断中国企业从其他国家和地区获取高性能芯片的渠道。试图在半导体市场对中国进行全面狙击,阻止中国人工智能、精密计算等先进技术发展。
这次英伟达的产品更是倒下了一大片,包括但不限于:A100、A800、H100、H800、L40、L40S以及RTX 4090。为中国市场量身定做的A800/H800落在了管制范围内,更不用说11月推出的 “算力怪兽”,最新旗舰芯片 H200。
而“上有政策,下有对策”也被英伟达发挥得淋漓尽致。面对新的管制条例,黄教主表示,一定遵守,但还是希望“继续与中国客户合作”。
除了积极沟通美国商务部申请许可,本周三英伟达CEO黄仁勋向外界证实,公司又为中国市场开发(“阉割”)出几枚符合最新规定的特供芯片。
根据早些时候外媒报道,这三枚芯片分别是H20、L20和L2。半导体研究公司SemiAnalysis也将它们的各项性能参数列了出来:
图片来自SemiAnalysis
从图表中可以看出,用于AI模型训练的H20在H100/H800基础上再次降规,与H100 芯片的最大算力值1979 TFLOPs相比,H20这一数值仅有296 TFLOPs。总处理性能为2368,性能密度 2.9,小于 3.2 的管制许可值。
但值得玩味的是,H20有比H100 更高的缓存和带宽,在实际多卡互联环境中组合性能接近 H100 的 50%。虽然从传统计算角度来看比H100降级不少,但在执行大模型推理运算任务上,它比 H100 还要快 20%,这表明虽然H20不能满足千亿级别参数的LLM训练需求,但在稍小的垂直模型推理方面,或许有事半功倍的效果。
而L20和 L2 分别替代此前遭到管制的 L40 和 L4,采用PCle外形规格,配置更精简,在LLM推理训练中不常用,更适合工作站和服务器。其中L20的总处理性能为1912,性能密度 3.1,小于许可值3.2;L2的性能密度为 5.2,但总处理性能仅为1544,也小于 1600 的管制许可值。三枚芯片都巧妙地越过了新规管制中精心设计的封锁条件。
英伟达的迅速反应再次体现出它对中国市场的重视和对重新提振投资者信心的迫切。在这场与规则的博弈中,也一直是“逢山开路、遇水架桥”,丝毫没有示弱的势头。
对于同行的指责,黄仁勋似乎也并不为之所动。他这周出席《纽约时报》年度DealBook峰会时重申,英伟达对于中国市场的承诺将保持坚定。
“我们必须开发出符合出口管制规定的新芯片,一旦满足要求,我们就会回到中国销售。”他表示认同国家安全和竞争力的重要性,但作为“一家为了做生意而建立的公司”,英伟达“尽可能与所有人做生意”。
黄仁勋也对这些出口禁令可能带来的意外后果发出了警告。他说,目前有多达50家中国公司正在开发能与英伟达竞争的技术。如果美国企业在市场上失去份额,其竞争力也可能随之降低。尽管英伟达不会向中国提供其制造芯片的“最关键和最前沿技术”,中国仍然可能找到获取这些技术的途径,或者激励国内芯片制造商发展,他还特别提了一嘴受制裁的华为。
这些警告不无道理,或者说正在变为现实。
被美国列入实体管制清单的科大讯飞就在今年的三季度业绩说明会上宣布,用于讯飞星火大模型训练的华为昇腾910B芯片在性能上已经基本可对标英伟达A100。百度也已向华为订购1600颗昇腾910B用于开发文心大模型。
尽管这笔订单与中国高科技公司们向英伟达订购的成千上万颗芯片相比显得微不足道,但它仍然意义重大,显示出中国公司有能力减少对美国尖端技术巨头的依赖。
美国加码对华芯片封锁,虽然一段时间内给中国半导体行业带来不小冲击,但中国市场面临的算力缺口同时也会为本土芯片发展带来新的机遇。2023年上半年,中国加速芯片的市场规模超过50万张,除华为外,阿里、百度、腾讯都已经有AI自研芯片,中国芯片市场也正在“自产自销”的路径上发展。
虽然黄仁勋认为“英伟达已在行业上领先十年”,但他同时也表示,“如果我们被剥夺了中国市场,我们是没有应急措施的,世界上没有另一个中国。”
在DealBook峰会上,黄仁勋也指出,美国若想完全打破对中国制造的依赖,实现完全独立的芯片供应链体系,需要比想象中更长的时间:“在10年到20年以内,这并不是一件实际的事情。”
他说,公司的成功依赖于“来自世界不同地区的众多组件,不仅仅是台湾”,虽然最重要的技术来自台积电生产线。
而英伟达在中国大陆的合作商则为其提供包括上游半导体材料和设备、服务器整机、光模块、光纤光缆等多个环节的供应链支持。
如今的芯片制造业高度全球化,重建这些供应链需要在基建、制造技术和工艺上重大升级,在没有中国参与的情况下,是一个几乎不可能完成的任务。
根据最新消息, H20将推迟至明年一季度发布,最快可能于2月或3月接受预定,具体细节仍处于保密状态。
英伟达再次越过管制门槛的中国特供芯片们真实性能参数几何,上市后产能和业绩表现怎样,能不能弥补A800/H800禁售带来的中国市场收入缺口,来年美国半导体管制政策是会松动还是继续紧缩,这些都是未知数。唯一可以肯定的是,放弃与中国市场做朋友,绝对不在英伟达的选项上。
来源:硅星人
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com