让小家电加速“东南飞” 宁波家电企业困境突围有妙招
2025-04-21 21:54:00
【文/观察者网专栏作者 心智观察所】
当地时间4月15日,英伟达发布通知称,美国政府于9日告知,该公司H20芯片出口到中国需要许可证。
不断强化和收紧AI芯片的出口管制口径,是过去几年美国商务部的惯常做法,但此次事件标杆性意义是美国首次对中国大陆特供版AI芯片下重手。
进而更多讯息传出。英特尔已通知中国客户,自2025年4月起,凡是芯片具备以下性能之一者,均需获得美国政府许可方可出口:总DRAM带宽达每秒1400GB或以上,输入输出(I/O)带宽达每秒1100GB或以上,或两者之和达每秒1700GB或以上,因此英特尔的Gaudi系列芯片因性能远超上述标准,已明确受限。
同样受限的还有AMD的MI308。由于英特尔Gaudi系列市场竞争力以及在华份额极为有限,中国大陆AI芯片市场受影响的主要来自英伟达的H20和AMD的MI308,尤其是H20的断供。
此时此刻,应中国贸促会邀请,英伟达公司首席执行官黄仁勋抵达北京。我们无法妄自揣测他此次北京之行是否带着大洋彼岸的“口信”,但肯定带着心中的枷锁,以及一些期盼和希望。
“交易的艺术”:特朗普是否敲诈了黄仁勋?
从去年夏天开始,美国对华鹰派国会议员就不断向美国商务部施压,要求将H20也列入管制清单,以license许可证的方式将其纳入对中国大陆“卡脖子”范围。
去年年底到今年年初,DeepSeek横空出世震惊了全球,用了H800、A800和H20等的混合本地部署就可以做到低成本的优质AI推理,让美方进一步意识到对华高端芯片加强遏制的必要性。
即便如此,H20突然被要求申请许可证才能拿货,还是让中美半导体行家们有些感到意外。
上周英伟达股价飙升近18%,部分原因是有报道称,在首席执行官黄仁勋出席海湖庄园晚宴后,特朗普政府计划取消此类限制。
据说海湖庄园晚宴门票的入门门槛是一百万美元,如果想在宴会上获得特朗普单独约见谈话,估计此价格还要翻几倍。
前不久心智观察所连线美国知名科技调查记者,《黄仁勋:英伟达之芯》的作者斯蒂芬·威特。威特在对话中谈到黄仁勋完全对政治不感兴趣,从不为任何政治人物站台或者募捐,从不发表任何政治观点,而且从未有过做客海湖庄园的经历,还缺席了特朗普的就职典礼。
但四月中旬这次,可以说黄仁勋为了公司的未来和发展破例了,他买了门票去和特朗普面谈。
以事后之见来看,当时英伟达股价的飙升向市场释放出了一个错误的信号。而且在几天前,英伟达官方网站上突然发布,将首次投入重资在美国本土生产AI芯片和超算集群,与台积电联手在亚利桑那州投入超过一百万平方英尺的制造场地,用于制造和测试Blackwell芯片,并且还计划在得克萨斯州生产和测试AI超算群。
这条新闻放出之后,某种程度上向外界强化了这样一种认知,即黄仁勋和特朗普做了一个交易,通过向美国本土两个州的工厂注资的方式换取H20继续在华销售。
但事实看来并非如此。
多位可靠的知情人士透露,最迟至4月10日,已经知晓内情的英伟达并未提前警告至少部分主要客户,让中国大陆的主要的云计算公司仍在预计H20芯片将在年底前交付且并未意识到即将出台的限制措施,而且就连英伟达的中国销售团队也被隔离在信息墙之外,在公告发布前似乎也未得到通知。
佩洛西家族通过投资英伟达股票,获利颇丰
根据以往英伟达投资者交易记录,美国前议长佩洛西的老公前两年曾经频繁买入和在“合适时间点”抛售大量英伟达股票,当时在野的特朗普在社交媒体上抨击其为“内幕交易者”(insider trading”)。我们可以合理怀疑,处在第二次任期内的特朗普也许从佩洛西老公那里得到了什么灵感。
这一次,特朗普通过“交易的艺术”所获得的,可不仅仅从黄仁勋身上盘剥来的那百万级的门票收入,还所图甚广。
H20为何让美国商务部如此忌惮?
英伟达众多阉割版AI加速器中,H20只是其中一种,为何让美国商务部如此忌惮,从去年夏天开始就频频密谋对华禁售?
用一句话总结概括,从推理的角度看,H20的性能绝对超过了另一版的阉割AI芯片H800,甚至在理论峰值情况下可以超过未阉割版的H100。
AI大模型的训练过程更依赖于算力,因为反向传播中的梯度计算和参数更新是计算密集型任务,虽然说训练过程也需要一定的通信带宽来同步梯度,但推理过程更依赖于通信带宽,特别是在模型并行的情况下需要在GPU之间频繁传递数据。
从公布的参数来看,H20主要被阉割的是算力,H20的FP16、INT8等主要算力参数仅为A100的不足1/2,更是仅为H100的约1/7;但是H20有着惊人的带宽(HBM容量96GB),而且H20通过NVlink架构,通过多卡使用、多卡堆叠模式,推理性能甚至可以超越非阉割版的H100,仅略逊于H200,其显存带宽在Decode阶段H20每生成1个Token所需时间,通过测试低于A100、H100,这也使得H20在整个推理过程具有较高的推理速度。
我们不得不承认,华为910B虽然在训练的单卡能力上可以超越H20,但在显存带宽方面远逊于H20,训/推的综合性价比仍不如H20,这就是为何H20成为中国一众云计算供应商的香饽饽,一度成为抢手货。
这里还有一个问题需要回答。英伟达为了遵守美国的出口管制条例,保证企业合规,阉割了算力,为何不把带宽一起阉割掉,以彻底打消美国政客们的顾虑,何必搞出一个H20、L20、L2一系列的阉割版?这里黄仁勋显然还是动了小心思的。
他的想法是,即便是对华特供版的旗舰产品,上市之后也一定要超越中国本土AI芯片竞品,只有这样才能保证市占率,既合规,也让中国客户产生依赖,消除潜在的竞争对手。斯蒂芬·威特在和心智观察所对话中也谈到:“出口管制结果,会让英伟达的产品被强行挤出中国市场,客观上刺激中国本土发展AI芯片的决心,为潜在的竞争对手腾出了空间。”
如今,H20和AMD的MI308一同需要出口许可证才能进入中国市场,黄仁勋的如意算盘暂时落空了。
国产替代加速,英伟达损失的何止是55亿?
H20需要许可证一事尘埃落地之后,英伟达股价周三收盘下跌近7%,市值蒸发超过1480亿美元。AMD股价下跌5.8%,并警告称最新限制措施将对其造成8亿美元的损失。
在截至1月26日的上一财年,中国市场为英伟达创造了170亿美元的收入,占其总销售额的13%。英伟达内部计算过,由于许可要求,将在截至4月27日的第一季度计提高达55亿美元的费用,换言之,因库存、采购承诺产生的损失为55亿美元。
英伟达全球区域销售占比
中国大陆的销售额占比,已经由前年的超过20%降低到了去年的13%,但这170亿美元仍不是个小数目。留下的市场空白,将由中国本土厂商在2025年加速追赶填补之。
近期,华为昇腾910C AI加速器的量产消息,无疑如同在平静水面投下巨石,激起层层涟漪。910C效仿了英伟达最新一代GB200的Chiplet模式,用了910B的多die拼接封装的方式,强化了算力性能。海外分析师Lennart Heim对910C进行了抽丝剥茧一般的专业拆解,评估下来910C算力性能大概能达到H100的80%。
知名半导体分析机构semianalysis也做了一份详细的拆解,参数显示昇腾910C的Scale Out带宽已经可以匹敌英伟达最先进的GB200。
昇腾910C的Scale Out带宽已经可以匹敌英伟达最先进的GB200(@semianalysis)
不过,算力集群的规模效应往往比单卡性能的“极致参数”更为重要。在软件生态上,昇腾软件团队人员目前已达到大几千人,大客户910B能力已调优至接近A100水平,预计910C生态能力将进一步完善;架构方面910C同样将推出传统8卡服务器和Rack两种架构,成为追赶英伟达架构最快的厂商。
尤其值得一提的是,华为云发布了CloudMatrix 384超节点技术。通过超节点架构的集群优化如无收敛组网、高速总线互联,实现了多卡协同下的整体性能提升,基于CloudMatrix 384部署的DeepSeek-R1模型,单卡推理性能可达1920 tokens/s,基本接近H100水平。
结语 特朗普仍然留了一个口子
美国官方相关的公开信息显示,“licensing requirement would be indefinite”(许可要求将是无限期的)。不少很多业界人士对indefinite一词的理解有偏差。其实“许可要求将是无限期的”言外之意是说,中国客户随时可以申请licensing许可证,并未设定一个期限。
换言之,这个逻辑就跟特朗普等待中方电话一样,希望中方主动来申请这个license,继续来做一些交易。
特朗普政府时期对华AI芯片出口管制的反复摇摆,深刻折射出美国在科技霸权护持与商业利益博弈间的战略困境。
这种进退失据的政策波动,恰恰凸显了我国坚持科技自立战略定力的前瞻性——通过构建自主可控的芯片产业体系、深化新型举国体制创新优势、推进自主算力基础设施建设,中国正以系统性的制度创新突破"卡脖子"困局,将外部技术封锁压力转化为内生创新动能,在人工智能革命的战略赛道上夯实可持续发展根基。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。