华为CloudMatrix 384超节点崛起,黄仁勋:先进工艺已非竞争核心?

   时间:2025-06-17 09:29 来源:ITBEAR作者:杨凌霄

华为创始人任正非近期在深圳接受了《人民日报》的专访,深入探讨了华为在芯片技术领域的现状与策略。面对芯片技术的挑战,任正非坦诚地表示,华为的单芯片技术相较于美国仍有一代的差距。但他紧接着提出了华为的创新策略:“我们通过数学强化物理、非摩尔定律补充摩尔定律、系统补充单点,从而在最终结果上达到实用水平。”

近年来,华为技术团队围绕“数学补物理”、“非摩尔补摩尔”、“系统补单点”三大核心理念,成功研发出“超节点+集群”系统算力解决方案。这一方案的核心是华为的昇腾CloudMatrix 384超节点,作为全球最大的全栈100%国产化自研AI超节点,它打破了英伟达的市场垄断。

在2025年4月的华为云生态大会上,华为常务董事、云计算CEO张平安正式介绍了CloudMatrix 384。这个由384张昇腾算力卡组成的超节点集群,单集群算力高达300PFlops,比英伟达NVL72的180PFlops高出67%,在内存带宽、互联带宽以及断点恢复时间等多项指标上均创下全球商用AI算力集群的新纪录。

尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一,但华为通过超大规模集群设计,实现了系统级的突破。依托6812个400G光模块构建的超高速互联网络,数据在384张卡之间近乎无损流动,训练效率接近单卡性能的90%,远超传统架构60%-70%的水平。

据SemiAnalysis披露,华为云CM384基于384颗昇腾芯片,可提供高达300 PFLOPs的密集BF16算力,性能接近英伟达GB200 NVL72系统的两倍。这一技术突破是在美国持续技术封锁的背景下取得的,硅基流动基于该平台部署的DeepSeek-R1模型,实现了单卡解码吞吐1920Tokens/s,与英伟达H100部署性能相当。

华为CloudMatrix 384的迅猛崛起引起了英伟达高层的警觉。英伟达CEO黄仁勋多次提及华为,并将其视为最大的竞争对手之一。黄仁勋甚至公开承认:“从技术参数来看,华为的CloudMatrix 384超节点性能已经超越了英伟达,我们必须高度重视这家实力雄厚的公司。”这一表态被业界视为美国AI芯片巨头首次公开认可中国竞争对手的技术实力。

华为CloudMatrix 384的野心不仅在于技术上的对标,更在于推动中国科技产业参与全球规则制定的深层战略。华为计划通过超节点架构,引导行业从关注单卡性能转向关注集群效率、总拥有成本和生态协同度。这意味着,未来算力市场的竞争焦点将发生变化,先进工艺将不再是唯一关注点,算力集群的有效利用率、断点恢复速度和生态协同度将成为新的竞争焦点。

华为正利用集群优势吸引AI企业加入昇腾体系,形成硬件、软件和模型的闭环。目前,华为的开发者规模已超过1200万,合作伙伴数量达到4.5万,云商店应用数量达到1.2万。华为正在打造可与CUDA抗衡的替代方案,全球算力市场的格局有望因此发生重构。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群