华为三招弯道超车******
单卡差?光信号建“超节点”
英伟达
使用独家NVLink互联技术,芯片之间用铜缆连接。
华为
直接在芯片内建立起“超级高速路”,用光缆连接芯片,靠“光信号”传输数据,取其速度快、带宽大、延迟低,传得远,联接更多芯片,组成384超节点。
HBM内存不够快?堆更多卡做更高带宽
英伟达
其旗舰级AI芯片成本高昂,其中一部分成本并非来自计算芯片本身,而是来自与之配套昂贵高带宽内存(HBM)。
华为
昇腾CLoudMatrix 384超节点创新提出“全对等架构”,将CPU、NPU、DPU、存储和内存等资源全部互联和池化,去除掉繁多中转环节,实现真正点对点互联及更大算力密度和互联带宽。
没有CUDA?自行研发CANN
英伟达
其关键护城河除GPU,还有并行计算平台和编程模型CUDA,在单点竞争上对手难以撼动英伟达地位。
华为
自研CANN作为昇腾AI全栈核心,适配多框架与多异构芯片,为多样化AI应用场景提供高效易用程式设计方式。
特稿/算力国产化 华为昇腾震撼黄仁勳******
算力是人工智能基石。日前闭幕的2025年世界人工智能大会,成为展示算力国产化的窗口,其中,华为首展“昇腾384超节点”真机,它由12个计算柜与4个总线柜构成,搭载384个昇腾910C的NPU和192个鲲鹏CPU,业界规模最大。英伟达CEO黄仁勳此前公开表示,从技术参数看,“昇腾384超节点”性能上甚至超越英伟达的产品,更具优势。
今年4月,美国对华断供H20芯片之际,华为云率先在安徽芜湖商用“昇腾384超节点”,其后在贵安和乌兰察布等地商用。近日,华为宣布成功在昇腾平台上实现了准万亿“混合专家模型”的全流程训练,验证国产AI基建的自主创新能力。
事实上,单颗昇腾芯片性能只有英伟达Blackwell的三分之一,华为竞争优势在于系统整合,用任正非的话来说:“我们用数学补物理、非摩尔补摩尔,利用集群计算的原理,可以达到满足我们现在的需求。”
通过计算、存储、网络和架构的协同创新,华为“昇腾384超节点”在算力规模、训推效率和可靠性等关键维度上,全面超越了英伟达最强的GB200 NVL72系统。海外专业机构SemiAnalysis评估,“昇腾384超节点”的整体算力,是英伟达GB200 NVL72系统的1.6倍。
“智算昇腾超节点”湾区商用
国家“东数西算”,昇腾大显身手。今年4月26日,全球首个商用智算昇腾超节点在中国电信粤港澳大湾区(韶关)算力集群正式发布,标志着新一代智能算力注入粤港澳大湾区国家级算力枢纽节点。智算昇腾超节点通过云网融合所带来的运力优势,可以提供超低时延、超高安全、超快传输的运力保障,通过全光400G运力网络,打造华南地区10毫秒、广东地区5毫秒、大湾区3毫秒的超低时延运力底座,实现智能算力的高速互联。
据了解,作为粤港澳大湾区首个大规模全液冷智能算力数据中心,中国电信全面应用绿色低碳技术,100%使用绿电,采用数字孪生、AI等先进技术,打造全程数字化智慧运营管理能力,构建智慧的人工智能数据中心。\综合报道