在今日举办的华为全联接大会2025上,华为轮值董事长徐直军表示超节点成为AI基础设施建设新常态,目前CloudMatrix 384超节点累计部署300+套,服务20+客户。
华为将推出全球最强超节点Atlas 950 SuperPoD,算力规模8192卡,预计于今年四季度上市。此外新一代产品Atlas 960 SuperPoD ,算力规模15488卡,预计2027年四季度上市。
会上,徐直军还发布了全球首个通算超节点TaiShan950 SuperPoD,计划2026年一季度上市。徐直军称,其将成为大型机、小型机终结者。
此外,他还表示,算力过去是,未来也将继续是,人工智能的关键,更是中国人工智能的关键,同时分享了昇腾芯片的后续规划。
除了今年第一季度推出的昇腾910C芯片之外,华为还将于2026年第一季度推出昇腾950PR芯片,四季度推出昇腾950DT,2027年四季度推出昇腾960芯片,2028年四季度推出昇腾970芯片。
根据现场公布的信息,昇腾950PR芯片架构新增支持低精度数据格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带2.5倍,支持华为自研HBM高带宽内存,分为HiBL 1.0和HiZQ 2.0两个版本。
规格方面,HiBL 1.0容量128GB,带宽1.6TB/s;HiZQ 2.0容量144GB,带宽4TB/s。
其中,昇腾950PR芯片采用950核心+HiBL 1.0内存,可提升推理Prefill(预填充)性能,提升推荐业务性能。
昇腾950DT采用HiZQ 2.0内存,可提升推理Decode(解码)性能,提升训练性能,提升内存容量和带宽。
延伸阅读:
在大模型推理中,Prefill阶段负责接收完整输入数据(如文本或图像),并计算缓存。这一过程需要强大的算力支持,通常由高性能芯片完成。 该阶段强调算力而非内存带宽,因此更适合在HBM(高带宽内存)芯片上运行。相比之下,后续的Decode阶段更依赖高速内存传输和互联方案。
HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势,能协助快速处理数据密集型的AI任务。
美国国际战略研究中心(CSIS)AI专家艾伦(Gregory Allen)解释,HBM对于制造先进AI芯片至关重要,价值约占整体芯片的一半。
AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。
当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。
同时,国产半导体又迎来了标志性的一幕,中芯国际总市值突破10000亿。
截至笔者发稿时,中芯国际A股日内成交额超100亿元,公司股价曾一度大涨7.9%,总市值突破1万亿元。
近段时间中芯国际股价大涨,跟一则传闻有关。
从目前曝光的消息看,中芯国际正在测试由上海初创公司宇量昇生产的深紫外线(DUV)光刻机,正测试的光刻机采用浸没式技术,类似于ASML所采用的技术。
过去,中芯国际高度依赖从荷兰半导体设备大厂ASML进口的DUV,但是近年来由于美国的出口管制,只能获得较旧设备。
知情人士透露,中芯国际正在测试一台28纳米的DUV设备,并利用多重曝光来生产7纳米芯片。
据透露,中芯国际试用的这类设备也能被推向极限以生产5纳米处理器,但良率会偏低,无法再进一步制造更先进的产品。
另有消息称,英伟达专为中国市场打造的最新AI芯片RTX 6000D反应平平,一些中国主要科技公司都没有选择下单。
按照外媒的说法,国内监管机构要求阿里巴巴、字节跳动等公司终止对英伟达RTX Pro 6000D芯片的订单。英伟达首席执行官黄仁勋称,对此表示失望。
对于上述说法,外交部发言人林剑回应了。
林剑对此表示,具体问题建议向中方的主管部门了解。我们一贯反对在经贸科技问题上对特定国家采取歧视性做法,中方愿同各方保持对话合作,维护全球产供链稳定。
据供应链说法,RTX6000D主要为AI推理任务而设计,但因其功能有限,其在中国市场遇冷可能更多的还是跟自身有关:
一个是国内自研芯片表现的越来越好,另外一个原因是,RTX6000D样品的测试表明,其性能落后于被禁止对华出口的RTX5090显卡,其价格不到RTX6000D的一半(约50000元人民币)。