英伟达为中国市场开发B30A芯片,基于Blackwell架构性能超H20

2025年08月20日 10:12    发布者:eechina
据路透社8月19日消息,英伟达正秘密推进一款专为中国市场设计的新型AI芯片研发项目,暂定代号为B30A。这款基于Blackwell架构的芯片被定位为H20的升级迭代产品,其原始算力虽仅为旗舰级B300双芯片加速卡的一半。

B30A采用单芯片(single-die)设计,将所有核心组件集成于12英寸晶圆,相较H20的Hopper架构实现23%的能效比提升。该芯片配备新一代HBM3e高带宽内存,单卡内存容量达128GB,内存带宽突破4.5TB/s,较H20的4.0TB/s提升12.5%。在核心算力方面,FP8精度下理论算力达340 TFLOPS,超越H20的296 TFLOPS,特别在混合精度训练场景中,B30A通过动态精度调节技术可将有效算力提升至H20的1.3倍。

架构革新破解算力瓶颈

Blackwell架构的引入带来三大核心升级:其一,第四代NVLink互联技术实现单服务器内256张加速卡的全互连,集群通信延迟较H20降低40%;其二,Transformer引擎优化使千亿参数模型训练效率提升35%,在Llama 3 70B模型测试中,B30A完成单轮训练耗时较H20缩短2.1小时;其三,新增的动态功耗管理模块可根据负载实时调节TDP,在保持450W基础功耗下,峰值性能释放时长较H20延长1.8倍。

合规设计应对出口管制

为规避美国4月新规设定的1.4TB/s内存带宽限制,B30A采用分频传输技术,将数据通道拆分为四组独立频段,通过时序复用实现逻辑带宽4.8TB/s的同时,物理带宽控制在1.2TB/s阈值内。该设计已通过美国商务部工业与安全局(BIS)的初步审查,但知情人士强调,最终量产仍需获得"最终用户验证清单"(UVL)豁免。

市场策略凸显竞争焦虑

英伟达计划于2025年9月向阿里云、腾讯等战略客户交付首批工程样品,2026年Q1启动量产。定价策略方面,B30A单卡售价预计在2.8万至3.2万美元区间,较H20上浮15%,但通过算力密度提升使每PFLOPS成本下降22%。与此同时,英伟达正同步推进RTX6000D推理芯片项目,这款采用GDDR6显存的入门级产品,将以1.398TB/s的内存带宽精准卡位管制红线,预计9月向字节跳动等企业提供测试机。

地缘博弈增添变数

尽管特朗普政府近期释放"可能放宽高端芯片出口"信号,但美国国会两党议员已联名提交《AI芯片出口管制强化法案》,要求将"可训练参数量超过1000亿"作为新的管制标准。在此背景下,英伟达中国区负责人黄仁勋在内部会议中强调:"B30A不是妥协产物,而是用技术创新在政策缝隙中开辟新赛道。"据供应链消息,台积电CoWoS-L先进封装产线已预留20%产能应对B30A量产需求,而长江存储的192层3D NAND闪存也进入认证流程,或将成为该芯片存储模块的潜在供应商。

这场围绕AI芯片的技术博弈,正将全球半导体产业推向更复杂的竞合局面。B30A能否如英伟达所愿成为"合规框架下的性能标杆",或将取决于中美监管机构的最终博弈结果。