沐曦在南京发布首款全国产通用GPU曦云C600
2025年10月20日 10:20 发布者:eechina
近日,沐曦集成电路(南京)有限公司在南京公开发布首款全国产通用GPU——曦云C600,标志着国产高性能GPU实现了历史性突破。这款芯片的发布在中国高性能计算领域具有里程碑意义,意味着中国在算力基础设施自主可控道路上迈出了关键一步。作为决定算力水平的关键组件,GPU芯片的性能不仅左右着AI模型训练和推理的能力,更是未来数字经济的基石。沐曦股份高级副总裁孙国梁表示:“在算力成为数字经济‘硬通货’的背景下,通用GPU芯片,将是国与国之间的终极博弈。”
突破芯片全流程国产化
曦云C600最引人瞩目的特点是其实现了全流程国产化。从IP设计、晶圆制造到封装测试,所有环节均在国内完成,构建了完整的国产供应链闭环。
全流程国产是曦云C600最显著的标签,而其中最大的挑战来自所有核心IP的自研。沐曦股份凭借在GPU芯片领域的沉淀和对应用场景的理解,自主设计了数十个核心IP。
制造和封测端全部由国内企业完成,应用端搭建起“1+6+X”的战略版图——以自研GPU为底座,深度赋能金融、医疗、能源、教科研、交通、大文娱六大行业,并推动X个新兴场景落地。
孙国梁介绍,这款完全本土化的芯片,集成了大容量存储与多种精度混合算力,并支持MetaXLink超节点扩展技术,在硬件性能和软件兼容上完全满足下一代生成式AI的训练和推理需求。
技术性能与国际旗舰产品对标
曦云C600基于沐曦自主知识产权核心GPU IP,配备了大容量、先进的高带宽显存,性能对标国际旗舰产品。
软件栈MXMACA全面兼容主流生态,可构建万卡级以上计算集群。这一技术特性使得曦云C600能够满足大规模AI计算的需求。
目前,沐曦股份与中国科学院合作的国产千卡集群,已完成多个大模型全参数训练,证实国产算力已具备大模型预训练能力。
显存带宽达1600-1800GB/s,支持FP8计算精度与训推一体架构,适用于AI训练、推理及科学计算场景。
软件生态兼容降低用户迁移门槛
为解决芯片应用中的生态难题,沐曦在软件兼容性方面取得了重要突破。软件栈MXMACA全面兼容CUDA生态,这意味着现有AI系统可快速适配曦云C600。
为降低用户迁移成本,沐曦推出MetaXLink高速互联协议。这一创新使得用户无需重构代码即可实现性能提升,大大降低了从国外平台迁移到国产平台的技术门槛。
目前,该芯片已与高校、企业合作开展算力普及计划,推动人工智能、大数据等领域的自主创新。
曦云C600研发项目于2024年2月立项,已于2025年7月完成回片并成功点亮,正在进行功能测试,预计于2025年底进入风险量产。
曦云C600的发布不仅是技术突破,更是中国半导体产业自主创新的缩影。从核心技术受制于人到实现全流程国产化,这款芯片的诞生为金融、医疗、能源等关键领域提供了自主可控的算力解决方案。