中科曙光发布新一代通用高性能计算平台,国内首发AVX-512指令集兼容

2026年06月16日 10:02    发布者:eechina
6月15日,中科曙光正式推出新一代通用高性能计算平台。该平台以国产百核级通用CPU为核心,整体规格首次达到国际厂商旗舰级水平。作为本次发布的最大亮点,该平台是国内首款原生兼容AVX-512指令集的国产通用计算平台,并完整原生适配x86软件生态,为国产算力底座的平滑升级提供了关键支撑。

在核心硬件性能方面,新一代平台搭载了首个国产10T级通用CPU,拥有128核心、512线程,单CPU的FP64双精度算力达到10T。官方测试数据显示,该平台的HPL双精度浮点相对性能较上一代提升近2倍,STREAM访存性能提升近1倍,综合应用性能平均提升约80%至100%,各项指标均与国际主流高端平台处于同等水平。这一性能突破得益于中科曙光“算—存—传”三级协同的系统级优化设计:计算层引入BurstBuffer缓存加速与SocketDirect通信优化技术;存储层搭载ParaStor F9000实现端到端无阻塞I/O;网络层则基于自研scaleFabric高速交换机,将端到端时延降至0.93微秒,单子网支持高达11.4万卡的组网规模,从根本上破解了大规模并行场景下的“通信墙”难题。

除了硬件性能的飞跃,软件生态的无缝对接是该平台的另一核心突破。高性能计算行业最核心的壁垒在于数十年积累形成的软件体系与工程流程。该平台原生兼容x86生态,且作为国内首个支持AVX-512指令集的国产通用计算平台,能够完美契合GROMACS、NAMD等全球核心科学计算套件的底层加速路径。这意味着现有的HPC软件无需重新编译或修改源码即可直接运行,并自动调用AVX-512优化路径。用户的软件授权、业务流程和工程经验得以全部保留,真正实现了“零迁移成本”,大幅降低了科研机构与工业企业更换国产算力底座的风险与改造时间。

在部署形态上,为满足大型科研机构与区域算力中心对高密度、低能耗及长期稳定运行的需求,该平台提供了风冷、冷板液冷和浸没液冷三种散热形态的计算节点。其中,2U风冷标准机架式服务器单节点可提供20TFLOPS算力;冷板式高密计算柜单柜实现P级计算能力,PUE低至1.08;而采用第三代浸没相变液冷技术的超高密计算柜,最高支持超8万个CPU核心部署,PUE进一步降至1.04。这种全形态的覆盖标志着国产高性能计算平台已形成完整的工程化交付能力。目前,该平台已在地球科学、工业制造、生命科学及物理化学材料等领域展开应用,公里级天气模拟性能较上一代提升1.95倍,工业仿真实测性能提升1.86倍。中科曙光高级副总裁李斌表示,未来将牵头建立自主、开放、高效的全精度算力体系,推动数据、算力、模型与应用的全链路深度协同。