阿里云宣布“飞天智算平台”发布,可将AI训练效率提升11倍

2022年09月01日 10:12    发布者:eechina
来源:新浪科技

8月30日下午消息,阿里云宣布推出全栈智能计算方案“飞天智算平台”,并启动两座超大规模智算中心,以公共云和专有云两种模式,面向科研、公共服务和企业机构提供智能计算服务。据介绍,“飞天智算平台”可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

据了解,“飞天智算平台”提供了基于阿里云磐久基础设施的融合算力和大数据AI一体化平台的整体解决方案能力,可运行在X86、GPU、ARM等多种芯片类型服务器上,实现“一云多芯”,并以最高10倍IO优化和5倍通信性能优化,实现90%的千卡并行计算效率。

目前,该平台正在支撑建设两座超大规模智算中心。其中,张北智算中心建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心,乌兰察布智算中心建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力。

据介绍,在AI开发层,阿里云提供大数据+AI一体化平台支撑开发与运维全流程。尤其在模型训练环节,“飞天智算平台”可以对分布式策略进行自动组合和调优,将训练效率提升了11倍以上。此外,阿里云为用户提供了一站式的通用推理优化工具,对算法模型进行量化、剪枝、稀疏化、蒸馏等操作,可将推理效率提升6倍以上。

据悉,飞天智算平台已在阿里内部广泛应用,将拍立淘训练速度提升了200倍,支撑阿里AI日均1万亿次调用,服务全球10亿人,同时也服务于小鹏汽车、深势科技、上汽集团、南方电网等机构和企业。