Aitomatic公司与“AI联盟”发布全球首个半导体专用大语言模型SemiKong

2024年12月30日 10:10    发布者:eechina
近日,由Aitomatic公司及其“AI联盟”合作伙伴共同开发的SemiKong正式发布。这一大型语言模型(LLM)是全球首个专为满足半导体行业需求而精心打造的AI工具。

SemiKong基于Meta的Llama 3.1 LLM平台构建,拥有700亿参数。它的开发过程凝聚了多方力量,Aitomatic公司负责主导开发,而“AI联盟”中的众多合作伙伴也积极参与其中。“AI联盟”于2023年成立,成员涵盖了Meta、AMD、IBM等科技企业,还包括耶鲁大学、东京大学等研究机构。该联盟旨在构建、支持和倡导整个AI技术领域的开放式创新,以此抗衡英伟达在科技行业的主导地位。

SemiKong的核心目标在于融入半导体设计公司的工作流程,充当“数字专家”角色。它在半导体行业有着诸多重要意义。一方面,它能够将新芯片设计的上市时间缩短20 - 30%,这无疑将极大地提高半导体行业的研发效率。另一方面,SemiKong可使首次投产成功率提高20%,同时把新工程师的学习曲线缩短高达50%,这对于半导体行业的人才培养和生产力提升有着积极的推动作用。

从技术角度来看,SemiKong的训练过程主要分为预训练领域知识、自我微调(指令数据集)、合并和量化这三个主要阶段。尽管它有8B和70B两个版本,但最近发布的700亿参数版本已经展现出卓越的性能。它在准确性、相关性和对半导体工艺的理解方面都取得了显著的进步。即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,这为那些想要打造适合自身的专有模型的芯片公司提供了一个极具价值的基座。

此外,SemiKong作为首个半导体专用的开源大模型,于2024年7月9日起在HuggingFace和GitHub上提供下载。它的问世不仅是Aitomatic公司及其“AI联盟”合作伙伴的重要成果,也将为半导体行业的发展格局带来新的变革机遇,有望重塑半导体制造业的未来。