国内首个GPU集群大模型成功完成性能超越国际

时间：2024-05-28 来源：作者：起名废

5月27日，摩尔线程技术有限公司与无问芯穹科技有限公司携手对外宣告，他们已成功完成了国内首个基于自主研发全功能GPU千卡集群的庞大模型项目——“MT-infini-3B”实训。这项里程碑式的合作使用了摩尔线程自主研发的MTT S4000系列GPU构成的千卡集群，以及无问芯穹的AIStudio平台作为核心技术支撑。

整个实训过程历时13.2天，期间运行平稳，无任何中断，展现了高度的集群训练稳定性，达到100%。相较于传统的单机训练，千卡集群的扩展效率提升了超过90%，这无疑证实了夸娥系列GPU千卡智算集群在大规模模型训练中的优异性能和可靠性。此次合作开创了国内大语言模型与国产GPU千卡智算集群深度协同的新模式。

据透露，经过这次实训的MT-infini-3B模型在同级别模型中表现出众，尤其在C-Eval、MMLU、CMMLU等权威测试基准上，其性能超越了国际上同类硬件训练的模型，展现了显著的优势。

无问芯穹科技的联合创始人兼首席执行官夏立雪进一步阐述了他们的战略愿景，他们致力于构建一个“M种模型”与“N种芯片”之间的高效连接平台，即“M x N”中间层产品，目标是使各种大型模型算法能够在不同类型的芯片上实现无缝部署。此次与摩尔线程的深度合作，使得“MT-infini-3B”的实训成为业内首例完全基于国产GPU芯片的大规模模型训练实例，标志着中国在人工智能计算领域迈出了重要一步。

更多推荐