在2025世界人工智能大会期间,摩尔线程创始人兼CEO张建中宣布,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,公司将通过系统级工程创新,构建“AI工厂”,致力于为AGI时代打造生产先进模型的“超级工厂”。这一理念与英伟达提出的“AI工厂”概念有所不同,摩尔线程“AI工厂”核心在于基于全功能GPU通用算力提升先进模型生产效率。
摩尔线程提出“AI工厂”理念的背景与目标
当前生成式AI爆发式增长,大模型训练效率面临瓶颈,全球科技巨头模型迭代速度惊人,模型训练迭代时间已缩短至不足3个月,这种高频迭代不仅体现在大型语言模型,还扩展至多模态模型等前沿领域,对高性能人工智能计算基础设施提出迫切需求。在此背景下,2025世界人工智能大会期间,摩尔线程创始人兼CEO张建中宣布,公司将通过系统级工程创新,构建新一代AI训练基础设施,即“AI工厂”,致力于为AGI时代打造生产先进模型的“超级工厂”。
摩尔线程的发展历程与业务布局
摩尔线程成立于2020年6月,创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理,在GPU行业深耕近二十年。公司以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案。成立以来,推出四代GPU架构,采用先进MUSA技术,拓展出覆盖AI智算、云计算和个人智算等应用领域的计算加速产品矩阵,满足多层次、多样化需求。已完成多轮融资,融资规模超40亿元,投资方众多,最近一轮投前估值246.20亿元。基于自主研发的MUSA架构,成功开发出支持多场景的全功能GPU芯片,推出四代GPU芯片架构及四颗GPU芯片系列,覆盖多个领域,生产方式多样,客户包括多家头部公司。2022年推出被誉为“国产游戏第一卡”的MTT S80,还发布多款数据中心GPU计算卡,拥有千卡智算集群、万卡集群方案。目前已成功自主研发并量产第四代高性能GPU架构“平湖”,构建了全方位自主可控产品体系。
“AI工厂”的概念解读与对比
张建中表示,除语言模型外,模型能力拓展需要大型AI计算基础设施,建立该设施难度大,因此称其为“AI工厂”。摩尔线程提出的“AI工厂”如同芯片晶圆厂制程升级,是系统性、全方位变革,需从底层芯片架构创新、集群整体架构优化到软件算法调优和资源调度系统全面升级。而英伟达最先提出“AI工厂”概念,认为其不仅存储和处理数据,还能大规模生产智能,缩短价值实现时间,让企业在多方面引领行业。英伟达在“AI工厂”设计中提供完整、集成的AI工厂堆栈,各层针对大规模训练等优化。相比之下,摩尔线程“AI工厂”核心在于基于全功能GPU通用算力,以系统化创新和工程化能力提升先进模型生产效率。
摩尔线程打造“AI工厂”的技术竞争力
在张建中看来,打造AI工厂,摩尔线程主要拥有五个技术竞争力:其一,拥有全功能GPU,功能完备精度完整,实现加速计算通用性;其二,自研MUSA架构,提升芯片有效算力;其三,MUSA全栈系统软件,提升单节点计算效率;其四,自研KUAE大规模集群,优化集群效率;其五,零中断容错技术,提升集群的稳定性和可靠性。数据显示,基于第四代“平湖”架构,摩尔线程的AI加速系统全面支持多种混合精度计算,在保证计算精度的同时,提升了Transformer计算性能,节省内存带宽、降低延迟,减少计算资源损耗,提高互联技术带宽,缩短核函数启动时间,提升算子算力利用率和通信库带宽利用率,压缩备份恢复时间,提升GPU有效算力利用率。
“AI工厂”构建的高效体系与意义
张建中表示,依托AI工厂,摩尔线程成功构建起覆盖“训练-推理-部署”全流程高效体系,以“KUAE+MUSA”为智算业务核心,加速赋能千行百业,推动全功能GPU驱动的AI技术在多个关键领域的应用与部署。这意味着国产计算基础设施已具备支撑AGI时代规模化、高效率、高可靠模型生产的关键能力。
以上文章由 AI 总结生成