9月26日,2025人工智能计算大会在北京举行,与会者聚焦人工智能基础设施建设与国产AI算力体系优化,探讨算法创新与应用落地。其中,token成本高成为AI应用规模化瓶颈,算力基础设施厂商正寻求突破。
大会聚焦产业发展,发布“北京方案”
《关于深入实施“人工智能+”行动的意见》印发一月后,产业界加速“起跑”。2025人工智能计算大会上,与会专家与企业代表讨论焦点从宏观政策解读转向具体“施工蓝图”。本届大会紧扣人工智能基础设施建设和国产AI算力体系优化,聚焦推动算法创新与应用落地。现场,中国移动、浪潮信息等30多家企业和机构,联合发布《基于超节点创新联合体,打造行业智能体————智算应用“北京方案”》,率先响应国家《关于深入实施“人工智能+”行动的意见》。
专家学者分享人工智能发展见解
西湖大学“可信及通用人工智能实验室”创始人金耀初梳理人工智能发展脉络,指出其发展路径与人脑智能涌现过程相似,阐述可信赖人工智能要求及治理重要性,并分享相关实践探索。北京智源人工智能研究院副院长林咏华分享“众智FlagOS”技术进展,称该平台旨在打破AI算力生态壁垒,实现跨地域、跨硬件的算力连接与普惠共享。百度首席技术官王海峰梳理人工智能发展历程,指出大模型技术为通用人工智能带来曙光。浪潮信息首席AI战略官刘军介绍面向智能体时代的创新系统,提出AI算力可持续发展要从规模导向转为效率导向。北京中关村人工智能研究院副院长戴蓓洁介绍建立项目制人才培养体系,推动AI与多学科融合及双向赋能。
token成本成AI应用规模化瓶颈
在大会上,token成本高已成为众多企业推进AI应用规模化的核心痛点。一位电商企业AI平台部技术负责人称,平台每天海量场景调用大模型,token成本如“达摩克利斯之剑”,智能体应用token消耗量激增,成本结构影响创新应用规模化落地与盈利能力。中国电子商务专家服务中心副主任郭涛表示,AI产业从“模型竞赛”转向“应用落地”,推理成本与交互速度成关键竞争维度,基础设施“提速降本”决定“人工智能+”垂直行业渗透程度。一位上市公司人士提到,智能体产业化核心三要素为能力、速度和成本,token成本决定盈利能力,此痛点引发广泛共鸣。
浪潮信息发布服务器破解成本难题
面对业界普遍诉求,算力基础设施厂商从硬件层面寻求突破。浪潮信息在大会上发布元脑HC1000超扩展AI服务器,基于全新全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token。浪潮信息首席AI战略官刘军称,该服务器通过全面优化降本和软硬协同增效,创新设计降低单卡及每卡系统分摊成本,全对称系统拓扑设计支持超大规模无损扩展。据测算,其推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。浪潮信息方面透露,将持续推动AI计算架构创新突破,实现token生成“提速降本”,促进人工智能与实体经济深度融合。
以上文章由 AI 总结生成