分享好友 资讯首页 频道列表

上海交大等机构联合推出MAS-GPT,革新多智能体系统构建

2025-07-06 09:3800

近日,上海交通大学人工智能学院、上海人工智能实验室、牛津大学等机构联合推出MAS-GPT,为多智能体系统(MAS)的构建带来革新。它以创新的设计范式与训练方式,让构建MAS变得如同与ChatGPT聊天般轻松,经实验验证性能出色,同时也为相关开源社区发展助力。


MAS-GPT应运而生,解决构建MAS难题

OpenAI将“组织级智能”视为通向AGI的重要阶段,而MAS是实现这一目标的关键探索方向。但构建MAS面临诸多挑战,如结构繁多、prompt调试耗时、难以解决通用任务等。现有MAS方法,如ChatDev、DyLAN、AFlow等,存在无适应性、成本高昂、泛化性低等问题,严重阻碍其广泛应用。在此背景下,MAS-GPT由上海交通大学人工智能学院、上海人工智能实验室、牛津大学等机构联合推出,致力于让构建MAS的道路更加平坦高效。该研究成果发表于国际机器学习大会ICML 2025 ,相关论文、代码及模型链接也已公布。


创新设计范式,转变为语言生成任务

MAS-GPT将“设计MAS”彻底转变为一个语言生成任务,输入Query就能输出可直接运行的多智能体系统。该系统由Python代码呈现,Agent的提示词为Python变量,Agent产生回应通过LLM调用函数,Agent间的交互采用字符串拼接,Agent工具调用借助Python函数,从此MAS由“模型写”代替“人写”。


精巧训练流程,打造高质量数据样本

MAS-GPT通过设计精巧的数据构造流程来训练,让模型学会针对不同Query设计相应MAS。具体分为四步:首先进行数据池构建,广泛收集多领域Query并汇集多种基础MAS代码结构;接着对每一个“Query-MAS”组合进行数据对评估,细致地自动化评估与标注;然后根据跨组一致性原则,进行数据对选择,将相似Query统一匹配到表现最好的MAS;最后依据组内一致性原则,通过数据对精修,借助大模型改写MAS、添加推理解释,使其与Query逻辑高度贴合。最终得到11K条高质量数据样本,通过一次简单的监督微调开源模型,训练得到MAS-GPT。


推理过程简单,多项实验表现出色

用户抛出Query,MAS-GPT一次调用生成专属MAS,该MAS立即执行并返回答案,推理过程简单高效。研究团队在8个基准任务×5种主流模型上,对比10多种现有方法,结果显示MAS-GPT表现优异。它更准,平均准确率全面领先,对比当前最强基线提升3.89%;更泛化,在训练时未见过的任务上也保持稳健表现;更省,能以几乎0.5倍推理成本跑出更好效果;兼容性强,无论用哪种LLM驱动,都能带来一致的性能提升。


拓展推理能力边界,训练阶段潜力大

MAS-GPT生成的MAS不仅适用于Chatbot LLM,还能辅助更强的Reasoner LLM推理。使用OpenAI o1和DeepSeek-R1等强推理模型搭配MAS-GPT结构,在AIME-2024数学挑战上,o1 + MAS-GPT提升了13.3%,DeepSeek-R1 + MAS-GPT提升了10.0%,展现出将强模型“组织起来干活”的能力。此外,MAS-GPT训练阶段的参数规模有很大探索空间,通过可视化分析发现,它不止会“套模板”,还能自动生成新颖的MAS,面对新任务给出合理的agent分工与协作方式,并附上推理说明,真正学会设计。


融入开源社区,期待各方参与

MAS-GPT是刚发起的大模型多智能体开源社区MASWorks的拼图之一。该社区致力于连接全球研究者,打造开放协作平台推动MAS领域发展。作为社区启动的首个重磅活动,MASWorks将在ICML 2025举办聚焦大语言模型多智能体的Workshop:MAS-2025,期待全球广大智能体开发者和研究人员贡献智慧与代码,共同塑造MAS的未来。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
2025年上半年130余家私募机构及其相关负责人领180张罚单,监管威慑力增强
2025年上半年,监管部门持续强化私募基金行业监管,各地证监局对130余家私募机构及其相关负责人开出180张罚单。处罚事由涉及私募

0评论2025-07-060

前英特尔CEO帕特・基辛格访日:承认低估AI对英特尔影响,建议Rapidus差异竞争
前英特尔CEO帕特・基辛格近日以风投公司Playground普通合伙人身份访日,在日媒采访中分享了对英特尔经历的看法,承认低估AI对英

0评论2025-07-060

谷歌为避欧盟罚款,拟在搜索页优先展示友商购物和旅游平台内容
为避免欧盟法律重锤,谷歌有新动作。据彭博社援引知情人士消息,谷歌计划在搜索页面顶部优先显示其他公司购物和旅游平台内容,以

0评论2025-07-060

760万粉丝博主曝光魏牌高山8故障及售后问题,与魏牌各执一词
近日,760万粉丝博主“张教官的有趣人生”曝光魏牌高山8高速行驶突发故障及售后问题,与魏牌陷入“罗生门”,引发广泛关注。一方

0评论2025-07-0526

澳大利亚团队用量子机器学习制造半导体,多家企业在量子计算领域有进展
量子技术作为前沿领域正深刻改变人们生活。近日,澳大利亚CSIRO团队利用量子机器学习研制出全球首个基于量子技术的半导体,提升

0评论2025-07-0525

费大厨深圳门店招聘服务员要求本科引热议,涉事门店称非全看学历且已撤下信息
近日,湘菜连锁品牌费大厨深圳一门店招聘服务员要求本科学历以上,月薪5000 - 6000元,这一消息引发网友广泛热议。涉事门店回应

0评论2025-07-0530

2025年Q1全球智能手表出货量下滑,华为、小米逆势增长53%
2025年第一季度,全球智能手表市场延续出货量下滑态势,同比下降2%,但华为与小米却逆势增长53%,中国市场也因二者等品牌发力而

0评论2025-07-0530

国际油价因美越贸易协议乐观情绪上涨,OPEC+会议将决定8月产量
受美国与越南达成贸易协议影响,国际油价近日小幅上涨。然而,市场对油价涨势的可持续性存疑,交易员密切关注美国与贸易伙伴的谈

0评论2025-07-0418

智象未来创始人梅涛:成功AI视频要打动观众,其公司模型开源后登顶国际榜单
在人工智能企业集聚的合肥市,智象未来(合肥)信息技术有限公司在文生视频领域成绩斐然。其自主研发的HiDream-I1图像生成大模型

0评论2025-07-0420

全球三大EDA厂商恢复对华服务,A股 EDA概念板块走低
7月3日,全球三大EDA软件厂商新思科技、楷登电子和西门子宣布恢复对华服务,原因是美国商务部工业与安全局取消了5月下旬发出的出

0评论2025-07-0424