分享好友 资讯首页 频道列表

上海交大与上海人工智能实验室联合团队开创AI4AI新路径,7B智能体经9个任务训练超越671B Deepseek-R1

2025-06-22 09:381330

上海交通大学与上海人工智能实验室联合团队取得重大突破,通过“经验学习”新范式,用仅7B参数的AI智能体(ML-Agent)在9个机器学习任务上实现迭代进化,设计出超越671B Deepseek-R1驱动智能体所设计的AI模型,开创AI4AI新路径,且该智能体在性能上展现诸多优势,还与相关开源社区活动紧密相连。


传统自主机器学习的困境与AI4AI的兴起

当前AI开发严重依赖人类专家手动实验与反复调参,这种以人为中心的方式制约创新速度与通向通用人工智能(AGI)的进程。传统机器学习工程繁琐低效,研究人员常需数天至数月进行模型设计、参数调优等操作,限制AI创新发展。基于大语言模型(LLM)的智能体虽带来变革,能实现自主机器学习,但仍高度依赖人工设计的提示词,存在“等待 - 修改 - 重试”的低效循环,难以摆脱人力依赖与效率瓶颈。为突破限制,AI-for-AI(AI4AI)应运而生,旨在让AI智能体自主设计、优化和改进AI算法,减少人类干预,加速迭代开发周期。


联合团队的创新突破:从指令遵循到自我进化

上海交通大学与上海人工智能实验室联合团队为解决上述关键限制,首次探索基于学习的智能体自主机器学习范式,让智能体通过在线强化学习从机器学习任务执行轨迹中学习,主动探索策略,跨任务积累知识,逐步优化决策,从自身经验中学习并提升设计优化AI的能力。基于此,研究人员训练出由7B规模Qwen2.5大模型驱动的自主机器学习智能体ML-Agent,其在9个机器学习任务上反复学习后,不仅超越671B规模的DeepSeek-R1智能体,还展现出卓越的跨任务泛化能力,标志着AI智能体从“工具执行者”向“自主学习者”转变,带来“AI自主设计AI”新范式。


解锁AI自进化的三大核心突破

研究团队提出全新训练框架,攻克自主机器学习三大难题。其一,针对传统自主机器学习智能体创新受限问题,采用探索增强微调,通过多样化专家轨迹数据集训练智能体尝试不同策略,拓宽探索范围,增强策略生成能力;其二,针对传统RL方法在机器学习实验中采样效率低下问题,采用逐步强化学习范式,重构训练目标函数,每次只优化单步动作,提升数据收集效率,缩短训练时间;其三,针对实验反馈复杂难以统一问题,设计机器学习定制化奖励模块,将多样执行结果转换为统一反馈,为RL优化提供有效奖励信号,推动智能体持续迭代改进。


ML-Agent的卓越性能表现

研究团队对ML-Agent开展广泛实验评估其性能。与5个强大的开源/闭源LLM驱动的智能体比较,ML-Agent在见过/未见过的机器学习任务中的平均和最好性能均最高,在所有10个未见过的机器学习任务上超过671B的Deepseek-R1驱动的自主机器学习智能体,展现强大泛化能力。与专门为自主机器学习设计的LLM智能体AIDE比较,ML-Agent总体更优,凸显训练框架有效性。随着训练进行,ML-Agent不断自我探索学习,在训练过/未经训练过的机器学习任务上性能持续提升,最终超越所有基线方法。


ML-Agent与MASWorks开源社区及相关活动

ML-Agent是刚发起的大模型多智能体开源社区MASWorks的一部分。MASWorks社区致力于连接全球研究者,打造开放、协作平台推动多智能体系统领域发展。作为社区启动重磅活动,MASWorks将在ICML 2025举办聚焦大语言模型多智能体的Workshop:MAS-2025,期待全球学者参与探讨,描绘该领域未来蓝图。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
这种“全链整合+技术壁垒”的模式,既提升了头部企业的抗风险能力,也为行业树立了技术标杆,推动整个产业向高端化迈进
这种“全链整合+技术壁垒”的模式,堪称五金机电行业向高端化突围的“双引擎”,其价值不仅体现在头部企业自身的竞争力提升,更

0评论2025-08-210

让中小企业在高端市场站稳脚跟后,能进一步拓展自身的客户网络,形成良性发展循环,推动整个五金行业的分层升级
中小企业在高端市场站稳脚跟后,其客户网络的拓展与能力的提升,会形成连锁反应,进而推动五金行业实现“分层升级”,这一过程既

0评论2025-08-210

中国首部8K拍摄太空电影《窗外是蓝星》定档9月5日全国上映
8月19日,中国首部8K拍摄太空电影《窗外是蓝星》正式发布定档预告,宣布将于9月5日全国上映。这部电影不仅是首部挂总台电影台标

0评论2025-08-203

全球首个人形机器人运动会在北京举行,中国军团表现亮眼
2025年8月14 - 17日,全球首个人形机器人运动会在北京国家速滑馆盛大举行,这场盛会吸引了16个国家的280支队伍携500余台机器人同

0评论2025-08-207

2025首届世界人形机器人运动会原地跳高决赛:星动L7夺冠并刷新纪录
2025年8月16日,2025首届世界人形机器人运动会原地跳高决赛上,星动纪元的全尺寸双足人形机器人星动L7以95.641厘米的成绩勇夺金

0评论2025-08-17186

国家统计局:2025年7月规模以上工业增加值同比增长5.7%
国家统计局发布2025年7月国民经济数据,规模以上工业增加值同比实际增长5.7%,环比增长0.38%,1 - 7月同比增长6.3%。从三大门类

0评论2025-08-16163

市场分析调研,有产品没销量一直在缩减怎么办的最新文案
当产品销量持续缩减,这份自救指南请查收在商业战场上,手握产品却遭遇销量持续下滑的困境,无疑是每个企业都不愿面对的难题。但

0评论2025-08-15160

2025 Google开发者大会在上海召开,助力中国出海开发者全球发展
8月13日,Google开发者大会在上海举行,来自Google各领域的专家围绕AI技术、开发工具、全球化平台生态展开分享,助力中国出海企

0评论2025-08-14162

财政部等多部门发布个人消费与服务业经营主体贷款贴息政策,年贴息比例均为1%
2025年8月12日,财政部联合商务部、中国人民银行、金融监管总局等部门发布个人消费贷款与服务业经营主体贷款贴息政策,旨在通过

0评论2025-08-14160

“全球首个女团机器人”灵童·念NIA - F01拍卖成交,价格超万元
8月11日晚,号称“全球首个女团机器人”的灵童·念NIA - F01人形机器人在某平台拍卖,以1元起拍,最终成交价10580元,吸引超万人

0评论2025-08-13165