分享好友 资讯首页 频道列表

OpenAI发布ChatGPT Agent,能自主思考行动完成复杂任务

2025-07-18 09:10210

2025年7月18日凌晨,OpenAI技术直播发布重磅产品ChatGPT Agent,这一智能体具备自主思考与行动能力,可自选工具完成超复杂任务,标志着智能体赛道迎来重大变革。OpenAI将逐步向不同类型用户开放该功能,并在安全机制上做了重点强化,其底层模型在多项基准测试中也展现出优异性能。


ChatGPT Agent功能强大,实现从“被动”到“主动”的跨越

ChatGPT Agent的诞生堪称AI领域的一次重大飞跃。它具备自主思考和行动能力,能主动从技能库中挑选合适工具,像Operator、Deep Research和ChatGPT等,进而完成各类超复杂任务。用户只需给出一个提示,例如要求分析三个竞争对手并制作幻灯片演示文稿,ChatGPT Agent便会智能地浏览网站、选择日期、筛选结果、运行代码,甚至自动生成经过润色的幻灯片演示文稿或电子表格 ,完成所有工作。它还能自动生成可编辑的演示文稿和幻灯片、查看用户日历以简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材以及运行代码等。这无疑是从“被动响应”到“主动执行”的能力跃迁。


多团队协作开发,融合多项功能

为开发ChatGPT Agent,OpenAI将背后的Operator和Deep Research团队合并为一个统一团队。该智能体结合了之前多种智能体工具的功能,其中Operator模块可直接操作浏览器,在网页上实现“点击/输入/操作”;Deep Research能够进行深入、多源的资料收集与信息提炼,生成深度研究报告;ChatGPT本体则负责语言表达、逻辑推理,并理解上下文。三者结合,使得ChatGPT Agent犹如全能的AI打工人,全流程打通任务的理解与执行。


配备丰富“工具箱”,自动规划任务流程

OpenAI为ChatGPT Agent配备了功能多样的“工具箱”,其中视觉浏览器可打开网页、点击按钮、筛选内容、填写表单;文本浏览器用于阅读长网页、提取有价值信息;终端Terminal能够执行代码、处理数据、运行脚本等;连接器Connectors可连接Gmail、日历、Github等账户,读取实时上下文并用于任务推理;文件编辑支持生成、修改Excel表格、PPT等。关键在于,用户只需一句话说明需求,ChatGPT Agent便会自行规划流程,调用合适工具完成任务,实现从“对话式AI”到“任务型AI”的进化,真正具备“动手解决复杂任务”的能力。


基准测试表现优异,逼近超越人类专业水平

从OpenAI官方公布的多项基准测试结果来看,ChatGPT Agent的表现十分出色。在经典的人类最后一场考试HLE中,它以41.6%的准确率碾压了Deep Research(26.6%);在评估网页浏览能力的WebArena基准测试中,ChatGPT Agent准确率达65.4%,较上代Operator模型有所提升,已逐渐接近人类平均水平(78.2%);而在数据分析和建模的评估DSBench中,ChatGPT Agent更是以89.9%/85.5%的正确率超过了人类平均水平。在其他测试如FrontierMath中,当可访问工具时,其得分也远高于之前的模型。


强化安全机制,确保使用安全

对于具备“自主能力”的ChatGPT Agent,安全性至关重要。OpenAI重点强化了三类安全机制:权限明确,凡是涉及付款、发送邮件、提交等有“现实后果”的操作,Agent都会暂停并请求确认,不会擅自执行;浏览器接管模式,可让它登录网站查资料,但密码只能用户自己输入,它看不到也不会记录,浏览记录、cookie都可一键清除;防提示词注入攻击,Agent能识别并拦截网页中隐藏的“恶意提示词”,必要时会中断任务并提示人工介入。此外,还启用了最高等级的生物/化学安全审查机制,防止其被用于生成危险实验或工具指令,确保AI始终在人类主导下执行任务。


逐步开放使用,不同用户额度有别

目前,ChatGPT Agent正在逐步开放。OpenAI延续一贯策略,优先对付费用户开放。ChatGPT Pro用户即日起可用,每月有400条消息额度;Plus和Team用户将在未来几天内陆续开放,每月40条消息额度;企业与教育版预计数周内上线。用户使用方式简单,在ChatGPT页面右上角点击Tools->选择Agent,即可开启Agent代理模式。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
AI初创公司Perplexity洽谈在手机预装AI浏览器,挑战谷歌移动市场垄断地位
英伟达投资的AI初创公司Perplexity正试图打破谷歌Chrome浏览器及其AI搜索引擎在移动市场的垄断局面。其CEO阿拉文德·斯里尼瓦斯

0评论2025-07-2026

多家自媒体传浙江5部门追溯娃哈哈20年资金流向,官方辟谣
近日,宗庆后子女财产继承纠纷及娃哈哈相关新闻热度居高不下。然而,7月18日多家自媒体传播的“浙江省纪委国资公安等5部门通告追

0评论2025-07-2013

日本“芯片国家队”Rapidus启动2nm晶体管原型试制,目标2027年量产
当地时间2025年7月,被称为日本“芯片国家队”的半导体制造商Rapidus宣布,旗下位于北海道的IIM-1工厂已启动2nm全环绕栅极晶体管

0评论2025-07-1920

从“制造”到“智造”“精造”:五金行业转型的跨越与突围
从“制造”到“智造”“精造”:五金行业转型的跨越与突围在全球产业变革与市场竞争加剧的背景下,五金行业从“中国制造”向“中

0评论2025-07-175

从“输出产品”到“定义规则”:中国制造的全球价值链跃迁之路
从“输出产品”到“定义规则”:中国制造的全球价值链跃迁之路从车间流水线上的标准化产品,到全球市场认可的技术标准;从国际分

0评论2025-07-162

机电行业只有顺应时代潮流,持续创新,才能在全球市场竞争中占据有利地位,实现可持续发展
在科技飞速发展、全球竞争日益激烈的当下,机电行业正站在变革的十字路口,唯有顺应时代潮流、持续创新,方能在全球市场竞争中站

0评论2025-07-161

机电行业深度洞察:转型浪潮下的机遇与挑战
机电行业深度洞察:转型浪潮下的机遇与挑战在全球制造业变革的大背景下,机电行业正经历着深刻的转型升级,成为各界关注焦点。近

0评论2025-07-161

前百度总裁张亚勤:未来AI大模型竞争关键在于建立生态
2025年,大模型竞赛步入第三年,DeepSeek带来的中国模式备受瞩目。清华大学智能产业研究院院长张亚勤在接受凤凰卫视吴小莉专访时

0评论2025-07-1616

中外人士共话人工智能时代人类文明发展的机遇与挑战
中新社北京7月11日电 (记者 谢雁冰)全球文明对话部长级会议“文明交流互鉴与科技创新发展”平行论坛11日在北京举行,中外人士围

0评论2025-07-1535

特斯拉投资者敦促收购Unplugged,进军“警用/军用定制车”市场
近日,一批海外特斯拉投资人建议特斯拉收购Unplugged Performance改装公司,期望借此进军“警用/军用定制车”市场。Unplugged方

0评论2025-07-1424