免费发布消息

OpenAI发布ChatGPT Agent,能自主思考行动完成复杂任务

   2025-07-18 210
核心提示:2025年7月18日凌晨,OpenAI技术直播发布重磅产品ChatGPT Agent,这一智能体具备自主思考与行动能力,可自选工具完成超复杂任务,

2025年7月18日凌晨,OpenAI技术直播发布重磅产品ChatGPT Agent,这一智能体具备自主思考与行动能力,可自选工具完成超复杂任务,标志着智能体赛道迎来重大变革。OpenAI将逐步向不同类型用户开放该功能,并在安全机制上做了重点强化,其底层模型在多项基准测试中也展现出优异性能。


ChatGPT Agent功能强大,实现从“被动”到“主动”的跨越

ChatGPT Agent的诞生堪称AI领域的一次重大飞跃。它具备自主思考和行动能力,能主动从技能库中挑选合适工具,像Operator、Deep Research和ChatGPT等,进而完成各类超复杂任务。用户只需给出一个提示,例如要求分析三个竞争对手并制作幻灯片演示文稿,ChatGPT Agent便会智能地浏览网站、选择日期、筛选结果、运行代码,甚至自动生成经过润色的幻灯片演示文稿或电子表格 ,完成所有工作。它还能自动生成可编辑的演示文稿和幻灯片、查看用户日历以简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材以及运行代码等。这无疑是从“被动响应”到“主动执行”的能力跃迁。


多团队协作开发,融合多项功能

为开发ChatGPT Agent,OpenAI将背后的Operator和Deep Research团队合并为一个统一团队。该智能体结合了之前多种智能体工具的功能,其中Operator模块可直接操作浏览器,在网页上实现“点击/输入/操作”;Deep Research能够进行深入、多源的资料收集与信息提炼,生成深度研究报告;ChatGPT本体则负责语言表达、逻辑推理,并理解上下文。三者结合,使得ChatGPT Agent犹如全能的AI打工人,全流程打通任务的理解与执行。


配备丰富“工具箱”,自动规划任务流程

OpenAI为ChatGPT Agent配备了功能多样的“工具箱”,其中视觉浏览器可打开网页、点击按钮、筛选内容、填写表单;文本浏览器用于阅读长网页、提取有价值信息;终端Terminal能够执行代码、处理数据、运行脚本等;连接器Connectors可连接Gmail、日历、Github等账户,读取实时上下文并用于任务推理;文件编辑支持生成、修改Excel表格、PPT等。关键在于,用户只需一句话说明需求,ChatGPT Agent便会自行规划流程,调用合适工具完成任务,实现从“对话式AI”到“任务型AI”的进化,真正具备“动手解决复杂任务”的能力。


基准测试表现优异,逼近超越人类专业水平

从OpenAI官方公布的多项基准测试结果来看,ChatGPT Agent的表现十分出色。在经典的人类最后一场考试HLE中,它以41.6%的准确率碾压了Deep Research(26.6%);在评估网页浏览能力的WebArena基准测试中,ChatGPT Agent准确率达65.4%,较上代Operator模型有所提升,已逐渐接近人类平均水平(78.2%);而在数据分析和建模的评估DSBench中,ChatGPT Agent更是以89.9%/85.5%的正确率超过了人类平均水平。在其他测试如FrontierMath中,当可访问工具时,其得分也远高于之前的模型。


强化安全机制,确保使用安全

对于具备“自主能力”的ChatGPT Agent,安全性至关重要。OpenAI重点强化了三类安全机制:权限明确,凡是涉及付款、发送邮件、提交等有“现实后果”的操作,Agent都会暂停并请求确认,不会擅自执行;浏览器接管模式,可让它登录网站查资料,但密码只能用户自己输入,它看不到也不会记录,浏览记录、cookie都可一键清除;防提示词注入攻击,Agent能识别并拦截网页中隐藏的“恶意提示词”,必要时会中断任务并提示人工介入。此外,还启用了最高等级的生物/化学安全审查机制,防止其被用于生成危险实验或工具指令,确保AI始终在人类主导下执行任务。


逐步开放使用,不同用户额度有别

目前,ChatGPT Agent正在逐步开放。OpenAI延续一贯策略,优先对付费用户开放。ChatGPT Pro用户即日起可用,每月有400条消息额度;Plus和Team用户将在未来几天内陆续开放,每月40条消息额度;企业与教育版预计数周内上线。用户使用方式简单,在ChatGPT页面右上角点击Tools->选择Agent,即可开启Agent代理模式。


以上文章由 AI 总结生成

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行