分享好友 资讯首页 频道列表

OpenAI发布ChatGPT Agent,能自主思考行动完成复杂任务

2025-07-18 09:10320

2025年7月18日凌晨,OpenAI技术直播发布重磅产品ChatGPT Agent,这一智能体具备自主思考与行动能力,可自选工具完成超复杂任务,标志着智能体赛道迎来重大变革。OpenAI将逐步向不同类型用户开放该功能,并在安全机制上做了重点强化,其底层模型在多项基准测试中也展现出优异性能。


ChatGPT Agent功能强大,实现从“被动”到“主动”的跨越

ChatGPT Agent的诞生堪称AI领域的一次重大飞跃。它具备自主思考和行动能力,能主动从技能库中挑选合适工具,像Operator、Deep Research和ChatGPT等,进而完成各类超复杂任务。用户只需给出一个提示,例如要求分析三个竞争对手并制作幻灯片演示文稿,ChatGPT Agent便会智能地浏览网站、选择日期、筛选结果、运行代码,甚至自动生成经过润色的幻灯片演示文稿或电子表格 ,完成所有工作。它还能自动生成可编辑的演示文稿和幻灯片、查看用户日历以简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材以及运行代码等。这无疑是从“被动响应”到“主动执行”的能力跃迁。


多团队协作开发,融合多项功能

为开发ChatGPT Agent,OpenAI将背后的Operator和Deep Research团队合并为一个统一团队。该智能体结合了之前多种智能体工具的功能,其中Operator模块可直接操作浏览器,在网页上实现“点击/输入/操作”;Deep Research能够进行深入、多源的资料收集与信息提炼,生成深度研究报告;ChatGPT本体则负责语言表达、逻辑推理,并理解上下文。三者结合,使得ChatGPT Agent犹如全能的AI打工人,全流程打通任务的理解与执行。


配备丰富“工具箱”,自动规划任务流程

OpenAI为ChatGPT Agent配备了功能多样的“工具箱”,其中视觉浏览器可打开网页、点击按钮、筛选内容、填写表单;文本浏览器用于阅读长网页、提取有价值信息;终端Terminal能够执行代码、处理数据、运行脚本等;连接器Connectors可连接Gmail、日历、Github等账户,读取实时上下文并用于任务推理;文件编辑支持生成、修改Excel表格、PPT等。关键在于,用户只需一句话说明需求,ChatGPT Agent便会自行规划流程,调用合适工具完成任务,实现从“对话式AI”到“任务型AI”的进化,真正具备“动手解决复杂任务”的能力。


基准测试表现优异,逼近超越人类专业水平

从OpenAI官方公布的多项基准测试结果来看,ChatGPT Agent的表现十分出色。在经典的人类最后一场考试HLE中,它以41.6%的准确率碾压了Deep Research(26.6%);在评估网页浏览能力的WebArena基准测试中,ChatGPT Agent准确率达65.4%,较上代Operator模型有所提升,已逐渐接近人类平均水平(78.2%);而在数据分析和建模的评估DSBench中,ChatGPT Agent更是以89.9%/85.5%的正确率超过了人类平均水平。在其他测试如FrontierMath中,当可访问工具时,其得分也远高于之前的模型。


强化安全机制,确保使用安全

对于具备“自主能力”的ChatGPT Agent,安全性至关重要。OpenAI重点强化了三类安全机制:权限明确,凡是涉及付款、发送邮件、提交等有“现实后果”的操作,Agent都会暂停并请求确认,不会擅自执行;浏览器接管模式,可让它登录网站查资料,但密码只能用户自己输入,它看不到也不会记录,浏览记录、cookie都可一键清除;防提示词注入攻击,Agent能识别并拦截网页中隐藏的“恶意提示词”,必要时会中断任务并提示人工介入。此外,还启用了最高等级的生物/化学安全审查机制,防止其被用于生成危险实验或工具指令,确保AI始终在人类主导下执行任务。


逐步开放使用,不同用户额度有别

目前,ChatGPT Agent正在逐步开放。OpenAI延续一贯策略,优先对付费用户开放。ChatGPT Pro用户即日起可用,每月有400条消息额度;Plus和Team用户将在未来几天内陆续开放,每月40条消息额度;企业与教育版预计数周内上线。用户使用方式简单,在ChatGPT页面右上角点击Tools->选择Agent,即可开启Agent代理模式。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
马斯克旗下Neuralink公司称全球已有12人植入其脑机接口设备
当地时间9月9日,马斯克旗下脑机接口公司Neuralink在社交媒体平台X发布消息,透露全球已有12人植入其设备,累计使用时长颇为可观

0评论2025-09-101

宁德时代在德推出NP3.0技术平台及神行Pro电池产品,助力欧洲绿色转型
2025年9月7日,宁德时代于德国慕尼黑举办新品发布会,全球首发NP3.0技术平台及神行Pro电池产品,旨在响应欧洲市场电动化需求,推

0评论2025-09-084

消息源乔恩・普罗瑟曝光苹果iPhone 17 Pro等多款新产品设计
2025年9月6日,知名爆料人乔恩・普罗瑟通过YouTube发布视频,提前“剧透”苹果秋季发布会多款新品,其中iPhone 17 Pro设计亮点与

0评论2025-09-0716

华为发布FreeBuds 7i耳机,搭载智慧动态降噪4.0技术,支持静谧通话等功能
2025年9月4日下午,华为发布新款耳机FreeBuds 7i,这款耳机搭载智慧动态降噪4.0技术,能够实现秒级自适应调整,同时还支持静谧通

0评论2025-09-059

2025年Q2全球可折叠手机市场:华为以45%份额领先,三星份额下滑
2025年9月3日,CounterPoint Research发布报告指出,2025年第2季度全球可折叠智能手机出货量同比增长45%,得益于中国市场的持续

0评论2025-09-0511

特斯拉全新“金色擎天柱”首曝,手部似人类,Figure机器人可自主装碗进洗碗机
9月4日,科技圈迎来两则重磅消息:Salesforce创始人Marc Benioff曝光特斯拉全新Optimus机器人,引发各界对其性能与应用的热议;

0评论2025-09-059

亿纬锂能成都量产基地揭牌,“龙泉二号”全固态电池下线
2025年9月2日,亿纬锂能固态电池研究院成都量产基地正式揭牌,备受瞩目的“龙泉二号”10Ah全固态电池成功下线。该电池能量密度达

0评论2025-09-0414

摩根大通预测iPhone 17系列除Pro版外价格维稳,全新iPhone 17 Air将亮相
苹果秋季新品发布会前夕,华尔街投行摩根大通发布研报,提前“揭晓”iPhone 17系列的核心看点与价格悬念。报告预测,除Pro机型因

0评论2025-09-049

小米发布智能中控屏Max,众筹价1999元,支持微信通话与全屋智能控制
9月1日,小米发布智能中控屏Max,以1999元的众筹价(建议零售价2499元)及丰富功能,为全屋智能家居控制带来新选择。这款中控屏

0评论2025-09-0224

Meta将于9月18日分享AI智能眼镜进展,或发布SDK及代号“Hypernova”的产品
Meta年度开发者大会Connect大会日程公布,诸多信息强烈暗示其首款带有显示功能的消费级智能眼镜发布在即,相关SDK也可能同期亮相

0评论2025-09-0135