免费发布消息

OpenAI首席科学家与研究官访谈:透露GPT-5关键信息,终极目标为“自动化研究员”

   2025-09-27 50
核心提示:在a16z的最新采访中,OpenAI首席科学家Jakub Pachocki和首席研究官Mark Chen爆料诸多关键信息。他们深入探讨GPT-5特性、评估体系

在a16z的最新采访中,OpenAI首席科学家Jakub Pachocki和首席研究官Mark Chen爆料诸多关键信息。他们深入探讨GPT-5特性、评估体系困境、强化学习优势等,还阐述用人标准、未来路线图与算力分配,透露终极目标是打造“自动化研究员”,并分享对AI编程的独特见解。


GPT-5的探索与挑战

Mark Chen表示,GPT-5是OpenAI将推理能力带入主流的尝试。此前公司有主打即时响应的GPT系列和主打推理的o系列模型,为避免用户选择困扰,未来会侧重推理和Agents。他强调,GPT-5相比o3等模型虽多有改进,但主要意义是将推理模式带给更多人。对于评估趋于饱和的问题,Jakub Pachocki承认过去几年的评估已接近饱和,早期训练依赖大规模预训练数据测试泛化能力,如今强化学习使模型在特定领域突出却缺乏泛化性,未来OpenAI将关注模型能否发现新事物并在经济相关领域取得进展。


OpenAI的宏大目标————自动化研究员

顺着发现新事物话题,二人分享GPT-5发布前令他们惊讶的能力。Mark Chen称模型能推动前沿科学研究,与物理学家、数学家体验时发现其能解答复杂新问题。Jakub Pachocki则对o3处理数学公式或推理时达到的“相当值得信赖”水平印象深刻。Jakub透露OpenAI大目标是培养自动化研究员,先自动化内部研究工作,再考虑其他科学领域,衡量进展的方法是观察模型推理和取得进展的时间跨度,未来会专注延长该跨度。


强化学习的奥秘与发展

面对强化学习(RL)为何运作出色及令人惊讶之处的提问,Jakub Pachocki解释,RL具有通用性与强大性,建立在深度学习这一通用学习方法之上,且OpenAI努力将模型锚定现实世界,语言模型的突破也是关键转折点。他认为过去几年OpenAI研究令人兴奋,发现诸多有效新方向。对于奖励模型,他预计其发展速度快且未来会更简单,但演变未结束,RL还未完全做到接近人类学习,需保持灵活,因为相关工具和方法论会持续快速迭代。


AI编程的现状与思考

针对OpenAI本月发布的编程优化模型GPT-5-codex,Mark Chen表示投入大量精力调整预设匹配程序员预期,还通过参加编程竞赛测试模型能力。Jakub Pachocki认为编程竞赛可衡量模型在受限环境和时间内提出新想法的能力,作为“老派”程序员,他虽曾抗拒使用工具,但如今意识到模型15分钟内几乎能完美重构30个文件,形容当前编码方式处于“恐怖谷”阶段,OpenAI首要任务是摆脱这一阶段。Mark Chen将模型水平与李世石面对AlphaGo的经历联系,称这种进步改变了编码默认方式,如今年轻人认为“凭感觉编码”是默认方式,还提到氛围编码之后或许是氛围研究。


OpenAI的用人标准与未来规划

Jakub Pachocki认为坚持不懈是研究关键,要做好失败准备,有清晰假设并对进展诚实。Mark Chen补充研究无捷径,需经验选择合适问题。关于留住人才,Mark Chen称OpenAI专注基础研究、目标清晰、注重文化建设和人才培养。Jakub表示寻找曾解决难题、技术扎实且迎难而上的人,而非最“出圈”的人。在团队文化方面,要保护基础研究,不被产品竞争带偏。面对算力、数据整理和人员资源分配问题,Mark Chen认为计算资源是合理答案,Jakub强调计算仍是决定性因素,研究路线基于长期信念,还提到机器人技术未来可能成焦点。


以上文章由 AI 总结生成

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行