近日,MIT和马德里理工大学的一项关于AI“驾驶”宇宙飞船的研究引发关注。在由Kerbal Space Program衍生的航天挑战赛中,研究团队利用提示词工程和少量微调,让ChatGPT和Llama操控宇宙飞船完成任务,Llama更是实现0%失败率,验证了AI小数据高效与自主航天的可行性,为未来太空漫游提供了可能,其研究论文也即将发表。
AI操控飞船参与航天挑战赛
该研究聚焦于AI “驾驶”宇宙飞船,在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为“主控”智能体参赛并夺得第二名。此比赛被视为太空探索自主化的重要实验场,而研究团队采用提示词工程 + 少量微调的方式,让ChatGPT成功驾驭如追击卫星、规避侦测等复杂太空任务。整个系统由文本状态输入→语言模型决策→代码执行三步组成,展现出LLM模型强大的泛化与适应能力。
选用ChatGPT和Llama的原因及操控方式
研究人员长期致力于开发航天器自主系统,因未来卫星数量众多且深空探测受光速限制,人类无法完全手动控制。而《Kerbal Space Program》博弈挑战赛为研究提供了试验场。此次研究选用ChatGPT是因其易于使用,重点采用微调模型策略;选用Llama则是由于其社区支持和开源灵活性,使用提示工程并进行简单微调。研究人员将航天器状态和目标以文本形式翻译后传递给LLM,再将LLM基于文本的输出转换为可操作模拟飞行器的功能代码。
挑战赛场景及评估指标
KSP挑战包含追击者 - 逃逸者、目标守卫、遮挡太阳三种场景,本研究仅讨论“追击者 - 逃逸者”范畴。在该场景不同设定中,逃逸者初始轨道不变,追击者初始轨道变化,且二者飞行器参数相同。评估指标包括追击者与逃逸者之间的距离(米)、最近接近时的速度(米/秒)、追击者燃料消耗量(千克)以及经过的时间(秒)。
Llama表现出色
通过一系列简短提示和微调,ChatGPT完成了许多测试任务并获竞赛第二名。而Llama的结果远超预期,其不仅遵循稳定顺行轨道,在KSPDG挑战中表现还优于几乎所有其他方法,基础的Llama模型比研究中使用的GPT - 3.5取得了更好的结果。思维链方法的应用使飞船驾驶技术在追击问题中的泛化能力显著提高,实现执行过程0%失败率。
研究意义与未来展望
研究团队对结果表示满意,轨道生成和智能体集成表明,使用AI构建训练场景可作为模拟引擎替代方案。尽管研究处于早期,使用的也非顶尖AI模型,但探索极具启发意义。未来太空资源竞争激烈,若LLM能控制太空飞行器,将颠覆太空竞赛生态,在太空攻防对抗、互助救援和殖民外星球等方面,AI的能力将成为关键因素。
以上文章由 AI 总结生成