免费发布消息

FutureHouse发布AI超级科学家“科斯莫斯”,12小时能完成人类半年科研任务

   2025-11-19 90
核心提示:近日,非营利研究机构FutureHouse发布AI超级科学家系统“科斯莫斯”,引发广泛关注。它单次运行12小时可完成相当于人类研究员团

近日,非营利研究机构FutureHouse发布AI超级科学家系统“科斯莫斯”,引发广泛关注。它单次运行12小时可完成相当于人类研究员团队半年的科研工作量,准确率达79.4%,已在多领域取得七项实质发现,并开启商业化运营。对于这一创新成果,网友们观点不一,同时它也对现有AI评估体系提出了挑战。


“科斯莫斯”性能卓越,科研效率惊人

FutureHouse早期开发的AI科学家“罗宾”存在处理海量信息方面的局限。而“科斯莫斯”采用“结构化世界模型”实现重大突破,能高效融合数百个智能体轨迹的信息。它采用自主循环工作架构,可并行启动任务、更新知识图谱并规划探索方向。据统计,其单次运行平均完成166轮数据分析和36次文献综述迭代,12小时能阅读1500篇学术论文,生成并执行4.2万行分析代码,输出可溯源的科研报告,综合处理能力超越已知智能体系统。在实际测试中,其半天完成的工作量相当于研究人员个人六个月的投入,准确率达79.4%。


多领域取得七大发现,商业化运营开启

“科斯莫斯”已与多家学术机构合作,在神经科学、材料科学、统计遗传学等前沿领域取得七项具有实质意义的发现,包括独立复现三项未发表研究,如确认核苷酸代谢为低温脑处理关键通路、发现钙钛矿太阳能电池失效阈值;还在四个方向实现原创突破,如为心肌纤维化研究提供新证据、揭示2型糖尿病发病风险相关机制等。目前,FutureHouse已启动“科斯莫斯”的商业化运营,单次运行定价约200美元,学术用户可申请免费额度,还推出创始订阅计划,早期用户可享1美元/积分的优惠价格,不过未来价格将随计算资源成本动态调整。


深度交互科研平台,使用有技巧

“科斯莫斯”并非传统对话式AI,而是深度交互的科研平台。用户需掌握结构化提示技巧,明确研究目标、规划数据路径与分析框架,才能充分发挥其效能。但该系统探索过程具有非线性特征,约30%的运行会陷入局部最优解,关注科学价值有限的发现。因此,FutureHouse建议使用者对关键研究目标进行3 - 5次并行运行,交叉验证结果以获取可靠研究路径。


效能获验证,挑战传统评估体系

在开发过程中,研究人员发现“科斯莫斯”单次运行完成的工作量相当于一名博士或博士后六个月的研究产出,且效能随运行深度线性增长。通过邀请测试用户评估自行完成相同工作所需时间,7位科学家平均估值为6.14个月。此外,科斯莫斯复现的三项发现原研究平均耗时约4个月,且研究人员独立测算其处理工作量相当于研究人员4.1个月全职工作。“科斯莫斯”的出现,让传统基于简单任务持续时间的AI评估体系难以反映复杂科研场景中AI的真实能力,建立新评估维度迫在眉睫。


网友热议,看法褒贬不一

“科斯莫斯”发布后,网友纷纷点赞,称其为“人工智能应用最恰当的典范”,标志着人类与AI科学家协同合作新时代的到来,将助力人类知识边界扩张。不过,也有网友质疑,认为真正的“AI科学家”需实现从思想到实证的完整闭环,并交出可量化的卓越成绩单,下一代AI科研工具要更务实。


以上文章由 AI 总结生成

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行