谷歌在AI技术应用于历史手稿破译领域取得重大进展。其于AI Studio平台测试的一款未命名AI模型,经专业测试,错误率低至0.56%,性能可媲美人类专家,还展现出令人惊喜的推理能力。不过,由于测试形式的限制,目前评估样本有限,大规模系统性测试尚待推进。
谷歌AI模型测试成果惊人
谷歌正通过AI Studio平台测试一款尚未命名的AI模型,在破译难以辨认的历史手稿方面成果惊人。历史学家Mark Humphries使用专门开发的基准数据集,对该模型处理五份18至19世纪高难度历史手稿的性能进行系统性测试,整体字符错误率约为1.7%,且大部分错误仅涉及标点符号和大小写,并非单词本身。若排除这类非核心错误,字符错误率骤降至约0.56%,即每转写200个字符才出现一个错误,准确度足以与专业人类工作者相提并论。
AI模型展现推理能力
该模型不仅在文字转写的准确性上表现出色,还超越了简单的文字转写,展现出复杂的推理能力。在处理一份18世纪商人的日记时,其中购买糖的记录仅标记数字“145”,未注明计量单位,而该模型并非直接转写为“145”,而是通过反向计算账本中记录的总价,并结合当时英国的货币与重量单位关系,输出了“14磅5盎司”的准确结果。
测试存在局限性
尽管该模型的初步测试结果令人振奋,但Humphries也强调了当前评估存在局限性。由于该模型通过A/B测试形式零星出现,系统性地进行大规模测试存在困难,目前仅评估了基准数据集中约10%的样本。
以上文章由 AI 总结生成




