技术解读
当 AI 在五轮对话里「骗过」一半以上的人类裁判:PNAS 这篇论文,为什么把图灵测试的「破」从传闻钉成了事实
2026 年 6 月 15 日,《美国国家科学院院刊》PNAS 上线一份由 UC San Diego、Oxford、Allen AI 联合完成的同行评审论文,首次以严格三方图灵测试标准确认 GPT-5、Claude 4 Sonnet、Gemini 2.5 Pro 等前沿大语言模型「被误判为人类」的比例稳定超过 50%。这意味着图灵 1950 年提出的「机器能思考吗」问题,在学术上第一次被钉死为「AI 已能骗过半数学术认定的裁判」。本文用通俗语言还原论文内容、解释为什么它与之前所有「AI 通过图灵测试」的噱头不同,并梳理它在客服核验、网络欺诈、学术诚信、AI 哲学四个层面正在带来的现实冲击。