人工智能与人类之间的界限,正变得越来越模糊。
近日,加州大学的一个研究团队公布了一项令人震惊的研究成果:他们对当前最先进的语言模型GPT-4.5进行了图灵测试,结果显示,该模型在模拟人类行为方面表现出惊人的“拟人化”能力。数据显示,在受试者的判断中,有多达73%的概率将GPT-4.5误认为是“真人”,也就是说,在与它对话时,大多数人难以分辨出它其实是一台AI。
图灵测试再成焦点,GPT-4.5脱颖而出
图灵测试并非新鲜概念,其最初由英国计算机科学家艾伦·图灵在1950年的论文《计算机器与智能》中提出,是评估人工智能是否具有人类思维特征的重要方式。如今的标准测试时长一般设定为五分钟,参与测试的AI需应对由人类测试者提出的一系列问题。如果其回答有30%以上能够成功“骗过”测试者,使对方误以为是人类所答,那么该AI就视为通过测试。
而这次,GPT-4.5不仅轻松达标,更将“蒙混过关”的概率提高至73%,这一结果无疑刷新了业内对语言模型智能水平的认知。
与前代相比,拟人化表现跃升明显
值得一提的是,这项测试结果也为我们提供了对比视角。就在此前的评估中,GPT-4o(GPT-4.5的前一代版本)在图灵测试中的“人类判断率”仅为21%。从21%跃升至73%,不仅是一次技术迭代,更体现出GPT-4.5在语言组织、情绪模拟、逻辑推理以及语境适配等多个层面都更贴近人类思维模式。