游戏
当前位置:游戏 > 新闻快报 > 电脑游戏新闻 > 正文

GPT-4.5被评为“类人智能”:图灵测试中人类辨识率达73%

GPT-4.5被评为“类人智能”:图灵测试中人类辨识率达73%
2025-04-02 15:30:08

人工智能与人类之间的界限,正变得越来越模糊。

近日,加州大学的一个研究团队公布了一项令人震惊的研究成果:他们对当前最先进的语言模型GPT-4.5进行了图灵测试,结果显示,该模型在模拟人类行为方面表现出惊人的“拟人化”能力。数据显示,在受试者的判断中,有多达73%的概率将GPT-4.5误认为是“真人”,也就是说,在与它对话时,大多数人难以分辨出它其实是一台AI。

加州大学宣布GPT-4.5通过了图灵测试 被判定七成是人类

图灵测试再成焦点,GPT-4.5脱颖而出

图灵测试并非新鲜概念,其最初由英国计算机科学家艾伦·图灵在1950年的论文《计算机器与智能》中提出,是评估人工智能是否具有人类思维特征的重要方式。如今的标准测试时长一般设定为五分钟,参与测试的AI需应对由人类测试者提出的一系列问题。如果其回答有30%以上能够成功“骗过”测试者,使对方误以为是人类所答,那么该AI就视为通过测试。

而这次,GPT-4.5不仅轻松达标,更将“蒙混过关”的概率提高至73%,这一结果无疑刷新了业内对语言模型智能水平的认知。

与前代相比,拟人化表现跃升明显

值得一提的是,这项测试结果也为我们提供了对比视角。就在此前的评估中,GPT-4o(GPT-4.5的前一代版本)在图灵测试中的“人类判断率”仅为21%。从21%跃升至73%,不仅是一次技术迭代,更体现出GPT-4.5在语言组织、情绪模拟、逻辑推理以及语境适配等多个层面都更贴近人类思维模式。

关键词:

相关报道:

    关闭
     

    Switch 2硬件规格公布 底座模式支持4K/60FPS

    25-04-03 10:47:01Switch 2硬件规格

    Switch 2首发游戏总结 绝大多数为第三方游戏

    25-04-03 10:42:27Switch 2首发游戏总结

    望梅止渴 任天堂在发布会前展示Switch2最新渲染图

    25-04-02 15:16:30望梅止渴 任天堂在发布会前展示Switch2最新渲染图

    《怪物猎人:荒野》第一次大型更新4月4日上线

    25-03-27 11:01:00《怪物猎人:荒野》第一次大型更新4月4日上线

    《Lynked: Banner of the Spark》将于5月22日多平台登录

    25-03-26 13:24:46《Lynked: Banner of the Spark》将于5月22日多平台登录

    《职业自行车队经理2025》Steam页面 6月6日发售

    25-03-26 13:19:11职业自行车队经理2025