GPT-4.5被评为“类人智能”：图灵测试中人类辨识率达73%

2025-04-02 15:30:08

小大

用微信扫描二维码
分享至好友和朋友圈

扫描到手机×

参与评论()人

军事APP 头条APP

人工智能与人类之间的界限，正变得越来越模糊。

近日，加州大学的一个研究团队公布了一项令人震惊的研究成果：他们对当前最先进的语言模型GPT-4.5进行了图灵测试，结果显示，该模型在模拟人类行为方面表现出惊人的“拟人化”能力。数据显示，在受试者的判断中，有多达73%的概率将GPT-4.5误认为是“真人”，也就是说，在与它对话时，大多数人难以分辨出它其实是一台AI。

加州大学宣布GPT-4.5通过了图灵测试被判定七成是人类

图灵测试再成焦点，GPT-4.5脱颖而出

图灵测试并非新鲜概念，其最初由英国计算机科学家艾伦·图灵在1950年的论文《计算机器与智能》中提出，是评估人工智能是否具有人类思维特征的重要方式。如今的标准测试时长一般设定为五分钟，参与测试的AI需应对由人类测试者提出的一系列问题。如果其回答有30%以上能够成功“骗过”测试者，使对方误以为是人类所答，那么该AI就视为通过测试。

而这次，GPT-4.5不仅轻松达标，更将“蒙混过关”的概率提高至73%，这一结果无疑刷新了业内对语言模型智能水平的认知。

与前代相比，拟人化表现跃升明显

值得一提的是，这项测试结果也为我们提供了对比视角。就在此前的评估中，GPT-4o（GPT-4.5的前一代版本）在图灵测试中的“人类判断率”仅为21%。从21%跃升至73%，不仅是一次技术迭代，更体现出GPT-4.5在语言组织、情绪模拟、逻辑推理以及语境适配等多个层面都更贴近人类思维模式。

研究人员指出，GPT-4.5在测试过程中展示出极高的“自然对话”能力，能够根据语境调整语气、理解复杂语义关系，甚至在某些情况下模仿出带有情感色彩的表达，让人误以为屏幕背后真的坐着一个有血有肉的对话者。

这还是AI吗？人机界限正在模糊

从测试结果来看，我们不得不正视一个新现实：当前乃至未来的很多线上对话对象，可能并非真正的人类，而是一个训练得足够拟人的AI。

在实际应用层面，这样的语言模型已经被广泛应用于客户服务、内容创作、语音助手等场景。而随着技术愈发成熟，AI与人的互动将更加密切，也将引发关于伦理、隐私、沟通信任等问题的新一轮讨论。

加州大学的这项研究或许只是一个起点，但它带来的震撼已足够让整个科技界重新思考人与AI的未来关系。

正如那句经常被引用的经典所言：“你永远不知道，屏幕另一端的，是人，还是程序。”在GPT-4.5身上，这句话变得更加真实和不可忽视。

(责任编辑：张佳鑫)

关键词：

关闭

GPT-4.5被评为“类人智能”：图灵测试中人类辨识率达73%

相关报道:

《雷曼》或将迎来新生？育碧制作人确认未来项目已交由可靠团队打造

《博德之门3》迎来史低优惠：现价223.5元，特惠持续至9月9日

《绝地潜兵2》最新更新上线进攻虫巢总部

《地狱即我们》媒体评分出炉：均分79分，9月5日正式发售

《赛博朋克2077》或迎新内容 CDPR暗示9月4日将有重要公告

小岛工作室十周年庆典定档9月23日：回顾十年历程，未来新作或将揭晓

《复仇者联盟5》曝光：规模超越以往，毁灭博士成最大威胁

《流放之路2》迎版本热潮：Steam在线峰值突破35万，玩家热情再度点燃

《空洞骑士：丝之歌》发售时间与售价公布：9月4日晚正式解锁，多平台同步上线

暴雪回应玩家呼声：《守望先锋2》“noob”不再列入封禁范围

IGN票选2025年最期待游戏《羊蹄山之魂》远超其他3A游戏

《明末：渊虚之羽》近期口碑回升：Steam好评率升至七成

PS6掌机或采用Switch式底座模式性能超PS5定价更亲民

《失落之魂》正式发售同步推出试玩版但存档不可继承

10月2日上线！《羊蹄山之魂》官宣制作完成进场压盘

华为首超苹果夺全球智能手表出货量第一中国厂商全面崛起

微软扩大云游戏服务 XGP基础用户也能畅玩PC大作

《赛博朋克2077》发售教训：CDPR承认过度依赖线上宣传忽视玩家真实反馈

《生化危机9》恐怖感全面升级将带来超越《村庄》的极致体验

《宝可梦传说 Z-A》新MEGA公布摔角鹰人强化参战

《赛博朋克2077》成Switch2第三方销量黑马实体版占比超七成

如龙工作室宣布9月24日举办RGG发布会新作情报或将揭晓

《生化危机9》或将推出试玩版卡普空欲借此扩大影响力

《战地6》PC配置公布：最低2060起步，4K畅玩推荐4080

今日热点

媒体解析阅兵看点：新式步枪首次亮相编组更具实战化

Lisa新舞台造型被质疑和疯马秀有什么区别？

《生化危机9》或将推出试玩版卡普空欲借此扩大影响力

沧海桑田：一百年前的古建筑老照片

GPT-4.5被评为“类人智能”：图灵测试中人类辨识率达73%

相关报道:

今日热点

媒体解析阅兵看点：新式步枪首次亮相 编组更具实战化

Lisa新舞台造型被质疑和疯马秀有什么区别？

《生化危机9》或将推出试玩版 卡普空欲借此扩大影响力

沧海桑田：一百年前的古建筑老照片

媒体解析阅兵看点：新式步枪首次亮相编组更具实战化

《生化危机9》或将推出试玩版卡普空欲借此扩大影响力