GPT-4.5被评为“类人智能”：图灵测试中人类辨识率达73%

2025-04-02 15:30:08

小大

用微信扫描二维码
分享至好友和朋友圈

扫描到手机×

参与评论()人

军事APP 头条APP

人工智能与人类之间的界限，正变得越来越模糊。

近日，加州大学的一个研究团队公布了一项令人震惊的研究成果：他们对当前最先进的语言模型GPT-4.5进行了图灵测试，结果显示，该模型在模拟人类行为方面表现出惊人的“拟人化”能力。数据显示，在受试者的判断中，有多达73%的概率将GPT-4.5误认为是“真人”，也就是说，在与它对话时，大多数人难以分辨出它其实是一台AI。

加州大学宣布GPT-4.5通过了图灵测试被判定七成是人类

图灵测试再成焦点，GPT-4.5脱颖而出

图灵测试并非新鲜概念，其最初由英国计算机科学家艾伦·图灵在1950年的论文《计算机器与智能》中提出，是评估人工智能是否具有人类思维特征的重要方式。如今的标准测试时长一般设定为五分钟，参与测试的AI需应对由人类测试者提出的一系列问题。如果其回答有30%以上能够成功“骗过”测试者，使对方误以为是人类所答，那么该AI就视为通过测试。

而这次，GPT-4.5不仅轻松达标，更将“蒙混过关”的概率提高至73%，这一结果无疑刷新了业内对语言模型智能水平的认知。

与前代相比，拟人化表现跃升明显

值得一提的是，这项测试结果也为我们提供了对比视角。就在此前的评估中，GPT-4o（GPT-4.5的前一代版本）在图灵测试中的“人类判断率”仅为21%。从21%跃升至73%，不仅是一次技术迭代，更体现出GPT-4.5在语言组织、情绪模拟、逻辑推理以及语境适配等多个层面都更贴近人类思维模式。

12 全文共 2 页下一页

关键词：

关闭

GPT-4.5被评为“类人智能”：图灵测试中人类辨识率达73%

相关报道:

小岛秀夫担忧《死亡搁浅2》评价太好坦言"伟大作品往往初遇冷"

《剑星》女主穿红旗袍露大白腿

《忍者龙剑传4》被评17+成人级：某些女角穿着暴露

《心之眼》玩家均分仅3.5，褒贬不一：被BUG和卡顿拖累的“前GTA制作人之作”

《虚实万象》试玩亮相：科幻射击与“小萝莉解谜”组合惊艳全场

《艾尔登法环》成美国玩家“最上头”游戏，每周平均沉迷20小时登顶榜首

《生化危机9》主角身份落定：里昂非主角，格蕾丝才是核心人物

《生化危机9》首批细节和新截图可自由切换第一/第三人称、新的追踪者

微软展望Xbox 25周年纪念：菲尔·斯宾塞称将以跨平台战略迎接全新未来

《沙丘：觉醒》媒体评分出炉，M站均分79分被誉为新一代MMO标杆

PC独占结束《波比的游戏时间》第四章6月25日登陆全主机平台

《剑星》Steam版试玩档案不继承？玩家亲测解决方法曝光，操作简单零风险

《剑星》强势登陆Steam首日登顶热销榜，在线人数突破7万大关

任天堂80美元新作定价引爆争议，卡普空谨慎回应“不盲目跟涨”获玩家好评

《上古卷轴6》公布七年毫无动静玩家调侃再等三年也不奇怪

《纪元117：罗马和平》DLC计划曝光：三大扩展内容将于2026年陆续推出，首年季票全收录

《匹诺曹的谎言》DLC劝退玩家？难度过高引发争议官方回应将调整平衡

Switch 2席卷西班牙：首周销量破10万创下主机销售新纪录

索尼再掀裁员风暴：《往日不再》开发团队Bend Studio裁员近三成，服务型项目宣告终止

《怪物猎人：荒野》免费更新第二弹6月末上线海龙或参战

Steam喜加一！免费领取派对游戏《WHAT THE PAK?!》

《最终幻想8》重制恐成泡影？配音演员发声打破幻想

GOG正式上线一键模组安装功能，发力用户创作生态对标Steam创意工坊

《战争机器：重装上阵》官宣登陆PS5，6月开启全平台联机测试，支持4K/120帧与UE5新模式

今日热点

以伊对攻＂半斤八两＂美是否进一步介入是真正变量

Lisa新舞台造型被质疑和疯马秀有什么区别？

《使命召唤：黑色行动7》正式公开！

沧海桑田：一百年前的古建筑老照片

GPT-4.5被评为“类人智能”：图灵测试中人类辨识率达73%

相关报道:

今日热点

以伊对攻＂半斤八两＂ 美是否进一步介入是真正变量

Lisa新舞台造型被质疑和疯马秀有什么区别？

《使命召唤：黑色行动7》正式公开！

沧海桑田：一百年前的古建筑老照片

以伊对攻＂半斤八两＂美是否进一步介入是真正变量