GPT-4通过图灵测试 GPT-3.5也已达到通过标准

2025-09-04 07:09

GPT-4通过图灵测试 GPT-3.5也已达到通过标准

【TechWeb】6 月 16 日消息，据外媒报道，OpenAI 去年 3 月份推出的大语言模型 GPT-4，在研究人员所进行的实验中的表现虽然还不及人类参与者的平均水平，但已达到了图灵测试的通过标准，在 GPT-4 之前推出的 GPT-3.5，在最新的测试中也达到了通过标准。

GPT-4 通过图灵测试，是源自加州大学圣地亚哥分校的研究人员所进行的实验，他们在实验中选定参与实验的还有上世纪 60 年代的人工智能系统 ELIZA，另有一组人类参与者，研究人员让 500 人与他们进行 5 分钟的对话，然后判断对话的是人还是人工智能。

而最终的结果表明，GPT-4 在 54% 的时间里被误认为是人类，GPT-3.5 则是在 50% 的时间里被误认为是人类，没有大语言模型或神经网络支持的 ELIZA，则是在 22% 的时间里被误认为是人类。

GPT-4 和 GPT-3.5 在实验中的表现虽然不及人类参与者 67% 的平均水平，但根据现在普遍认同的有 30% 回答被测试者误认为是人类，就算通过测试的标准，它们就都通过了图灵测试。

不过，由于加州大学圣地亚哥分校的研究人员在进行实验时，OpenAI 尚未宣布新一代的旗舰模型 GPT-4o，可以利用语音、视频和文本信息进行实时推理的这一模型，如果参与测试，被误认为人类的结果可能就会更高。

图灵测试源自被称为人工智能之父的英国数学家、逻辑学家艾伦 · 麦席森 · 图灵，他在 1950 年的论文《计算机器与智能》中提出，测试的流程是由一名测试者写下自己的问题，随后将问题以纯文本的形式发送给另一个房间中的一个人与一台机器，测试者根据他们的回答来判断哪一个是真人，哪一个是机器，所有参与测试的人或机器都会被分开，这个测试旨在探究机器能否模拟出与人类相似或无法区分的智能。

除了图灵测试和在人工智能上的贡献，图灵为广大科学领域的关注者所熟知还有图灵奖，由美国计算机协会（ACM）在 1966 年设立的这一奖项，旨在奖励对计算机事业作出重要贡献的个人，是计算机领域的国际最高奖项，被誉为 " 计算机界的诺贝尔奖 "，一般每年仅颁发给一人，清华姚班和智班的创立者姚期智，就是 2000 年的获得者。（海蓝）

同类推荐

LOL：圣枪游侠卢兮夜皮肤详解

LOL：圣枪游侠卢兮夜皮肤详解

2025-09-04 07:06:49

LOL：圣枪游侠卢兮夜皮肤详解卢锡安这个英雄自从推出以来就受到了广大英雄联盟玩家的热爱，经过许多版本的更迭，如今仍是许多玩家的心头爱。对于一些新接...

包贝尔婚礼柳岩伴娘事件（网友纷纷开始质疑伴郎团的人品）

包贝尔婚礼柳岩伴娘事件（网友纷纷开始质疑伴郎团的人品）

2025-09-04 07:04:34

包贝尔婚礼柳岩伴娘事件（网友纷纷开始质疑伴郎团的人品）结婚本来是每个人一生中非常喜庆且重要的时刻，但由于婚闹习俗的出现，让很多人的婚礼现场都以...

伯克利音乐学院：世界排名第一的音乐学府

伯克利音乐学院：世界排名第一的音乐学府

2025-09-04 07:02:19

伯克利音乐学院：世界排名第一的音乐学府伯克利音乐学院是一所位于美国马萨诸塞州波士顿市的著名音乐学院，创立于1945年。该学院以其优秀的音乐教育及出色...

23岁女生小雪在工地当包工头:带领40多位家乡亲友，月收入上万元

2025-09-04 07:00:04

23岁女生小雪在工地当包工头:带领40多位家乡亲友，月收入上万元近日，一个23岁的女生小雪在建筑工地上担任包工头的新闻引起了广泛关注。小雪来自湖北农村，...

电子商务师证书怎么获得？

电子商务师证书怎么获得？

2025-09-04 06:14:15

电子商务师证书怎么获得？电子商务师中国电子商务师职业资格（水平）证书即中国电子商务师证书，目前分为三个等级：初级、中级、高级。中国电子商务师...

定了！瑞金民用机场命名为赣州瑞金机场

定了！瑞金民用机场命名为赣州瑞金机场

2025-09-04 06:12:00

定了！瑞金民用机场命名为赣州瑞金机场近日，瑞金民用机场官方微信公众号“江西瑞金机场” 更新公众号简介为“赣州瑞金机场”，大概率已批复命名为“赣...

俄罗斯民族：土耳其族

俄罗斯民族：土耳其族

2025-09-04 06:09:45

俄罗斯民族：土耳其族俄罗斯境内有11万土耳其族人。他们经历了几次移民潮：最初是俄土战争期间奥斯曼-土耳其俘虏的后代，而后形成了梅斯赫特土耳其人和后...

分享20种说“想你”的情侣表情包，很有诗意，情侣必备

2025-09-04 06:07:30

分享20种说“想你”的情侣表情包，很有诗意，情侣必备我是“想你了”表情包...

古埃及的职业哭丧人长什么样？眼泪为何是黑色的？

古埃及的职业哭丧人长什么样？眼泪为何是黑色的？

2025-09-04 06:05:15

古埃及的职业哭丧人长什么样？眼泪为何是黑色的？哭丧人是一个古老的行业，因其特殊性而“低调”地存在，直到今天还能在中国某些乡村的葬礼上看到他们的...

胡塞武装袭击美军舰，美英等国红海行动已失败

胡塞武装袭击美军舰，美英等国红海行动已失败

2025-09-04 06:03:00

胡塞武装袭击美军舰，美英等国红海行动已失败我们不得不说美国、英国等这些国家的红海行动难以实现，甚至已经失败！这是我们和大家所强调的一个问题。...

湖北枣阳人社局：持续推进“才聚荆楚百日千万”招聘行动

湖北枣阳人社局：持续推进“才聚荆楚百日千万”招聘行动

2025-09-04 06:00:45

湖北枣阳人社局：持续推进“才聚荆楚百日千万”招聘行动为促进就业民生工作质效双升，畅通线上求职通道，促进人岗精确匹配，枣阳市人社局运用“互联网招...

黄磊，中国知名演员、导演和制片人

黄磊，中国知名演员、导演和制片人

2025-09-04 05:58:30

黄磊，中国知名演员、导演和制片人黄磊，中国知名演员、导演和制片人，他以其出色的演技和多才多艺的才华在娱乐圈中崭露头角。除了在影视作品中的成功，...

老式自行车横杠的设计初衷与意义

老式自行车横杠的设计初衷与意义

2025-09-04 05:56:15

老式自行车横杠的设计初衷与意义在过去的几十年里，我们见证了自行车设计的演变。从最初的笨重的两轮车辆，到今天的轻便、现代的自行车，设计上的每一次...

两性话题（一）

两性话题（一）

2025-09-04 05:54:00

两性话题（一）男人女人无非就是床上那点事，性，自古至今，是男人和女人的热点！对于性，有些人故作矜持，明明想聊却不张口，有些人闷骚，外表看似正儿...

临金高速公路（建德-金华段）动工，以后来杭州省一个小时

临金高速公路（建德-金华段）动工，以后来杭州省一个小时

2025-09-04 05:51:46

临金高速公路（建德-金华段）动工，以后来杭州省一个小时记者江胜忠制图高薇本报讯 7月22日，作为浙江省扩大有效投资重大项目集中开工分会场，临金高速...

全屏壁纸｜Angelababy（杨颖）「第61期」

全屏壁纸｜Angelababy（杨颖）「第61期」

2025-09-04 05:49:31

全屏壁纸｜Angelababy（杨颖）「第61期」欢迎关注—数码生活1905...

人均为全国平均的45%，2020年西部百强县—广安市邻水县介绍

人均为全国平均的45%，2020年西部百强县—广安市邻水县介绍

2025-09-04 05:47:16

人均为全国平均的45%，2020年西部百强县—广安市邻水县介绍邻水县位于四川盆地东北部，是广安市下辖的县级单位。在2019年退出了全国贫困县行列，如今一年过...

天天酷跑克隆战有什么玩法技巧克隆战玩法攻略

天天酷跑克隆战有什么玩法技巧克隆战玩法攻略

2025-09-04 05:45:01

天天酷跑克隆战有什么玩法技巧克隆战玩法攻略天天酷跑即将迎来新版本，而新版也将上线新玩法克隆战，大家对克隆战的玩法一定很好奇吧，那么天天酷跑克隆...

要吃正宗本帮菜还得沪江香满楼

要吃正宗本帮菜还得沪江香满楼

2025-09-04 05:42:46

要吃正宗本帮菜还得沪江香满楼上海本帮菜是指上海本地的传统菜肴，它是中国八大菜系之一的“沪菜”的重要组成部分。上海本帮菜以鲜、香、甜、糯为特色...

乙基麦芽酚对人体的危害有多大？看完你就明白了

乙基麦芽酚对人体的危害有多大？看完你就明白了

2025-09-04 05:40:31

乙基麦芽酚对人体的危害有多大？看完你就明白了 #头条创作挑战赛# 有一款饮料里面的一个添加剂，能把人给惊呆了，别的饮料在它面前就是个弟弟，就是这个山...