​GPT-4通过图灵测试 GPT-3.5也已达到通过标准

GPT-4通过图灵测试 GPT-3.5也已达到通过标准

【TechWeb】6 月 16 日消息,据外媒报道,OpenAI 去年 3 月份推出的大语言模型 GPT-4,在研究人员所进行的实验中的表现虽然还不及人类参与者的平均水平,但已达到了图灵测试的通过标准,在 GPT-4 之前推出的 GPT-3.5,在最新的测试中也达到了通过标准。

GPT-4 通过图灵测试,是源自加州大学圣地亚哥分校的研究人员所进行的实验,他们在实验中选定参与实验的还有上世纪 60 年代的人工智能系统 ELIZA,另有一组人类参与者,研究人员让 500 人与他们进行 5 分钟的对话,然后判断对话的是人还是人工智能。

而最终的结果表明,GPT-4 在 54% 的时间里被误认为是人类,GPT-3.5 则是在 50% 的时间里被误认为是人类,没有大语言模型或神经网络支持的 ELIZA,则是在 22% 的时间里被误认为是人类。

GPT-4 和 GPT-3.5 在实验中的表现虽然不及人类参与者 67% 的平均水平,但根据现在普遍认同的有 30% 回答被测试者误认为是人类,就算通过测试的标准,它们就都通过了图灵测试。

不过,由于加州大学圣地亚哥分校的研究人员在进行实验时,OpenAI 尚未宣布新一代的旗舰模型 GPT-4o,可以利用语音、视频和文本信息进行实时推理的这一模型,如果参与测试,被误认为人类的结果可能就会更高。

图灵测试源自被称为人工智能之父的英国数学家、逻辑学家艾伦 · 麦席森 · 图灵,他在 1950 年的论文《计算机器与智能》中提出,测试的流程是由一名测试者写下自己的问题,随后将问题以纯文本的形式发送给另一个房间中的一个人与一台机器,测试者根据他们的回答来判断哪一个是真人,哪一个是机器,所有参与测试的人或机器都会被分开,这个测试旨在探究机器能否模拟出与人类相似或无法区分的智能。

除了图灵测试和在人工智能上的贡献,图灵为广大科学领域的关注者所熟知还有图灵奖,由美国计算机协会(ACM)在 1966 年设立的这一奖项,旨在奖励对计算机事业作出重要贡献的个人,是计算机领域的国际最高奖项,被誉为 " 计算机界的诺贝尔奖 ",一般每年仅颁发给一人,清华姚班和智班的创立者姚期智,就是 2000 年的获得者。(海蓝)



同类推荐

​LOL:圣枪游侠卢兮夜皮肤详解

​LOL:圣枪游侠卢兮夜皮肤详解

LOL:圣枪游侠卢兮夜皮肤详解 卢锡安这个英雄自从推出以来就受到了广大英雄联盟玩家的热爱,经过许多版本的更迭,如今仍是许多玩家的心头爱。对于一些新接...

​电子商务师证书怎么获得?

​电子商务师证书怎么获得?

电子商务师证书怎么获得? 电子商务师 中国电子商务师职业资格(水平)证书即中国电子商务师证书,目前分为三个等级:初级、中级、高级。 中国电子商务师...

​定了!瑞金民用机场命名为赣州瑞金机场

​定了!瑞金民用机场命名为赣州瑞金机场

定了!瑞金民用机场命名为赣州瑞金机场 近日,瑞金民用机场官方微信公众号“江西瑞金机场” 更新公众号简介 为“赣州瑞金机场”,大概率已批复命名为“赣...

​俄罗斯民族:土耳其族

​俄罗斯民族:土耳其族

俄罗斯民族:土耳其族 俄罗斯境内有11万土耳其族人。他们经历了几次移民潮:最初是俄土战争期间奥斯曼-土耳其俘虏的后代,而后形成了梅斯赫特土耳其人和后...

​黄磊,中国知名演员、导演和制片人

​黄磊,中国知名演员、导演和制片人

黄磊,中国知名演员、导演和制片人 黄磊,中国知名演员、导演和制片人,他以其出色的演技和多才多艺的才华在娱乐圈中崭露头角。除了在影视作品中的成功,...

​老式自行车横杠的设计初衷与意义

​老式自行车横杠的设计初衷与意义

老式自行车横杠的设计初衷与意义 在过去的几十年里,我们见证了自行车设计的演变。从最初的笨重的两轮车辆,到今天的轻便、现代的自行车,设计上的每一次...

​两性话题(一)

​两性话题(一)

两性话题(一) 男人女人无非就是床上那点事,性,自古至今,是男人和女人的热点! 对于性,有些人故作矜持,明明想聊却不张口,有些人闷骚,外表看似正儿...

​要吃正宗本帮菜 还得沪江香满楼

​要吃正宗本帮菜 还得沪江香满楼

要吃正宗本帮菜 还得沪江香满楼 上海本帮菜是指上海本地的传统菜肴,它是中国八大菜系之一的“沪菜”的重要组成部分。 上海本帮菜以鲜、香、甜、糯为特色...

热门排行

随机推荐