admin管理员组

文章数量:1531920

2024年6月1日发(作者:)

关于图灵测试的调查研究

计算机组成原理调研报告

摘要:

图灵测试(又称“图灵判断”)是图灵提出的一个关于机器人的著名判断原则。所谓图

灵测试是一种测试机器是不是具备人类智能的方法。近期科技界计算机通过图灵测试的新

闻尽管已经被证明是一个娱乐宣传,但由此事引起的广泛关注却不难看出图灵测试在计算

机行业中的“人气”。本调研报告旨在理性地分析图灵测试与计算机智能的一些关系。

关键词:

图灵测试,计算机智能,质疑

正文:

一、图灵测试的提出与意义

图灵测试是测试人在与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如

键盘)向被测试者随意提问。问过一些问题后,如果被测试者超过30%的答复不能使测试

人确认出哪个是人、哪个是机器的回答,那么这台机器就通过了测试,并被认为具有人类

智能。

图灵还为这项测试亲自拟定了几个示范性问题:

问: 请给我写出有关“第四号桥”主题的十四行诗。

答:不要问我这道题,我从来不会写诗。

问:34957加70764等于多少?

答:(停30秒后)105721

问:你会下国际象棋吗?

答:是的。

问:我在我的K1处有棋子K;你仅在K6处有棋子K,在R1处有棋子R。轮到你走,

你应该下那步棋?

答:(停15秒钟后)棋子R走到R8处,将军!

图灵指出:“如果机器在某些现实的条件下,能够非常好地模仿人回答问题,以至提问

者在相当长时间里误认它不是机器,那么机器就可以被认为是能够思维的。”

从表面上看,要使机器回答按一定范围提出的问题似乎没有什么困难,可以通过编制

特殊的程序来实现。然而,如果提问者并不遵循常规标准,编制回答的程序是极其困难的

事情。例如,提问与回答呈现出下列状况:

问:你会下国际象棋吗?

答:是的。

问:你会下国际象棋吗?

答:是的。

问:请再次回答,你会下国际象棋吗?

答:是的。

你多半会想到,面前的这位是一部笨机器。如果提问与回答呈现出另一种状态:

问: 你会下国际象棋吗?

答:是的。

问:你会下国际象棋吗?

答:是的,我不是已经说过了吗?

问:请再次回答,你会下国际象棋吗?

答:你烦不烦,干嘛老提同样的问题。

那么,你面前的这位,大概是人而不是机器。

时间回到1950年10月,图灵在这个时间发表了一篇题为《机器能思考吗?》的论文。

在这篇论文里,图灵第一次提出“机器思维”的概念。他逐条反驳了机器不能思维的论调,

做出了肯定的回答。他还对智能问题从行为主义的角度给出了定义, 这就是著名的“图灵

测试”。 图灵预言,到2000年将会出现足够好的电脑,能够在不超过7成人的长达5分

钟的提问中全部回答正确。 不过事实上,虽然21世纪曾有多人声称自己研究的人工智能

已经通过图灵测试,但最终都证明只是一些欺骗性的小把戏而已。

要分辨一个想法是“自创”的思想还是精心设计的“模仿”是非常难的,任何自创思

想的证据都可以被否决。图灵试图解决长久以来关于如何定义思考的哲学争论,他提出一

个虽然主观但可操作的标准:如果一台电脑表现(act)、反应(react)和互相作用(interact)

都和有意识的个体一样,那么它就应该被认为是有意识的。随着这篇论文一起被提出的图

灵测试也被默认为能够检测这一点的好方案。

二、通过图灵测试的手段与对图灵测试的质疑

就在4天前也就是2014年6月12日,伦敦著名的皇家社会科学院召开了 2014 年

图灵测试大会,超级计算机尤金·古斯特曼成为了有史以来首次通过图灵测试的机器。尤金

是在俄罗斯圣彼得堡开发的电脑程序,它模仿了一个 13 岁的男孩。尤金的创造者是俄罗

斯人弗拉基米尔·维瑟罗夫和乌克兰人尤金·杰姆琴科。

这一消息震惊了几乎所有全球所有对计算机科学稍微有些了解的人,但很快就有理智

的计算机科学家指出了这条消息的几大漏洞。

1. 尤金不是超级计算机,它只是一个聊天机器人。它作为程序的宗旨就是模仿人类对

话。

2. 尤金的创造者很狡猾,他告诉人们尤金是一个「13 岁的乌克兰男孩」,也就是说,

尤金的母语不是英语,知识量也有限,从而打消了人们的许多疑问。

3. 图灵测试的「规则」一直在变。问题是,原始的图灵测试根本就不是这么一回事。

图灵本人在论文中称,「50 年内人们将可以编出这样的程序,即经过 5 分钟测试后,30%

测试者都会觉得回答问题的是真人,而不是机器」。但「30% 测试者」和「5 分钟测试」

并不是图灵测试的标准。

4. 要证明你做出了什么成果,不应该找一群普通人而应该让相关专家来评定这项成果。

有人声称制造了核聚变、或者治愈了癌症,首先要经历的必然是科学论文以及科学界的评

定,而不是在媒体上宣传。

最终这个消息很快被证明是娱乐宣传,在此期间多名计算机专家在表对这个消息的不

信任的同时也表达了随着编程语言发展对图灵测试本身的不信任。谷歌工程总监库兹威尔

在表示自己的质疑“尤金无法一直保持对话的顺畅性,他会不断重复自己的话,还经常使

用聊天机器人典型的无推断型回应方式。” 的同时也引用了自己在所著书中的观点“由于

图灵测试的定义因人而异,因此能够通过图灵测试的机器不会在一夜之间出现,而是会经

历一段时期。一些号称通过图灵测试的机器难免被有识之士揭穿,其中可能也包括我自己。”

纽约大学认知科学教授加里·马库斯 撰文称,此次测试并没有硬件上的创新,只是借助了

巧妙的软件来完成。他指出,聊天机器人经常使用幽默手段绕过一些难以理解的问题,以

此误导测试者。 “未经训练的测试者可能会发生误判,可一旦你理解了系统的工作模式,

接连不断的误导和偏差就会变得显而易见,甚至令人恼火。”

显而易见,专家表示的对通过图灵测试的质疑主要集中在两点:一是认为图灵测试的

裁判应该由专业人士而不是像最初的图灵测试一样有普通人担任,因为专业人士能够更敏

锐地找出计算机语言编写中的漏洞,能够通过简单的对话直指问题核心,而不是像普通人

一样只会在测试中随机选取问题,从而大幅增大被计算机欺骗的概率;二是随着时间的推

移,高级语言和计算机技术的发展,图灵测试也从最早的幻想成为了一个似乎近在眼前的

可能,有些程序设计者为了成名把图灵测试当作了一个噱头,运用上心理学博弈学的一些

知识在问答中使用一些技巧,比如:

1)用短句短词进行模棱两可的回答;

2)根据裁判的社会习俗生活环境,进行相关处理;

3)对问题进行反问式确认,比如裁判问到"你是从俄罗斯来的吗?",那么反问策略则

是“你为什么不确定我是从俄罗斯来的?”。采用这种方式对抗裁判,往往是杀手锏。这种

反问式策略最初是心理咨询上的治疗手段,目前已被大量使用在图灵测试的游戏上;

4)当人类回答的过于详细反而会被误认为是机器,参赛者可以抓住这一点引导裁判进

行详细式提问,然后再进行模棱两可式的回答,而这种情况下,真正人类回答的反而更机

械更像机器了。

而这些已经是人与人之间的智力博弈,所能用到的计算技术只是简单的脚本以及自己

设计的数据库而已,和真正的人工智能没有多大关系,谁都可以做。 这些伪人工智能由于

无法给出真正正确定的答案,所以他们只能给出一个模棱两可的伪装的答案,而真正的人

工智能则应当给出真正的答案,让人感受到机器的灵魂存在,而不是给人造成迷惑,这与

图灵最初的设想早已背道而驰。

三、图灵测试存在的缺陷

1980年,哲学家西尔勒提出了名为“中文房间”的假想实验,模拟图灵测试,用以反

驳强人工智能观点。

西尔勒使用了“中文房间”的概念来论证它不具备。首先摹想,问题是用中文而不是

用英文来讲,这显然是非本质的改变。把这一特殊演习的电脑程序的所有运算用英文作为

一组指令提供给用中文符号进行操作的计算员;完全不懂中文的西尔勒想象自己被锁在一

个屋子里操纵这一切。代表这一问题的一连串符号通过一条很小的缝隙被送进这屋子,不

允许任何其它来自外头的消息漏进去。最后当所有的操作完成后,程序的结果又通过这条

缝隙传递到外面来。由于所有这些操作都是简单地执行程序的算法,这个最终程序的结果

简单地为中文的“是”或者“非”,给出了关于以中文提的问题的正确答案。但是,西尔勒

清楚地表明他根本不识中文,这样他对该问题讲的是什么没有任何哪怕是最浅的概念。尽

管如此,只要正确地执行了那些构成算法的一系列运算——已给他用英文写的这一算法的

指令,他就能和一位真正理解这一问题的中国人做得一样好。由此可见,仅仅成功执行算

法本身并不意味着对发生的有丝毫理解,锁在“中文房间”里的西尔勒不理解任一问题的

任意一个词。

因此,仅仅执行程序的电脑本身并不具有智慧,虽然人们的共识是用通过图灵检验来

定义智慧,尽管要制造出满意地通过这种检验的机器还是比较遥远的事,但是即使它真的

通过了,我们还是不能断定其真有理解能力,西尔勒中文房间的理想实验表明用图灵检验

来定义智慧还是远远不够充分的。

但是,这一行为的观点是否实际上为判断一个对象中存在精神的品质提供了一族合理

的判据?人们对图灵检验的合适性的态度似乎部分地依赖于对科学技术如何发展的期望,

所以检验者应该从电脑回答的性质对在这些回答背后的意识存在真正地感到信服,尽管它

可能是非常异样的一种意识。这也就是迄今制造的所有电脑系统所明显缺乏的某种东西。

参考文献:

[1]百度百科——图灵测试:/view/?fr=aladdin

[2]新浪科技——谷歌工程总监:计算机并未通过图灵测试:

/i/2014-06-12/

[3]网易数码——计算机通过图灵测试 真相只是娱乐宣传:

/14/0611/12/

本文标签: 图灵测试机器回答计算机