且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《社会智能与综合集成系统》—第1章1.1节认知科学的发展

更新时间:2022-09-27 14:05:41

本节书摘来自异步社区《W社会智能与综合集成系统》一书中的第1章1.1节认知科学的发展,作者戴汝为 , 李耀东 , 李秋丹,更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章 认知、思维和智能
1.1 认知科学的发展
社会智能与综合集成系统
1.1.1 引 言
1993年,美国科学基金委员会在美国华盛顿组织了一次有30个大学约100位专家参加的认知科学家教育大会,专家在会上对认知科学形成了一致的看法:认知科学是研究人的智能(Intelligence在大陆和***分别翻译成“智能”和“智慧”)、其他动物智能和人工系统智能的科学,所研究的内容包括感知、学习、记忆、知识、语义、判断、语言、注意、意识和思维等。由于认知科学具有多学科交叉的特性,因此人们需要从心理学、计算机科学、神经科学、数学、语言学、哲学等不相同领域进行相关研究。当然,针对认知科学相关问题的研究状况,有些中外学者对认知科学和名字仍然持有不相同意见,例如John Searle在编写的《The Rediscovery of the Mind》(由麻省理工学院出版社出版)中就不认同认知科学的提法。

现在,专家、学者普遍认为物质的本质、宇宙的起源、生命的本质和智慧涌现是人们关注的4个基本问题,而认知科学、思维科学和机器智能等科学研究则与其中的智慧涌现紧密相关。

人的智能的研究牵涉脑功能、意识和思维等很复杂的问题。应该说人们的大脑神经系统的作用和人们的思维、意识是统一的;思维和意识是大脑物质运动的产物,是开放的复杂巨系统的体现。对于脑功能、意识和思维研究,中国、外国的评论认为有两条道路:一条是研究脑科学道路;另外一条是从心理学、机器智能和认知科学着手。看起来第一条道路是最根本的研究方式,但是这条路很长。在中国从20世纪80年代就已经开展思维科学研究。有学者认为,采用第一条道路对脑功能、意识和思维进行研究虽然会更加彻底,但是恐怕一时半会难以有阶段性成果,因此***还是依靠认知科学从思维角度来研究。

1.1.2 传统认知理论和现场认知理论
认知科学研究已经在许多国家发展起来,这里主要以传统认知理论和现场认知理论为线索来探讨认知科学。有些学者把20世纪50年代到20世纪70年代看作认知改变的时期。这个阶段,应用计算机仿真模型来研究认知过程的工作速猛发展,1950年由图尔应事先估计的机器智能的领域建立起来。以计算方法研究智能的工作对一些传统的学科起着决定性的影响:在心理学领域,新方法代替了美国心理学界50多年来占主要地位的行为主义典范;在语言学领域,把精致的计算模型和语言的生物学基础的影响结合的生成文法语言,取代了传统的结构语言;此外,哲学中的各个领域,如心智的哲学、认识论、语言哲学等也都受到了深刻的影响。在这个认知改变期间形成的一些统一的、起着中心作用的看法,现在称为传统观点。该传统观点的中心,是20世纪70年代末由Newell、Simon等人首先论述的物理符号系统的假设(PSSH)。该假设认为,任何一个系统,如果它能体现出智能,则它一定能够执行输入符号、输出符号、存储符号、复制符号、建立符号结构和条件性转移这6种功能。反之,任何系统如果具有上述6种功能,它就能够体现出智能。人们所做的大量传统认知或者机器智能的工作,就是在这个假设的推动下进行有关符号系统典型特性研究,从而形成认知符号理论。诺贝尔奖获得者、中国科学院外籍院士Simon,把这个阶段的认知科学概括为:

认知科学=认知心理学+机器智能

这阶段很少研究系统到底在什么样的环境中运行,以及在环境中运行系统的物理实现等问题。

在20世纪80年代和20世纪90年代,国外在认知科学的概念和研究技术方面取得了显著进步。因为以下三个方面的工作发展形成了对传统认知观点的挑战,由此导致认知科学的拓广。

从20世纪60年代起,开始走下坡路的人工神经网络(ANN)的研究也随着认知科学取得的进步而有所复苏。这主要体现在由Rumelhart提出的多层网络克服感知器的局限性和麦克安的并行分布处理(PDP)研究组的有关人工神经网络的工作上面。当应用计算机进行模拟时,这种简单的类似于神经的计算部件高度互相链接成网络,虽然不应该以规则作为基础结构表示,而以设置多层网络的隐节点的数目来实现非线性映射,它们却在模式识别和学习的能力方面显示出优越性。

第二方面的发展是认知神经科学的速猛发展。科学技术人员开始注意在脑方面以例子来说明认知的容量,以及怎么把现在的认知模型、精巧的实验设计和高技术、新技术组合起来进行神经定位,如正电子发射断层显像(PET)和事件关联电位(ERP)分析等很有效果,突破以前主要依靠被试者在进行实验中的口述报告的局限性。1994年Farch和Ratcliff的工作,就是这方面的一个很好的例子。

第三方面,人们从以前的研究中体会到,对于智能的研究应该从系统的角度来认识,而不能仅仅侧重于表示和判断等方法以及理论研究。20世纪90年代初,麻省理工学院年轻的教授***s发表了《没有表示的智能》和《没有智能的判断》等文章,这些文章应用了《控制论》中的一些构思,再次强调智能体(Agent)和环境互相进行作用的重要性;环境的复杂程度体现系统的复杂性并且按这个理论提供可以演示人工昆虫。在这些工作的影响下形成现场机器智能的新领域,使得人们更加注意到生态环境和社会环境在对认知过程研究中的重要作用。导致现场作用这种认知科学新的重点和现场认知的新观点,从而认为智能是人们或者智能体和环境进行动态交互的结果。

认知符号理论的提出解释了许多认知现象,并且专家、学者以这个为基础发展了许多类型的知识型系统,并形成了知识工程新领域。但是以Clancey为代表的一些学者认为符号理论不能够解释人的智能的行为;认知方式不是像计算机中间处理器那样操作,而是一种能够同时协调感觉—动作的机能;智能的行为是感觉—动作多次循环的结果,不是深刻的判断和决策;学习不是一个存储新程序的过程,而是一种能够同时协调感觉—动作的辨证机能;这种感觉—动作的神经结构和神经过程是在行动中创造的,是通过它们不断激活、竞争选择和重新组合得到的,是一种自组织机制。按现场认知的说法,人们和周围环境互相间的作用很重要,人们的行为模式是人们的内部神经互相间的作用和人与人之间、人与周围环境之间的作用,必须是存在于人及其所处环境中的知识和信息,就是说外部信息和内部信息交融在一起时,才能够产生智能的行为。

应该提到的具有启发意义的工作是,从系统的动态性能为根据对知觉进行解释的研究。美国加州大学伯克利分校的Freeman通过脑电图(EEG)对嗅觉进行研究时发现,当没有闻到气味的时候,大脑活动处于一种混沌状态,当与嗅觉有关的皮层和其他组织发生的响应互相协调配合,从而在脑电图上形成比较规则的图案时,才能闻到气味。这种从混沌到出现规则的模式是一种系统的特性。但是嗅觉行为归结后,脑电图上出现的又是混沌状态。他和同事在视觉中也发现了混沌的存在。所以Freeman做了这样的解释:知觉是不断发展的,它们不断地对自己重新的组织并且能够根据外部情况而改变。

在中国,钱学森把人和人工系统作为对象,很重视对思维研究。早在20世纪70年代末他们从现在科学技术体系出发,提出建立思维科学体系的主张。他们在《中国的社会科学》1980年第6期中提出:我们要把数学扩大为思维学,包括一部分我们已经研究的许多并且很有成绩的抽象思维,还要包括其他人的思维过程。这在外国已经逐步地引起重视,外国科学家是从搞机器人、机器智能这个方面想的。搞机器智能、机器人就要搞一个机器智能、机器人理论,他们称这个理论为认知科学。我们应用思维科学,更确切地说就是包括抽象思维,也包括各种思维过程、形象思维等。以后他们又论述思维科学基础学科——思维学的三个部分:抽象思维、微观法;形象思维、宏观法;创造思维、微观和宏观结合。创造思维才是智慧的泉源;抽象思维和形象思维都是手段。他们主张人和计算机结合,以达到人—机结合的综合智慧,并且指出思维和意识是大脑物质运动的产物,是开放的复杂巨系统的体现。实际上复杂性是开放的复杂巨系统的动力学;混沌是有顺序的基础。从这些论述中可以看到要研究知觉的形成,关键问题是研究大脑神经系统这个开放的复杂巨系统的动力学的特性。

1.1.3 高新技术是研究认知科学的有力工具
近20年来,高新技术的发展为认知科学研究提供了新的工具,如X射线计算机断层扫描(CT)、PET和核磁共振成像(MRI)等新技术,可以从体外没有损伤地、定量地、动态地从分子水平观察代谢物质或者药物等在人体内的活动和在疾病中的改变。医学成像,尤其是应用功能性核磁共振成像(FMRI)进行脑功能定位的方法,为观察决定思维神经系统打开了一个窗口。这种方法的根据是,存在磁场时许多原子的行为就像罗盘针,研究人员可以巧妙地操纵磁场使原子排列成行。如对试样施加无线电波脉冲对原子进行干扰,可以发现这些原子会发射出可以检测到的信号,这些信号是试样中特定原子数量和状态特有的。仔细调整磁场和没有线电波脉冲,可以得到有关的研究试样的特有信息。而FMRI能够检测加强的神经活动区里氧量增加情况的根据,是神经应用氧的方式。在神经活动激增的过程中正常的大脑要求助于厌氧代谢。事实上因为在正常的脑里能够实现这种形式的代谢,所以并不在乎可不可以存在丰富的氧。于是更加多的血进入脑部并且又不增加耗氧量,结果是使氧大量浓集在向活跃的神经中枢排放氧气的小静脉里。这使得被送到脑活动区的多余氧再排放到静脉里然后又回到全身循环里去。为什么氧在脑的FMRI中起着关键作用呢?诺贝尔奖获得者Pauling在1935年的发现中给出了答案。他发现输送氧并且使血液成红色的分子(称为血红蛋白)携带的氧量会影响红色的分子(称为血红蛋白)的磁特性,而FMRI能够检测这些很小的磁性改变。该特性引起科学技术人员注意并且在1991年证明能够检测到大脑中功能性诱发的血液充氧量改变的这种能力。

所以FMRI具有下面优点:(1)信息直接来自从功能上诱发的脑组织里的改变,即静脉里氧浓度的改变,不需要注入放射性的或者其他的任何物质;(2)能够提供每个受试者的解剖学信息和功能信息,所以使研究者能够对活动区进行精确的结构鉴定;(3)清楚度很好,可以判断出小到1~2mm的部分;(4)如加上适当的附件,能够及时地监视由血流量诱发的氧信号的改变;(5)几乎不会有什么应用风险。

近来美国的一个小组以猴子做实验,应用FMRI证实灵长类的视觉皮层可以组织成这样一些定位图,即当我们看到外部世界时,这些图反映出外部世界的空间组织。另外一个小组则通过对20位病人的测试,以立体成像技术确定大脑皮层上和移动、感觉、听觉和言辞对应的区域。

FMRI能够及时地监测氧信号能力表明有可能应用它来测量不相同脑区改变信息需要的时间。这样的信息对于搞清楚特定的脑区怎么协调成一个网络,从而产生行为问题,是很重要的。所以FMRI和PET等的配合应用,再加上应用图像处理技术,可以把一系列横截的核磁共振(NMR)图构建成立体的脑内部的结构和表面皮层,从而可以绘制脑功能图,为认知科学研究提供先进但是很昂贵的手段。

1.1.4 新认知理论的建立
在应用近代高技术、新技术为工具,进行脑功能定位研究的同时,人们也很关注建立新认知理论。Clancey以诺贝尔奖获得者爱的门提出的神经达尔文理论为基础,给出一种自适应神经系统观点,对知觉的产生做了猜测。他们认为,对于大脑来说,当有外界的输入或者大脑有输出时,大脑神经系统中被激活的最小单元是神经群,这种群由一些同时被激发和振动的神经细胞组成。神经群内的细胞可以从这个群自身的细胞或者其他神经群的细胞或者从外界获得输入。现在通过借助FMRI,应用立体成像技术,已经可以搜索到和移动、感觉、听觉和言辞对应的区域,并且由这个可以判断出大脑功能是分区的。当有刺激输入时,不相同功能区被激活的那部分神经结构称为映图;每个映图由许多个神经群构建而成;两个映图间的连接是通过一种称为再入的连接方式来实现的,这些连接随大脑神经细胞不断被激活而得到加强。不相同功能区的映图组成整体,如被激活,这种整体激活状态称为外界事物在内部的整体映射。大脑整体激活是一种动态的过程,它是通过长期、许多次的感觉——动作行为引发激活序列进行范畴化后相对稳定形成的,是动态的过程归结后的稳态结果。因为每个外界刺激仅仅是使大脑的一部分被激活,所以很自然地会提出这样的问题:到底哪些神经细胞组成神经群、哪些神经群组成映图,以及哪些映图组成整体映射?答案是根据达尔文的演化论,即这种组成都是通过选择机制来实现的,这种选择由一种称为价值范畴的机制来决定。这里的价值是指生物体具有的内部判断尺度,它和体内平衡系统,如脑干、下丘脑等具有很紧密的联系。上面论述的这些组合都通过自下而上长期不断地选择演化的过程。现在对“整体映射形成,就有知觉”这种说法,还有比较大争论。

基于神经科学和系统理论提出的上面的看法结果,引发了一场围绕着物理符号系统的假设,以Simon为代表的传统认知理论和以Clancey为代表的现场认知理论间的辩论。这场辩论给传统认知理论带来冲击,结果是现场认知理论越来越引起人们的兴趣和关注。如在这场辩论中美国《J . Human-Machine Studies》已经改变自己的学术方向。中国以钱学森为代表的一些学者近来在对开放的复杂巨系统研究过程中很重视系统和环境互相间的作用问题。他们认为人们的聪明、智慧和人们的思维能力具有很紧密的关系;大脑的思维能力是不断发展的,它们的发展在于:大脑这个开放的复杂巨系统具有很强的可以塑性,是活的,不是死的、不变的;实践的作用。Popper有三个世界说:第一世界是主观世界,即大脑;第二世界是我们说不以人们的意志为转移的客观世界;第三世界是人们实践累积知识信息世界,这当然是前人和他人实践的创造物。这样人们的思维能力是第一世界、第二世界和第三世界互相间的作用的成果。这是对现场认知的一种拓广。另外他还提出处理开放的复杂巨系统方法是从定性到定量的综合集成法(Metasynthesis);在这个基础上进一步提出人—机结合的主张,强调机器可以帮助人们,人们也可以不断地改进机器。通过从定性到定量的综合集成法,达到集智慧大成,形成自己学术思想和体系。

本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。