在机器人能否超过人这个问题上,人们最为在意的似乎是机器人是否能具有学习的能力。我们知道机器人是由人工智能程序操纵的,因此只要机器人不具备自学能力而是一切都按照事先输入的程序行事,人们就会因为一切都尽在自己的同类的掌控之中而获得安全感。因此,这次的AlphaGo战胜韩国围棋九段的故事里提到的AlphaGo的操作软件DeepMind具有所谓的深度学习的功能这一点就显得特别地惹眼。那么机器人到底能否具有学习的能力呢?为了回答这个问题,我们其实需要对于什么才叫能学习这个概念有比较清楚的认识。 本系列的前面两篇文章《功能性识别》和《动作模仿》对机器人根据几何及功能特征来识别对象及模仿人类的动作的潜力进行了探讨。其实,为了让机器人具备识别车子或萝卜的能力,最简单的办法还是预先输入相关的知识,诸如轮子的形状及运动特征和萝卜的物理化学特质等;甚至都可以通过事先输入的程序让能行走的机器人进行简单的烹饪作业。不过,事先输入的资料不可能适应无限变化的现实,因此如果要让机器人超过人就一定要让机器人具备学习的能力。所以,在本系列的前两篇文章中重点是从几个不同的方面来探讨机器人通过学习而具备一些我们人类所具有的基本能力的可能性。 谈到学习,人们在文明社会里最主要的一种学习方式应该是通过阅读进行学习。那么机器人是否能够通过阅读由人类的自然语言的文字写成的文章来进行学习呢?答案应该是可能的。 虽然机器人未必能欣赏得了莎士比亚和苏格拉底,但是让机器人通过阅读操作手册之类的读物而学会具体的技术是完全可能的。首先,有智能的扫描今天已经在实际运用中了,也就是电脑可以把平面印刷物上的文字扫描成诸如微软WORD这样的可编辑的文件。这表明当机器人阅读平面印刷物上的文字时,它所得到不仅仅是由墨点码成的图案,而是具有实际意义内涵的文章。 第二,前面在《功能性识别》一文中提到,用自然语言进行会话是目前人们努力开拓的机器人所具有的人工智能的一个方面。如果机器人能够用自然语言进行具有深度的复杂对话的话,那它一定能消化自然语言所表达的语义,因此它就一定能理解用自然语言写成的文章。换句话说,如果当你对一个机器人说,“把手举起来”,它就能按照你所说的举起它的上肢的话,那么从原理上说它就一定能按照书上写的“把手举起来”进行同样的操作。可见,从原则上来说理解书面意思与理解口头指令的难度基本上是一个量级范围内的(这一点从我们今天所拥有的可在语音与文字之间进行转换的软件所具有的功能上便可看出),只是理解书面的意思比进行口语对话要更加容易:一来因为对话是双向的,阅读只是单向的;二来因为语音比文字更加多变,而且一个字可以有不同的发音,不同的字也可以有相同的发音。 那么机器人对于文字的理解到底能达到什么程度呢?这一方面取决于人们在多大的程度上能将符合自然语法的语句翻译成符合正则语法的程序语言,另一方面还取决于人类的语言的语义到底在多大程度上能够被表达为具有实际意义的符合某种正则语法的机器语言。 用不着太复杂的逻辑论证我们就可以看出机器人不但能理解诸如“把手举起来”这样的简单肢体动作的指令,而且也能理解诸如“去把灯关掉”这样的涉及到多种行为的复合动作的指令。此外,机器人也应该不难理解 1 + 1 = 2,或 (a + b)(a + b) = a^2 + 2ab + b^2这样的数学公式的意思。但是,要让机器人通过阅读而理解牛顿定律 F = ma的意思则是一个很大的挑战,这将取决于人们是否可能让机器人了解什么是力(F)的概念,质量(m)的概念,以及加速度(a)的概念。 假设机器人能够完全阅读理解人类的(非文学非哲学的)科技性的文献,包括物理,化学,机械等等,那么原则上说,机器人就可以通过阅读人类现有的文献来掌握人类已知的科技工程知识。但是,那样就意味着机器人能够理解诸如质量,力,电阻等哲学物理及化学等各学科的概念。 如果人们无法让机器人完全理解各种抽象的物理的化学的或其它学科的概念,那么机器人就无法真正理解诸如牛顿定律F = ma这样的各种物理定律或各种化学反应式的实际意义,因而它们就无法自主地进行开创性的科学研究和发明,但是这并不等于说他们不能按照操作手册往装有蒸馏水的量筒中插入电极将水分解并收集所产生的氢气和氧气,也不等于它们不能阅读飞机设计的蓝图并根据其中的参数进行复杂的公式计算得出所需的结构强度来,同样不等于它们不能按照菜单上列出的原料去商店采购并回来制作各种料理。 所以,也许五十年,也许十年,也许一年,也许现在?我们在不久的将来可以看到会通过阅读平面书籍的文字来学习并按照书中的知识进行实践的机器人,至于它们阅读学习的潜力的极限在哪里,还有待进一步的探索。。。。。。 |