人工智能及其应用简介
刘以栋
当今世界,人工智能是一个热门话题,有人甚至预言以后可以娶一个机器人做老婆,这无异于天方夜谭。
出于对人工智能的兴趣,我自己也去读了一些人工智能的入门书。这是我人工智能读书报告第一篇,以后会有人工智能不同领域的读书报告。我自己不是做人工智能方面工作,所以只是编译了这篇科普文章,不到之处请谅解。
人工智能本身不是一个新概念。早在1956年夏天,一帮科学家就在达特茅斯大学提出了计算机的推理能力功能。距今已经60多年。
人工智能简单的来说包括三个部分,接受信息,处理信息和做出行动。当然,这其中任何一部分都可以是人工智能的一个研究领域。接受信息包括语音识别,模式识别,计算机视觉等。处理信息就是计算机的推理能力,最有名的例子就是下围棋的阿法狗(AlphaGo)。 行动部分的例子包括机器人和自动驾驶车。
在讨论人工智能以前,让我们先复习一下人的七种智能。
视觉空间智能(Visual-Spatial Intelligence)
周围环境辨别能力是任何运动机器人都需要掌握的能力。自动驾驶车和自动吸尘器都需要看到周围的情况。吸尘器要求精度低。人工智能在这方面只能达到中等水平。
身体运动智能 (Bodily Kinesthetic Intelligence)
外科医生和舞蹈演员需要调整身体姿势来完成动作。人工智能可以辅助医生做手术。机器人需要在人的指令下操作。这方面人工智能可以达到中高水平。
创造智能 (Creative Intelligence)
创造智能包括新的想法,新的音乐篇章,发现新的模式,新的发明等。人工智能可以模仿人的行为,但是它自己不能有发明创造。人工智能在这方面的潜力是零。
人际交往智能 (Interpersonal Intelligence)
人和人之间的相互交流,譬如会议上或者电话上交流信息等,不是人工智能所长。人工智能可以根据关键词回答简单问题,但是人工智能不能理解整个句子。这个方面人工智能只能达到低中水平。
内心自省智能 (Intrapersonal Intelligence)
一个人通过反省,发现自己的兴趣和专长,然后设定自己的奋斗目标,是人类特有的能力。人工智能在这方面的潜力是零。
语言智能 (Linguistic Intelligence)
语言交流能力,包括听懂对方讲话,或者读懂对方的信函,然后通过思考,作出回答。人工智能一般不能听懂对方讲话,也不能读懂书信,更不要说根据对方要求做出回答了。人工智能在语言交流方面只能达到初等水平。
逻辑数学智能 (Logical - Mathematical Intelligence)
进行数学运算,探索模式,寻找规律是人工智能所长。人工智能在这方面可以达到高级水平。
不管我们是否喜欢人工智能,人工智能已经进入了我们生活中的方方面面。
我们打字时,人工智能经常给我们改错。有的时候,人工智能提出改正要求,等我们确认。有的时候,人工智能来不及等我们确认,自己做决定。譬如,如果我们开车时,前面有障碍,人工智能可以紧急刹车。人工智能反应比人快。
人工智能也可以使我们工作中的许多事情自动化。自动取款机应该算人工智能的一种形式。
自动化可以取代我们工作中的无聊重复部分,使得我们的工作更有趣。我们去工作,挣钱是一部分原因,从工作中取得的满足感是另一部分原因。自动化还可以提高工作效率,增加工作环境的安全性。
人工智能在医疗方面也有许多应用。人工智能医疗仪器可以戴在身上,这样可以收集长期数据,监督病人情况。人工仪器也可以增加人的体能,人可以通过穿着一种机器人(Exoskeleton, 外骨骼),这样可以跑得更快,负重更多 …..
机器人护理有它的两面性。一方面,机器人做事可能更客观,另一方面,人是有感情的。机器人不会提供同情和理解。
人工智能在人和人之间的交流方面也有帮助。机器人在文字以外,又增加了表情包。机器人可以做自动翻译,Google 的翻译就不错。
机器人在交流领域的新的突破是身体语言。人跟人交流时,除了语言表达以外,还有身体语言。机器人可以捕捉到人的身体语言,譬如姿势,头的动作,面部表情,眼睛接触和手势等,帮助理解人的意图。我个人认为,身体语言在中国不是很重视,但是我们确实不可忽视身体语言。
人工智能的发展包括两个大的领域:软件方面发展起来的人工智能和硬件方面发展起来的人工智能。
大数据,机器学习都属于人工智能在软件方面的发展。
我们这个时代被称为信息时代并不仅仅是我们有很多数据,而是因为我们在分析数据方面达到了一定的成熟度,从而使得我们可以从数据中提取有用的信息。 谷歌 (Google), 亚马逊(Amazon),苹果,脸书和微软是美国5个市值最高的公司,其主要原因是它们的商业模式都是建立在数据上面。
数据是新时代的石油。石油不能被直接被用来做化工制品,它必须先经过提炼。同样,数据在使用前,必须做相应的处理。
数据处理可以包括下面的相关步骤:
数据变换(Transforming)。改变数据的面貌。数据变换可以指不同的形式,但是其主要形式就是把数据按矩阵形式排列。譬如,你去商店购物,商店把每个顾客归在一行,然后每列是购买的物品数量和价格。
数据净化(Cleansing)。改正不完美的数据。不同的数据收集方法会有不同的数据问题,譬如数据缺失,数据值不合理和错误数据等。譬如,网上有的物品和服务评论可能是假的,或者是朋友写的,或者是竞争对手写的。根据这些不可靠的数据,可能会得出错误的结论。数据净化就是要把不可靠数据去掉。
数据检查(Inspecting)。验证数据。虽然计算机可以在数据分析中起很大作用,但是数据分析很大程度上仍然是人的工作。人很容易识别模式,并发现异常数值,譬如客户年龄小于10岁或者大于90岁。
数据造型(Modeling)。掌握数据里不同因素的关系。通过统计方法,发现客户购买不同物品之间的关系。譬如,我们去亚马逊买东西时,它会推荐相关产品。
数据分析在人工智能领域至关重要。业内人士认为,人工智能直到现在才开始腾飞,其主要原因是数据质量和数据来源的提高。
数据分析的最高层次是机器学习。机器学习的中心思想是,在事先没有已知算法的情况下,机器通过分析数据,用数学公式表达现实世界。机器学习让我们可以用未知的数学函数来表达复杂的现实世界。而这个复杂的数学函数,是机器的内部算法通过数据自己学会的。
机器学习过程完全是一个数学逻辑过程。它通过数学形式把输入和输出联系起来。机器学习完全没有理解算法学到了什么东西,而仅仅是内部算法把输入和输出建立起一个函数关系。所以,机器学习过程也是一个机器训练过程。
想象一下我们教孩子学习。我们教孩子认识什么是树,然后告诉孩子树的结构,形状,并让孩子看很多树的图片,这样孩子就知道树是什么样的。
机器学习是一个类似的过程。它通过数学公式形式,建立机器的感知能力。机器内部算法记住各种物体的特征,然后产生辨别物体的能力。
机器的学习能力和人的智力是不一样的。人们不能期待机器有人的智力并完全具有人的智能。
机器学习的三个主要缺陷:
表述能力(Representation)。用数学语言表述一个复杂问题是一件困难的事情,特别是要模拟人脑。到目前为此,机器学习只能回答简单问题,这是什么?这个多少钱?下一个是什么? 过度拟合(overfitting)。机器学习似乎可以学习我们关心的事情,事实上它们不能。机器学习系统只是记住了数据,其实它并没有理解数据。过度拟合指的是算法从数据中学到了太多关系,而这些关系在现实中是不存在的。经济学上说,如果一个少胳膊的人跑得快,你不能得出结论,少胳膊可以使人跑得快。 在数据有限的情况下,机器学习缺少举一反三的能力(Lack of effective generation because of limited data)。机器只能学会你教它的东西。如果你给机器提供不好的数据,那么它产生的结果就难以预料。微软搞了一个对话机器人(Taylor), 它很快就学会了许多脏话。
机器学习的三种主要算法(Machine Learning Algorithms)::
监督学习 (Supervised Learning)。 监督学习就像我们人类在老师指导下学习。老师给学生举出有用的例子,学生记住例子并推导出一般规律。统计回归,数据分类,图像识别,语音识别,机器翻译,自动驾驶车等,都是监督学习。 无监督学习 (Unsupervised Learning)。无监督学习是让机器从数据中寻找规律,把数据或者物品分类,给人提供意想不到的内在联系。我们在网上购物时,有些广告会弹出来,这就是机器学习的结果,它认为,你对其它相关物品也会感兴趣。 加强学习 (Reinforcement Learning)。加强学习就是给算法提供没有结论的例子,但是给机器提供正面或者负面的反馈。这跟人类的反复试验学习方法一样。简单的例子就是计算机学习玩电子游戏。 Google 的 DeepMind 就是一个加强学习的例子,它刚开始游戏玩得不好,但是后来变成冠军。
机器学习的三种主要方法(Three most promising AI learning approaches):
朴素的贝叶斯 (Naive Bayes)。 这种算法可以比医生做出更精确的诊断结果。它也可以探测垃圾邮件和文字里的情绪。这种方法也经常被用来跟踪互联网上的大数据传运。 贝叶斯网络 (Bayesian Networks, Graph Form)。 这种图像可以用概率的形式表示复杂的世界。 决策树 (Decision Trees) 。决策树表现符号最佳。决策树历史悠久,它表示了人工智能的决策过程并因此而得名。
人工智能的深度学习。机器学习是人工智能的一部分,深度学习是机器学习的一部分,所以深度学习在人工智能里是一个很小的领域,但是媒体好像特别喜欢关注深度学习。
深度学习是人工智能模仿人的大脑神经系统的学习方法。人的大脑有神经网络,所以深度学习是用电脑模仿人的神经网络。
想象一下我们要过滤水,让水经过一层一层的过滤系统,最后得到干净的水。 同样,深度学习是把输入数据经过一层一层的信息网,通过一层一层的演算,最后得出结论。我自己的理解,最简单的神经网络就是线性回归,或者逻辑回归,用户输入数据,电脑做回归,建立输入和输出之间的关系。复杂一些的神经网络,每一层对数据做不同的处理和变换,调整变换的系数和权重,最后产生结果。
我自己的理解,深度学习是一个迭代过程(Backpropagation),每个迭代过程的专业名称是时代(Epoch)。已知数据被输入到神经网络里,网络调整内部参数,然后拟合最佳结果。过度拟合也容易在这个过程中产生。深度学习的具体过程,我将会另文介绍。
前面我们提到,人工智能包括两个大的领域,软件方面的人工智能和硬件方面的人工智能。我们刚介绍了软件方面的人工智能的发展,下面我们介绍硬件方面人工智能的发展。
很多人把人工智能和机器人混为一谈,但是机器人和人工智能是两回事,虽然这两者有很多重叠部分。
人工智能是为了像人一样解决复杂问题,而机器人是在现实世界里把人的想法自动化。
介绍机器人以前,我们先了解一下机器人的三个规则:
机器人不可以伤害人,或者通过不作为而使得人遭到伤害(First Law – A robot may not injure a human being or, through inaction, allow a human being to come to harm) 机器人必须服从人的指令,除非人的指令违背前面的第一条规则(Second Law – A robot must obey the orders given it by human beings except where such orders would conflict with the First Law) 机器人必须保护它自己的存在,除非这种保护跟前面的第一条或者第二条相冲突(Third Law – A robot must protect its own existence as long as such protection does not conflict with the First or Second Laws)。
现在各种各样的机器人已经很多,但是大家关心的主要机器人包括无人驾驶飞机和自动行驶的汽车。限于篇幅,这里只介绍一下自动驾驶汽车。
在神话自动驾驶车以前,我们先看一下自动驾驶车的自动化程度分类。
给驾驶员提供帮助。车的控制仍然在人手中,但是车可以提供一些简单的帮助,譬如控制车的速度。其实我们的巡航控制(Cruise Control),和预设刹车系统就是这个功能。 部分自动驾驶。车更多的时候不需要人的干预。车可以根据路况调整速度,这样驾驶员只需要保持警惕就可以。自动巡航控制就是这种功能。 有条件自动驾驶。目前生产中的自动驾驶车基本在这个水平。车可以在特定的路况下自动驾驶,譬如高速公路或者单向行驶的公路。车可以根据路况刹车,人只要关注并在紧急情况下接管驾驶。 高度自动驾驶。车可以像人一样转方向盘,踩油门,刹车,并根据路况从出发点到终点做路况驾驶调整。车的驾驶不需要人的干预,只是在特定的情况下才需要人的操作。人只需要随车监督就行。预计2020年这样的车可以上路。 完全自动驾驶。车可以完全自动驾驶,从出发点到终点,车都不需要人的干预。这样的车已经没有方向盘,根本不需要驾驶员。预计2025年这样的车可以上路。
自动驾驶车可以提供下面的几个好处。
很少发生交通事故。因为自动驾驶车严格遵从交通规则,所以事故很少发生。因为没有人驾驶,车的安全保护措施就没有必要,所以未来的车会很轻,甚至可以用塑料制造车。因为事故少了,车的保险费用也会下降。汽车保险业会受影响。 人工驾驶的工作减少。自动驾驶车就减少了专职驾驶员的需求。现在美国有300万人做驾驶工作。 大家可以节省时间。自动驾驶车可以给大家节省很多驾驶时间。大家可以把开车的时间去做别的事情。
生产自动驾驶车需要很多技术上的突破。
全球定位系统跟踪监视车在哪里并规划行车路线。
雷达,超声和光测仪(Lidar, Light Detection and Ranging) 发现周围物体和它们的运动情况。
车载相机告诉车周围的路况,指导车的行动。
不管我们是否喜欢,自动驾驶车会进入我们的生活。未来要么我们使用自动驾驶车,要么我们跟自动驾驶车共享马路。
在结束此文以前,让我简单归纳一下人工智能的未来。
人工智能的缺陷是它没有创造性,不能想象未来,也不会有原创性的想法。人工智能不会有情绪,也不会有内疚感。
人工智能的发展,要考虑下面现实世界的要求:
经济合算。人们在购买人工智能的应用以前,要看它是否比现在的现有应用合算。没有经济效益的应用就没有前途。譬如,炒菜机器人是不是比人工炒菜便宜。 可重复性。人们期待人工智能的结果是可以重复的。这对现有的步骤性方法很容易,但是对有塑造性的人工智能应用却是一个挑战。每次机器人炒出来的菜质量是不是可靠。 高效。经济规律要求在最少资源的情况下取得最好的结果。机器人削苹果时,是不是浪费太多。 有效。人工智能应用要提供人们需要的结果。送货机器人是否确实把物品送到。 实用。所有的人工智能应用必须给人们提供实质性帮助。机器人护理是不是确实给病人提供帮助。
现在人工智能很热,但是我们要警惕人工智能的冬天(AI Winter)。人们在开发人工智能的应用时,容易承诺过度,到时候却实现不了。这种过度乐观,最后会让投资者失望。人工智能的冬天以前发生过,以后仍然会发生。
|