人工智能及其应用简介-刘以栋-万维博客-万维读者网（电脑版）

设万维读者为首页

万维读者网 -- 全球华人的精神家园

广告服务

联系我们

关于万维

首　页

新　闻

视　频

博　客

论　坛

分类广告

购　物




刘以栋的博客
General Personal Opinions about market and life
		https://blog.creaders.net/u/2769/ > 复制 > 收藏本页

网络日志正文

		人工智能及其应用简介	2019-02-26 20:44:09

人工智能及其应用简介

刘以栋

当今世界，人工智能是一个热门话题，有人甚至预言以后可以娶一个机器人做老婆，这无异于天方夜谭。

出于对人工智能的兴趣，我自己也去读了一些人工智能的入门书。这是我人工智能读书报告第一篇，以后会有人工智能不同领域的读书报告。我自己不是做人工智能方面工作，所以只是编译了这篇科普文章，不到之处请谅解。

人工智能本身不是一个新概念。早在1956年夏天，一帮科学家就在达特茅斯大学提出了计算机的推理能力功能。距今已经60多年。

人工智能简单的来说包括三个部分，接受信息，处理信息和做出行动。当然，这其中任何一部分都可以是人工智能的一个研究领域。接受信息包括语音识别，模式识别，计算机视觉等。处理信息就是计算机的推理能力，最有名的例子就是下围棋的阿法狗（AlphaGo）。行动部分的例子包括机器人和自动驾驶车。

在讨论人工智能以前，让我们先复习一下人的七种智能。

视觉空间智能（Visual-Spatial Intelligence）

周围环境辨别能力是任何运动机器人都需要掌握的能力。自动驾驶车和自动吸尘器都需要看到周围的情况。吸尘器要求精度低。人工智能在这方面只能达到中等水平。

身体运动智能 (Bodily Kinesthetic Intelligence)

外科医生和舞蹈演员需要调整身体姿势来完成动作。人工智能可以辅助医生做手术。机器人需要在人的指令下操作。这方面人工智能可以达到中高水平。

创造智能 (Creative Intelligence)

创造智能包括新的想法，新的音乐篇章，发现新的模式，新的发明等。人工智能可以模仿人的行为，但是它自己不能有发明创造。人工智能在这方面的潜力是零。

人际交往智能 (Interpersonal Intelligence)

人和人之间的相互交流，譬如会议上或者电话上交流信息等，不是人工智能所长。人工智能可以根据关键词回答简单问题，但是人工智能不能理解整个句子。这个方面人工智能只能达到低中水平。

内心自省智能 (Intrapersonal Intelligence)

一个人通过反省，发现自己的兴趣和专长，然后设定自己的奋斗目标，是人类特有的能力。人工智能在这方面的潜力是零。

语言智能 (Linguistic Intelligence)

语言交流能力，包括听懂对方讲话，或者读懂对方的信函，然后通过思考，作出回答。人工智能一般不能听懂对方讲话，也不能读懂书信，更不要说根据对方要求做出回答了。人工智能在语言交流方面只能达到初等水平。

逻辑数学智能 (Logical - Mathematical Intelligence)

进行数学运算，探索模式，寻找规律是人工智能所长。人工智能在这方面可以达到高级水平。

不管我们是否喜欢人工智能，人工智能已经进入了我们生活中的方方面面。

我们打字时，人工智能经常给我们改错。有的时候，人工智能提出改正要求，等我们确认。有的时候，人工智能来不及等我们确认，自己做决定。譬如，如果我们开车时，前面有障碍，人工智能可以紧急刹车。人工智能反应比人快。

人工智能也可以使我们工作中的许多事情自动化。自动取款机应该算人工智能的一种形式。

自动化可以取代我们工作中的无聊重复部分，使得我们的工作更有趣。我们去工作，挣钱是一部分原因，从工作中取得的满足感是另一部分原因。自动化还可以提高工作效率，增加工作环境的安全性。

人工智能在医疗方面也有许多应用。人工智能医疗仪器可以戴在身上，这样可以收集长期数据，监督病人情况。人工仪器也可以增加人的体能，人可以通过穿着一种机器人（Exoskeleton，外骨骼），这样可以跑得更快，负重更多 …..

机器人护理有它的两面性。一方面，机器人做事可能更客观，另一方面，人是有感情的。机器人不会提供同情和理解。

人工智能在人和人之间的交流方面也有帮助。机器人在文字以外，又增加了表情包。机器人可以做自动翻译，Google 的翻译就不错。

机器人在交流领域的新的突破是身体语言。人跟人交流时，除了语言表达以外，还有身体语言。机器人可以捕捉到人的身体语言，譬如姿势，头的动作，面部表情，眼睛接触和手势等，帮助理解人的意图。我个人认为，身体语言在中国不是很重视，但是我们确实不可忽视身体语言。

人工智能的发展包括两个大的领域：软件方面发展起来的人工智能和硬件方面发展起来的人工智能。

大数据，机器学习都属于人工智能在软件方面的发展。

我们这个时代被称为信息时代并不仅仅是我们有很多数据，而是因为我们在分析数据方面达到了一定的成熟度，从而使得我们可以从数据中提取有用的信息。

谷歌（Google), 亚马逊（Amazon），苹果，脸书和微软是美国5个市值最高的公司，其主要原因是它们的商业模式都是建立在数据上面。

数据是新时代的石油。石油不能被直接被用来做化工制品，它必须先经过提炼。同样，数据在使用前，必须做相应的处理。

数据处理可以包括下面的相关步骤：

数据变换（Transforming)。改变数据的面貌。数据变换可以指不同的形式，但是其主要形式就是把数据按矩阵形式排列。譬如，你去商店购物，商店把每个顾客归在一行，然后每列是购买的物品数量和价格。

数据净化(Cleansing)。改正不完美的数据。不同的数据收集方法会有不同的数据问题，譬如数据缺失，数据值不合理和错误数据等。譬如，网上有的物品和服务评论可能是假的，或者是朋友写的，或者是竞争对手写的。根据这些不可靠的数据，可能会得出错误的结论。数据净化就是要把不可靠数据去掉。

数据检查(Inspecting)。验证数据。虽然计算机可以在数据分析中起很大作用，但是数据分析很大程度上仍然是人的工作。人很容易识别模式，并发现异常数值，譬如客户年龄小于10岁或者大于90岁。

数据造型(Modeling)。掌握数据里不同因素的关系。通过统计方法，发现客户购买不同物品之间的关系。譬如，我们去亚马逊买东西时，它会推荐相关产品。

数据分析在人工智能领域至关重要。业内人士认为，人工智能直到现在才开始腾飞，其主要原因是数据质量和数据来源的提高。

数据分析的最高层次是机器学习。机器学习的中心思想是，在事先没有已知算法的情况下，机器通过分析数据，用数学公式表达现实世界。机器学习让我们可以用未知的数学函数来表达复杂的现实世界。而这个复杂的数学函数，是机器的内部算法通过数据自己学会的。

机器学习过程完全是一个数学逻辑过程。它通过数学形式把输入和输出联系起来。机器学习完全没有理解算法学到了什么东西，而仅仅是内部算法把输入和输出建立起一个函数关系。所以，机器学习过程也是一个机器训练过程。

想象一下我们教孩子学习。我们教孩子认识什么是树，然后告诉孩子树的结构，形状，并让孩子看很多树的图片，这样孩子就知道树是什么样的。

机器学习是一个类似的过程。它通过数学公式形式，建立机器的感知能力。机器内部算法记住各种物体的特征，然后产生辨别物体的能力。

机器的学习能力和人的智力是不一样的。人们不能期待机器有人的智力并完全具有人的智能。

机器学习的三个主要缺陷：

表述能力(Representation)。用数学语言表述一个复杂问题是一件困难的事情，特别是要模拟人脑。到目前为此，机器学习只能回答简单问题，这是什么?这个多少钱？下一个是什么？
过度拟合(overfitting)。机器学习似乎可以学习我们关心的事情，事实上它们不能。机器学习系统只是记住了数据，其实它并没有理解数据。过度拟合指的是算法从数据中学到了太多关系，而这些关系在现实中是不存在的。经济学上说，如果一个少胳膊的人跑得快，你不能得出结论，少胳膊可以使人跑得快。
在数据有限的情况下，机器学习缺少举一反三的能力(Lack of effective generation because of limited data)。机器只能学会你教它的东西。如果你给机器提供不好的数据，那么它产生的结果就难以预料。微软搞了一个对话机器人（Taylor），它很快就学会了许多脏话。

机器学习的三种主要算法（Machine Learning Algorithms)：:

监督学习 (Supervised Learning)。监督学习就像我们人类在老师指导下学习。老师给学生举出有用的例子，学生记住例子并推导出一般规律。统计回归，数据分类，图像识别，语音识别，机器翻译，自动驾驶车等，都是监督学习。
无监督学习 (Unsupervised Learning)。无监督学习是让机器从数据中寻找规律，把数据或者物品分类，给人提供意想不到的内在联系。我们在网上购物时，有些广告会弹出来，这就是机器学习的结果，它认为，你对其它相关物品也会感兴趣。
加强学习 (Reinforcement Learning)。加强学习就是给算法提供没有结论的例子，但是给机器提供正面或者负面的反馈。这跟人类的反复试验学习方法一样。简单的例子就是计算机学习玩电子游戏。 Google 的 DeepMind 就是一个加强学习的例子，它刚开始游戏玩得不好，但是后来变成冠军。

机器学习的三种主要方法（Three most promising AI learning approaches):

朴素的贝叶斯 (Naive Bayes)。这种算法可以比医生做出更精确的诊断结果。它也可以探测垃圾邮件和文字里的情绪。这种方法也经常被用来跟踪互联网上的大数据传运。
贝叶斯网络 (Bayesian Networks, Graph Form)。这种图像可以用概率的形式表示复杂的世界。
决策树 (Decision Trees) 。决策树表现符号最佳。决策树历史悠久，它表示了人工智能的决策过程并因此而得名。

人工智能的深度学习。机器学习是人工智能的一部分，深度学习是机器学习的一部分，所以深度学习在人工智能里是一个很小的领域，但是媒体好像特别喜欢关注深度学习。

深度学习是人工智能模仿人的大脑神经系统的学习方法。人的大脑有神经网络，所以深度学习是用电脑模仿人的神经网络。

想象一下我们要过滤水，让水经过一层一层的过滤系统，最后得到干净的水。

同样，深度学习是把输入数据经过一层一层的信息网，通过一层一层的演算，最后得出结论。我自己的理解，最简单的神经网络就是线性回归，或者逻辑回归，用户输入数据，电脑做回归，建立输入和输出之间的关系。复杂一些的神经网络，每一层对数据做不同的处理和变换，调整变换的系数和权重，最后产生结果。

我自己的理解，深度学习是一个迭代过程（Backpropagation），每个迭代过程的专业名称是时代（Epoch)。已知数据被输入到神经网络里，网络调整内部参数，然后拟合最佳结果。过度拟合也容易在这个过程中产生。深度学习的具体过程，我将会另文介绍。

前面我们提到，人工智能包括两个大的领域，软件方面的人工智能和硬件方面的人工智能。我们刚介绍了软件方面的人工智能的发展，下面我们介绍硬件方面人工智能的发展。

很多人把人工智能和机器人混为一谈，但是机器人和人工智能是两回事，虽然这两者有很多重叠部分。

人工智能是为了像人一样解决复杂问题，而机器人是在现实世界里把人的想法自动化。

介绍机器人以前，我们先了解一下机器人的三个规则：

机器人不可以伤害人，或者通过不作为而使得人遭到伤害（First Law – A robot may not injure a human being or, through inaction, allow a human being to come to harm）
机器人必须服从人的指令，除非人的指令违背前面的第一条规则（Second Law – A robot must obey the orders given it by human beings except where such orders would conflict with the First Law）
机器人必须保护它自己的存在，除非这种保护跟前面的第一条或者第二条相冲突（Third Law – A robot must protect its own existence as long as such protection does not conflict with the First or Second Laws）。

现在各种各样的机器人已经很多，但是大家关心的主要机器人包括无人驾驶飞机和自动行驶的汽车。限于篇幅，这里只介绍一下自动驾驶汽车。

在神话自动驾驶车以前，我们先看一下自动驾驶车的自动化程度分类。

给驾驶员提供帮助。车的控制仍然在人手中，但是车可以提供一些简单的帮助，譬如控制车的速度。其实我们的巡航控制（Cruise Control），和预设刹车系统就是这个功能。
部分自动驾驶。车更多的时候不需要人的干预。车可以根据路况调整速度，这样驾驶员只需要保持警惕就可以。自动巡航控制就是这种功能。
有条件自动驾驶。目前生产中的自动驾驶车基本在这个水平。车可以在特定的路况下自动驾驶，譬如高速公路或者单向行驶的公路。车可以根据路况刹车，人只要关注并在紧急情况下接管驾驶。
高度自动驾驶。车可以像人一样转方向盘，踩油门，刹车，并根据路况从出发点到终点做路况驾驶调整。车的驾驶不需要人的干预，只是在特定的情况下才需要人的操作。人只需要随车监督就行。预计2020年这样的车可以上路。
完全自动驾驶。车可以完全自动驾驶，从出发点到终点，车都不需要人的干预。这样的车已经没有方向盘，根本不需要驾驶员。预计2025年这样的车可以上路。

自动驾驶车可以提供下面的几个好处。

很少发生交通事故。因为自动驾驶车严格遵从交通规则，所以事故很少发生。因为没有人驾驶，车的安全保护措施就没有必要，所以未来的车会很轻，甚至可以用塑料制造车。因为事故少了，车的保险费用也会下降。汽车保险业会受影响。
人工驾驶的工作减少。自动驾驶车就减少了专职驾驶员的需求。现在美国有300万人做驾驶工作。
大家可以节省时间。自动驾驶车可以给大家节省很多驾驶时间。大家可以把开车的时间去做别的事情。

生产自动驾驶车需要很多技术上的突破。

全球定位系统跟踪监视车在哪里并规划行车路线。

雷达，超声和光测仪（Lidar, Light Detection and Ranging) 发现周围物体和它们的运动情况。

车载相机告诉车周围的路况，指导车的行动。

不管我们是否喜欢，自动驾驶车会进入我们的生活。未来要么我们使用自动驾驶车，要么我们跟自动驾驶车共享马路。

在结束此文以前，让我简单归纳一下人工智能的未来。

人工智能的缺陷是它没有创造性，不能想象未来，也不会有原创性的想法。人工智能不会有情绪，也不会有内疚感。

人工智能的发展，要考虑下面现实世界的要求：