兄弟我最近和“围棋AI” 【人机练习场 (gog361.com)】下棋,又看了几篇介绍文章,有点心得体会,想和棋友们交流。尽可能把我所理解的“原理”讲清楚,让不懂围棋的朋友也能理解。 人的发明创造原理是简单的但技术是复杂的。比如飞机能飞起来是因为有空气阻力,调节翅膀的角度让空气阻力变成浮力,浮力足够大时飞机就会升空,这就是伯努利原理。当然制造飞机的技术咱们草民是难以理解的。 “围棋AI”的原理也应该是简单的,可是介绍这一原理的文章又臭又长晦涩难懂,(蒙特卡洛树搜索 (MCTS) 、深度强化学习 (RL) 、深度卷积神经网络 (DNN) 、局面评估函数、策略函数,等等。)兄弟我尝试用比喻的方法把这些吓人的概念说明白。 汉字有近10万个,按使用频率排序,一个大学毕业的普通人能认识前面不到3000个,专家学者也就四五千,AI的本事大但也只能认识七八千,(为什么不让AI认识所有的汉字呢?因为现在电脑的水平达不到,你同时打开1000个网页试试)。现在举行一场识字比赛,从这10万个汉字中随机选出1000个汉字读出它的发音,人最多只能得四五十分,而AI能得七八十分,AI胜。 围棋里面有多少个“汉字”(盘面)呢? 2后面跟着172个零。这就是围棋AI能战胜人类的最基本原理,不必认识全部的“汉字”(盘面),只要比人类强就行了。 人工智能其实应该叫人工“傻能”,傻的不能再傻但有超强的能力。武则天给自己造了一个字:“曌”。AI只知道这个字读“照zhao”,不懂日月当空是什么意思,更不懂野心家的情怀,当出现“曌”这个画面、图像、照片时,AI会发出“照zhao”这个音。 “围棋AI”的开发者找来三个根本不会围棋但有特殊才能的傻货:傻1、傻2和傻3。 傻1看高手下棋,过目不忘,能记住每一个盘面。对棋的内容(黑白平衡、地势转换、死活搏杀)完全不懂,只是知道出现这个盘面时下一步棋走在哪里最后赢了。傻1记住了100万盘棋以后开始和真人下棋,模仿高手,但胜率不足10%,因为对手一旦下出数据库里面没有的棋,傻1就不会了,开始乱走。傻1再努力学习,记住了200万盘棋,可胜率还是不高,因为人类千年留下的棋谱就那么多。 于是傻2出来了,傻2不看棋谱,上来就和人下棋,想下在那里就下在那里,落子如飞,连着下一万盘都输了,但第一万零一盘赢了,因为总有连续走对的时候。傻2的本事是能记住这盘赢棋的走法。比如人在日常生活中要找某件衣服一定去衣柜里面找,傻2却连厨房厕所都找了一遍,最后在衣柜里找到,记住了,下次找衣服直接奔衣柜。如果让傻2把家里所有的东西(皮鞋、牙膏、擀面杖等)都找一遍,那么东西在哪,傻2一清二楚。 没人愿意和傻2下棋(因为乱走),傻2就自己和自己下,每天下3000万,先下他一年,什么阵仗没见过。虽然围棋AI每天能下3000万盘棋,但这速度即使一万年也不能穷尽围棋的盘面。 “围棋AI”的开发者让傻1和傻2联合起来和人下,如果出现的盘面谁知道该怎么下最后赢,就照谁的办。这时傻2已经不是胡乱下了,而是在傻1给出的框架下走棋,极大地提高了效率和赢棋的概率。(比如让傻2找出从美国去加拿大的道路,傻2会东南西北乱找,这时傻1指出加拿大在美国的北面,傻2就会只找通向北方的道路。) 但有时哥俩的意见不一致, 导致AI不停地运转浪费时间,怎么办呢?这时傻3出来了,傻3也不懂围棋,但会把这样走赢的棋数和那样走赢的棋数比较,选择胜率高的走法。如果胜率相等就会随机选一个,这就是为什么同样一个盘面AI的下法有时不一样。 每下一步棋就会出现一个盘面,一盘棋最多能出现360个盘面。(一般200多手就结束了。)比如S17代表下完第17步棋的盘面,现在该AI走棋,AI会把S18的数据库打开,找出在S17基础上的盘面,看看第18手棋有几种走法,让傻3选择赢面最大的走法。 如果某位心术不正之徒把棋故意下在不可能的地方,想利用AI的“傻”走歪门邪道获胜,那么傻3会知道赢棋的棋谱里没有这个盘面,知道对手这样下赢棋的概率为零,从而继续按照能赢棋的路数走。如果你有真本事,下出“傻子们”没见过的棋最后还能赢,那你就是上帝(理论上有这可能,比如连中三次lottery)。 傻1就是“深度学习”,傻2就是“蒙特卡洛”,傻3就是“评估、策略函数”等。哥仨强强联手组成了“阿法狗”,打遍天下无敌手。 技术细节:1、将棋盘分成几个小块以减少搜索的宽度,然后局部穷尽(全归纳);2、不要求算到底以减少搜索深度。比如有一堆苹果,随机选一个,如果更大就替换,经过多次随机选择,手里的那个一定是接近或可能就是最大的,尽管不是必然最大。 “围棋AI”最大的“功绩”就是毁灭了围棋。围棋的精髓是阴阳平衡、地势转换,棋手在此基础上制定战略规划,在棋盘上斗智斗勇。而围棋AI不是从黑白平衡的角度去观察,没有战略思考的能力,只有眼前利益的算计,纯粹以赢棋为目的。仗着自己算路深远(一切变化都演算了一遍),能发现鬼手妙着,从而碾压人类。看不透才产生敬畏,如果知道了人类以前、今后下出来的棋已经在AI的数据库里面了,会觉得围棋没有了意义。棋手们为了赢棋每天拼命挖掘AI的数据库,互相拼记忆,不再思考天地间的道理。后果是颠覆了围棋的本意,使得围棋失去了灵魂。千年来形成的各种“定式”基本作废,“纵横棋盘藏宇宙,黑白子间寓人生”,后人不会再有这深刻的感受。孩子们学围棋只是智力游戏而已,培养不出宏观视野、战略格局、磅礴大气。 现在棋谱分两种:人类高手下出的棋谱和傻1傻2自己与自己下出的棋谱。人类的棋谱占的比重越来越小,围棋历史(棋谱)被AI取代是必然的趋势,无可奈何花落去。如果用一个大圆代表围棋所有的盘面,大圆里面有一个中圆代表围棋AI(计算机)里面的盘面,中圆里面又有一个小圆代表人类下出过的盘面,那么中圆的面积只有大圆的万分之一,小圆只有中圆的万分之一。(中圆和小圆每年以万万分之一的速度在扩大)。 “深度学习”不是爱学习,围棋AI不是人,不会在“家庭环境”的熏陶下养成爱学习爱劳动的好习惯,没有大数据它什么也不会。 林彪喜欢给自己开中药方,认为几种药材混合在一起煎煮才能有特殊的效果。这“各种药材”在锅内互相“作用”的过程(“深度学习”等)是人控制不了的,因此AI有了“灵性”,不受人的操控了,反过来能操控人类。这是对“深度学习”的错误理解。AI不是创造新的逻辑,而是制造新的“数据”。不是AI会写文章,而是在大数据的基础上反复搜索、评估、过滤,直到找出概率最高的词组拼凑出一篇“文章”。这个过程没有“化学反应”。随着数据库逐渐增大、计算机的功能逐渐增强,“文章”会越来越像人写的。 以后的人会逐步丧失逻辑推理能力(就像现在的猫已经不会逮耗子了) ,用数据分析取代逻辑推理,用大数据分析得出“符合实际”的结论,以此对即将发生的事情做出预测,准确率会越来越高。如此下去人慢慢地就不是人了 ,这就是人类发展的方向。 现在的股市就是各家的AI在拼搏,用不着基本面分析了,把今天的K线图和历史上曾经出现的比较,得出明天涨跌的可能性,给出操作建议。 AI现在还没有“感情”、没有幽默感,也许将来会模仿,在大数据基础上的逼真模仿。但不会产生“灵性”,有类似巴黎老高的本事创作出一位“李婉姬”,或写出一部红楼梦。 让AI写一首蝶恋花怀念妻子:蝶恋花,思妻心切,今生注定难忘怀。 相思之情如蜜甜,痴心妻子恋爱中。 岁月飞逝,妻离人别,思念如潮涌心头。 春花秋月总相伴,思妻泪滴难自禁。 但愿轮回能再见,携手白头到天边。从“仓库”里面找出一些辞藻堆砌,没有意境、没有韵味,狗屁不通。 看看姚文元的手笔:遥送忠魂返大地,真理真情,把我心涛寄。 碑影悠悠日月裡,此生永系长相忆。 碧草沉沉水寂寂,漫漫辛酸,谁解其中意。 不改初衷常历历,年年化作同心祭。 当年Google 搜索引擎的发明是一个伟大的进步,能在浩如烟海的文章、视频中找出自己想要的,极大地提高了效率。AI就是在此基础上“茁壮成长”起来的。人工智能(AI)和其它高科技一样能毁灭人类,但取代不了人类。 毕竟是外行,只是个人观点,鄙俚浅陋,贻笑大方。
|