比起人工智能，人在邏輯上確實甘拜下風-高伐林-萬維博客-萬維讀者網（電腦版）

網絡日誌正文

		比起人工智能，人在邏輯上確實甘拜下風	2017-11-14 15:41:33

　　人工智能飛速發展，一路輾壓人文學界對它的種種質疑。說人工智能能做什麼很容易，因為相對於人腦，它幾乎無所不能；說人工智能不能做什麼則風險甚高，持論者常因論據失真或前提不確導致結論無效。人腦不可度量處，恰是AI大顯身手時

　　老高按：今年中秋節前夕，幾位同窗難得在紐約城郊聚會。這些同窗，有的從中國閃訪，有的在美國蟄居；有的投身媒體，有的經營企業；當天才到的，次日就走的……一別三十年，都有“人生不相見，動如參與商，今夕復何夕，共此燈燭光”（杜甫《贈衛八處士》）之慨，談了美國談中國，談了過去談未來，不知怎麼一來，還談到了人工智能（Artificial Intelligence, AI）對人類的挑戰，給未來增添了越來越濃重的不確定氣氛。
　　聊到深夜，酒醒大半，各奔東西。“明日隔山嶽，世事兩茫茫。”這是杜甫那個年代的感嘆，如今不同了！人人有愛瘋，個個有微信，大家共一群，天涯若比鄰。這不，昨晚就收到了其中一位同窗的文章《計劃不是那個計劃，市場也不是那個市場——也說“AI計劃經濟是否可能”》。他說，是那天在紐約市郊聚會，“席間曾提到人工智能話題，現將本人最近心得呈眾學兄，民科之見，見笑見笑！”“民科”，“民間科學家”之謂也，通常帶貶義，他這裡是自謙。
　　這位同窗原為南方某省一家報紙的負責人之一，現已退休，既然他用了“老殘油記”的網名，未得其同意，我就不提真實姓名了。這篇文章他已經發表在一家網絡媒體，料想我轉載於此，他不會見怪。這篇文章說是與那夜席間有關，其實倒直接由許成鋼和周為民的文章而來。許成鋼是許良英的大公子，哈佛博士，國內頭銜一大把，國際頭銜更多，倫敦經濟學院教授、哈佛大學國際發展研究所研究員、首爾國立大學講座教授、世行及國際貨幣基金組織顧問等等；周為民這個名字甚為普通，名人中就有好幾位，不知究竟是其中哪一位。他們都被人工智能這一話題所吸引，今後一段時間想必討論更為深入和廣泛。
　　也巧，昨天晚上讀到英國《金融時報》中文網發表AlphaGo設計師黃士傑的演講整理稿：《最強的學習技能在人類的腦袋裡》，與我們這裡談到的話題有關，也索性轉貼於此，供大家參考。

　　順便提一句，昨天我轉發了紐約時報中文網刊登的文章《中國正想要這樣的特朗普》，在按語中我寫道：“在萬維上，左派博客譴責川普、同情中共；右派博客擁護川普、反對中共——這是大家每天看到的常態。但是現在出現了人們意想不到（其實，是早可料到）的情況，川普與中國竟然合流：中國支持川普，川普對中共、對習近平也好話說盡。”“這奇怪嗎？一點也不奇怪，一點也不令人吃驚！”
　　隨後有三位博友跟帖評論，有一位非常痛快地直斥我是“愚蠢之極”，說：即便在萬維這個小世界裡，至少一共有四部分人：反川親中；親川反中；親川親中；反川反中。如果加上中間派，則可細劃為九個部分。他去年就寫過文章《大選將萬維博客分為九塊》。
　　他去年的文章我拜讀過，九分法，很有道理！我本人就既反對川普，也反對中共當權者的專制主義。但“九分法”雖有“九分法”的道理，何以與“兩分法”不共戴天？這就像有人說：分紅色、藍色？愚蠢之極：應該分為“深紅”“大紅”“紫紅”“絳紫”“藍紫”“寶藍”“普藍”“深藍”……七種、八種、九種才對！我認同他顏色可以分得更細的觀點，但能說分開紅藍就“愚蠢之極”嗎？
　　況且我轉載紐約時報中文網這篇文章，恰恰正是要說明：簡單化地只從意識形態、價值取向來劃分“左派右派”，是多麼彆扭，不合時宜，一遇到現實問題，就解釋不通了！
　　今天這位仁兄更撰寫專文：《反川與親共有必然聯繫嗎》，讓我不由得失笑——“反川與親共有必然聯繫嗎？”當然沒有！我本人就是一例：批評川普，但我並不親共。但這位仁兄難道不是自己樹了一個大大的靶子，再來砰砰砰地一通射擊嗎？這裡有誰主張了“反川與親共有必然聯繫”嗎？
　　這位仁兄還說：“有人一定要分左右派，想必便於搞運動鬥批改。”不知這是根據什麼邏輯？我想起魯迅在《小雜感》中所說的一段名言：“一見短袖子，立刻想到白臂膊，立刻想到全裸體，立刻想到生殖器，立刻想到性交，立刻想到雜交，立刻想到私生子……”
　　還有一位博友，在滿腦子漿糊上跟我有得一拼——我比他唯一強一點的是，我對自己滿腦子漿糊這一點有自知之明，而此兄對此渾然不知。他跟着上面那第一位仁兄說：老高本人就是不斷在演繹“文革”和“階級鬥爭”的思維。呵呵呵，這就相當於從“一見短袖子”，中間什麼聯想環節都不需要，一步就直接跳到“想到私生子”！
　　這都是題外話，還是言歸正傳，談談“人工智能”吧。AI是絕不會犯這些邏輯錯誤的，人在AI面前還真不能不氣餒。

　　計劃不是那個計劃，市場也不是那個市場

　　也說“AI計劃經濟是否可能”

　　老殘油記，微博

　　一，人腦不可度量處，AI大顯身手時

　　關於“AI（人工智能）計劃經濟是否可能”，國內人文學界幾乎眾口一詞：不可能。然而，人工智能的飛速發展卻一路輾壓人文學界對人工智能的種種質疑。目前的情勢是，說人工智能能做什麼很容易，因為相對於人腦，它幾乎無所不能；說人工智能不能做什麼，則風險甚高，持論者常常因論據失真或前提不確，致結論無效。比如，近日網上熱傳的兩篇文章《把市場消滅了，人工智能的基礎也就沒有了》（作者許成鋼）、《計劃經濟不可行性早已證明大數據也彌補不了》（作者周為民），即無一倖免。
　　許文和周文的標題旗幟鮮明，但也直接令人生疑添惑。因為市場只是數據採集的眾多場景之一，斷不至於如許文所說，成為大數據的基礎。至於周文所說公有制計劃經濟之不可行，病根其實也在數據，即數據缺失致“經濟”無從“計劃”（對此，米塞斯在社會主義經濟計算問題論戰中曾有精彩論述）；大數據，也不是補漏之器，而是解決之道。除了標題，兩文中的無效論據、論證，也所在多多。比如許文稱，人腦無法感知、無法度量的東西，則人工智能無所施其技（大意）。實情是，人腦智能不可度量，絕不等於人工智能不可度量；而且，人腦不可度量處，恰是AI大顯身手時。
　　或許，人文學界在預測人工智能前景時，應當先嘗試了解人工智能的邏輯理路和技術發展動態，才方便與外界就這一話題作有效率的交流。而學界的認知錯位或缺席，極可能使人類對人工智能失控的局面提前到來。
　　何為人工智能邏輯理路？以筆者“民科之見”，其要義或可簡化為三層意思：1）大千世界無處不在的“數學法則”，才是真正的宇宙之王；2）世間萬象，都可以簡化和還原為數據，人腦，則是一台功力強大的數據處理系統；3）人腦的反應和思維過程（包括直覺、創見、靈感），實質是數據採集、識別、整理的複雜計算過程。本乎此，AI界堅信，如果能解開人腦思維之謎，便極有可能研發出效率萬千倍勝過人腦算力的人工智能系統。而人工智能狂飈突進的發展，也正加速將AI業界的信心、信念升華為信仰。
　　最新實例，是前科棋聖“阿法狗” （AlphaGo）的胞弟“阿法元”（AlphaGo Zero）。

　　二，天不生AI，萬古如長夜

　　與從小熟讀兵書、“打譜”無數，並與人類棋手反覆對弈、切磋的“阿法狗”不同， “阿法元”小弟生性孤傲，對於集人類圍棋實戰之大成的“文獻資料”（棋譜）不屑一顧，也不願屈尊讓出一席之地，邀人間棋王手談。如此妙手空空，從零開始，自我對弈，自學成才，三天過後，“阿法元”便批量報捷，將不久前橫掃地球九段人的“阿法狗”殺了個100：0。“阿法元”這一大開殺戒的弒兄戰績意味着，在人工智能面前，人類圍棋領域過往的全部經驗性事實和思考成果，價值歸零。難怪弈壇少帥柯潔聞訊後，在微博上敲下了六個字：“人類太多餘了”。
　　
　　棋壇少帥柯潔與“阿法狗”對陣落敗後，淚灑沙場（網絡圖片）

　　“山外青山樓外樓”。繼乃兄之後，“阿法元”再次提醒人類，圍棋招式變化如恆河沙數（據說高達10的170次方，而宇宙已知部分的原子數不過10的80次方），人腦思維半徑所及，不過滄海一粟。數千年來，人類歷代棋手殫精竭慮參悟出來的各種定式、變招，一夜之間，淪為井底蝸殼的“局部最優”。圍棋領域如此，其它領域又如何？初思甚喜，細思極恐。
　　綜上所述，人工智能的出現，是名副其實的“劃時代”事件。此前，人類社會只有一個智能系統，即人腦智能系統。由於人腦綜合計算（數據採集、識別、整理）能力遠高於其它動物腦，人類曾信心滿滿地自詡為“宇宙的精華、萬物的靈長”。人工智能橫空出世，將使人類擁有兩個智能系統：人腦智能系統與人工智能系統。更令人類猝不及防的是，人工智能算力之強大，使千百年來困惑人腦的難題，紛紛於一夜之間迎刃而解，而人類千百年來引以為榮的智慧文明成果，也將紛紛於一夜之間淪為偏安一隅的“局部最優”。
　　關於人工智能的劃時代意義，或可化用人腦智能名句形容：“天不生AI，萬古如長夜”。

　　三，勿以人腦之心，度AI之腹

　　回到計劃經濟和市場經濟話題。
　　先說公有制計劃經濟。如果我們依前述思路，把“計劃”理解為“數據處理”，把“計劃經濟”理解為基於大數據處理的資源優化配置總體方案，那麼，公有制計劃經濟不過是一種既定算力不足致不可計算、無法落地的“空中樓閣”。對於這一議題，奧地利學派主帥米塞斯曾有“蓋棺”之論，其極簡版表述大約為：公有制致生產資料無交易對手，無交易則無價格，無價格則無從計算。不幸的是，近百年來總有偉人一意孤行，在人類社會重複這種具有先天缺陷，註定失敗的烏托邦實驗。
　　需要指出的是，公有制計劃經濟悲慘的實驗記錄，或許可以作為人腦算力有限的“旁證”，但並不能據此推出人類經濟活動不可“計劃”、大數據和人工智能對經濟領域無效的結論。強調這一點，是因為許多學者對人工智能計劃經濟的質疑乃至聲討，不過是將此前學界（尤其是奧派）對公有制計劃經濟理論的深刻批判，直接移作對未來AI計劃經濟的預判。這樣的預判，相當於人間弈者持棋譜評點“阿法元”的落子，是一種“以人腦智能之心，度人工智能之腹”的莽撞之舉。
　　附帶一提。以“無法計算” 瓦解公有制計劃經濟理論的米塞斯，邏輯上其實為人工智能計劃經濟預留有邊窗後門——果若算力足夠，爾等不妨一試。
　　再說市場經濟。依同一思路，市場經濟不過是人類直面人腦算力有限的現實，經反覆試錯形成的一種次優解決方案。相比公有制計劃經濟，市場經濟可操作性強，而且具有前者望塵莫及的高效率。但是，它仍然受制於既定算力不足的瓶頸，存在貧富不均、市場試錯損耗等不盡如人意之處，仍然只是一種“局部最優”，甚至 “局部次優”。
　　隨着人工智能的高速發展，人類有充分理由期待迎來一種非人腦算力可逮、趨於整體最優的資源配置方案，即“AI計劃經濟”。 “AI計劃經濟”決不是公有制計劃經濟的翻版，也不是簡單地在市場經濟中植入一套人工智能系統。說到底，它與公有制計劃經濟及自由市場經濟的區別，不在生產資料公有或私有、一黨專制或三權分立等頂層“構件”，而在最基礎，也是最本質的純技術因素——算法精妙，算力強大，強大到既可規避公有制計劃經濟之禍，又足以摸到市場經濟的“無形之手”，並從容超越之。
　　囿於人腦算力，人們目前還難以想象和描述未來AI計劃經濟的種種細節，但可以肯定，屆時，計劃不是那個計劃，市場也不是那個市場——或許，市場也“太多餘了”。

　　AlphaGo設計師黃士傑：最強的學習技能在人類的腦袋裡

　　英國《金融時報》中文網，2017年11月14日

　　AlphaGo的“人肉手臂”、擔任Deepmind資深研究員的黃士傑，在近期公開演講中，分享他身為一名科學家，如何旁觀機器的進步。

　　沒有人會否認，AlphaGo在過去一年炒熱全球對人工智能的關注。
　　2016年3月，谷歌Deepmind旗下的圍棋程序AlphaGo，以4比1的成績戰勝韓國職業棋手李世石。一年後，拿掉所有人類知識、完全靠自學的AlphaGo Zero，在今年10月又以100比0的戰績碾壓“AI前輩”AlphaGo。從擊敗人類、到自學成材，AlphaGo的進展超乎預期，研發團隊也自然成為關注焦點。這當中，被稱為AlphaGo的“人肉手臂”，替AlphaGo向棋聖聶衛平說“謝謝聶老師”的黃士傑(Aja Huang)，就是AlphaGo發展的重要推手。
　　1978年出生、現任Deepmind資深研究員的黃士傑，私底下是圍棋業餘六段，在每一場人機對戰中，都代表AlphaGo落子。但他不只是手腳，更貼近他身分的描述，其實是AlphaGo的設計者、是AlphaGo的大腦。讓AlphaGo登上科學期刊《自然》(Nature)封面的那篇知名論文，黃士傑並列為第一作者。
　　上周五（11月10日）在台灣中研院舉辦的“2017年人工智慧年會”上，黃士傑首次把AlphaGo的研發過程公開說清楚，除了透露新一代AlphaGo Zero的能力還沒達到極限，他更多的是去分享身為一名科學家，旁觀機器的進步，以及一個科學團隊對基礎研究的使命和專注。
　　以下是編輯後的演講摘錄：

　　AlphaGo的研發過程，有四個時刻對我影響很大。
　　第一，是我們在韓國贏了李世石。當我們開始做AlphaGo時，沒想到它會變得那麼強。在韓國贏了李世石後，DeepMind首席執行官Demis Hassabis立刻發了一個推特，說“我們登上月球”(We landed it on the moon.)。我明白Demis那天的感覺，這是我們團隊的一小步，但卻是人類的一大步。
　　第二個時刻，是我在網絡上操作AlphaGo升級版“Master”，下了60盤棋。我從小喜歡下棋，在台灣是業餘六段。Master在網絡上對弈的對象，都是我從小崇拜的人。雖然不是我真正在下棋，但卻感到非常榮幸。
　　第三個時刻，是今年在烏鎮進行的人機大戰，由我操作AlphaGo和世界冠軍柯潔九段下棋。柯潔還不滿20歲，非常年輕，當天比賽氛圍和李世石對弈時很不同。我記得在韓國比賽，能感受到李世石承受到很大的壓力，感覺他是在為人類而戰。我當時坐在他對面，也儘量保持謹慎的態度，不喝水、不去上洗手間。但到了第二次和柯潔對弈，比較像是人機合作的氣氛，柯潔還走過來說：“黃博士，很榮幸跟AlphaGo下棋”，坦白說我有點驚訝。這也讓我們知道，如果Master是無敵的，那機器存在價值到底在哪裡？應該是要幫助棋手擴張思路、擴展圍棋理論。
　　第四次對我意義重大的時刻，是AlphaGo Zero的出現。什麼是AlphaGo Zero？我們拿掉所有人類對圍棋的知識，只餵AlphaGo Zero圍棋規則，讓它自己學習下棋。我回想起讀博士班的熬夜日子，就是不斷寫代碼、找bug，每天做測試，讓程序進步。但AlphaGo Zero把我過去的所有東西全部取代，它完全不需要我的幫助。有同事問我，Aja，AlphaGo Zero把你這十幾年來對圍棋計算機的研究，一點一點的拿掉，甚至還超越你，有什麼感覺？我的確心情複雜，但後來跟同事說，這會是一個趨勢，如果我阻礙了AlphaGo，我確實應該被拿掉（笑）。AlphaGo有99%的知識是我做的，AlphaGo能走到這一步，我已經很滿足，找到了收尾。

　　AlphaGo是怎麼開始的？

　　回到一開始，AlphaGo到底是怎麼開始的？起點是有三組人馬的聚集：Deepmind首席執行官Demis Hassabis與AlphaGo項目領導David Silver、我、還有兩位谷歌大腦（Google brain）的同事Chris Maddison和Ilya Sutskever。
　　Demis和David原本是劍橋大學的同學，友情深厚。對西方人來說，當1997年IBM超級電腦“深藍”贏了西洋棋棋王卡斯巴羅夫之後，就只剩下流傳幾千年的中國圍棋，是人工智能發展的極大挑戰。一開始，很多研究人員想把研究西洋棋的技術移到圍棋上，但都失敗了。在2006年蒙特卡洛樹搜索出來後，研究才提升一階，讓機器棋手的水平能達到業餘三段，但離職業棋士一段還有距離。Demis和David心中開始藏有一個夢，希望有一天要能做出一個很強的圍棋程序。
　　但有夢的不只有他們，故事的另一條線還有我。
　　在就讀台灣師範大學資訊工程博士班時，我每天埋頭解bug、寫代碼，就是希望做一個很強的圍棋程序。2010年，我研發出的圍棋計算機程序Erica（事實上是用我妻子的名字來命名），在計算機奧林匹亞獲得19路圍棋的冠軍。雖然Erica只是單機版，但它打敗了用了6台PC的日本程序Zen跟其他參賽者，就像小蝦米對抗大鯨魚。當年還在英國當教授的David，在比賽後寫信問我有沒有興趣加入Deepmind，隔年我也正式加入團隊，成為第40號員工。
　　我還記得當年面試，老闆問我，能做出Erica有什麼感覺？我回答，滿有成就的。Demis點頭，他明白我的感覺。
　　2014年，Google收購Deepmind，AlphaGo項目也正式浮現。Demis起初還在教書、還不是全職員工，就常三不五時走過來跟我討論圍棋項目的想法。真的要開始時，我們其實都已經有些準備。
　　既然決定要做圍棋項目，當時我和Demis有一個共識，就是絕對不要複製Erica。Erica其實有它的極限，最勉強的就是達到業餘三段，繼續複製的意義不大。我們想做不一樣的事，希望能運用到深度學習的原理。過了幾個月，團隊又增加了兩個人，包括深度學習之父以及帶動深度學習革命的研究者。
　　我們怎麼判斷深度學習可能應用到圍棋？如果人類可以一看棋盤就知道下哪一步會是好棋，那麼神經網絡也可能辦得到這種“直覺”。但如果人類得想五分鐘才能給出答案，神經網絡可能辦不到。一開始，我們訓練AlphaGo從人類的棋譜去學習人類的直覺。我還記得第一次測試神經網絡，沒想到能表現得那麼好，百分之百對戰都不會輸，是一種碾壓式的勝利。
　　AlphaGo第二個突破的是價值網絡（Value Network）。我記得當David跟我說他有這樣一個點子時，我還質疑，這會成嗎？當我們把策略網絡（Policy Network）做出來後，最強的程式可以達到70%到80％的勝率，算得上是世界最強的。但老闆的目標不只於此，我們又繼續找人、繼續擴充團隊。
　　這過程其實很辛苦，嘗試很多，譬如網絡要多深、要用什麼架構？數據庫有沒有問題？最終檢驗的，還是看AlphaGo有沒有變強。過了一個月之後，我們找到了問題並且解決掉，我仍然記得，舊版AlphaGo配上價值網絡產生的新版AlphaGo，第一次的實驗結果是達到95%的勝率，棋力非常強。可以這麼說，AlphaGo的成功就是深度學習與強化學習的勝利，因為兩者結合在一起，建構判斷形式的價值網絡，後來也成為AlphaGo Zero的主要理論。
　　當價值網絡出來後，Demis希望我們能與歐洲職業一段棋手進行比賽。當下，我除了要做價值網絡，還要研究平行網絡搜索技術，Demis走過來說要比賽，我只想着：真的那麼有信心嗎？
　　後來我們與歐洲圍棋冠軍樊麾進行比賽，最終以5比0獲勝，這結果其實也很不可思議。我記得樊麾輸了第二盤棋後，想出去走走，會說中文的我，原本想去陪他，他揮揮手，“不用，我自己出去透透氣。”
　　難能可貴的是，樊麾是第一個被AI打敗的職業棋士，但他的態度非常正面。樊麾在第五盤棋雖然認輸了，但他對AI並沒有感到害怕，後來甚至也加入了團隊，幫忙測試AlphaGo。
　　當時要把AlphaGo研究投稿到科學期刊《自然》（Nature）也是另一段有趣的故事。我們那時剛弄出價值網絡、剛打敗樊麾，正準備要挑戰韓國職業棋手李世石九段，Demis為什麼又要我們另外花時間去寫論文，而不是準備比賽？為什麼現在就要我們把研究秘密全部公開？
　　Demis給了我一個很有意思的答案。他認為，我們是在做研究，科學的精神就是要互相分享，我們要推動整個領域的進步。也因為要寫論文投稿，和《自然》編輯也事先談好，在出版之前，我們不能和任何人說AlphaGo打敗了樊麾。那幾個月，所有人都憋著不講，當論文刊登之後，才正式向李世石九段提出挑戰。
　　至於後來AlphaGo和李世石的比賽，大家也都知道了。
　　這邊要特別提到的是，TPU（Tensor Processing Unit，谷歌的高性能處理器）在研究過程中對我們有極大的幫助。自從Deepmind加入Google後，我認為Google給我們最大的幫助，就是提供了硬件設備。我還記得當時有一個GPU（圖形處理器）版本，代碼完全一樣，但改用TPU之後，勝率變得強太多。
　　而AlphaGo的故事也還沒結束。

　　就在我們打敗李世石後，很多人認為AlphaGo項目是不是不動了。如果大家還記得，和李世石下棋時，第四盤棋我們輸得很慘。當時我坐在李世石對面，要幫AlphaGo下那幾步棋，明顯知道那些下法是初學者的錯誤，要擺棋很痛苦，甚至會覺得我來下都比AlphaGo來得好。雖然我們最終贏了，但這一盤棋確實有很大的弱點，如果五盤棋內，有20％的錯誤率，這樣的AI系統，你敢用嗎？所以我們決定，一定要把這個弱點解決掉，不只是解決第四盤的問題，是要把AlphaGo項目全面解決。
　　後來過了三個月，我們就把弱點解掉了。怎麼做到的？還是採用深度學習和強化學習的方法，並不是用人類知識的方法。第一，我們加強AlphaGo的學習能力，所謂學習能力就是把網絡程度加深，從第一篇論文的13層加深到40層，而且是改成ResNet。第二個改變是，把策略網絡和神經網絡結合，讓AlphaGo的直覺和判斷一起訓練，使兩者更有一致性。這個解決後的版本，就是Master。
　　我那段時間一直說服團隊，要帶Master上線下棋測試棋力，不要等到Master完全無敵後才下棋。2016年年底，我回到台灣，當時特別低調，在線上中文圍棋網站奕城和野狐申請了帳號，偷偷當職業棋士下棋。12月29號開始，我關在自己的房間裡測試Master，一盤棋下一小時，一早下三盤棋，然後吃飯，下午繼續，晚上吃完飯再繼續，非常累，到晚上眼睛都張不開。
　　我還記得一開始在奕城下棋，沒人要跟經驗值為零的我對弈，直到第二天邀約才陸續上門，到了第三天，還愈來愈多人觀看。那時壓力很大，很怕自己點擊錯誤或是網絡連線斷掉，AlphaGo不能因為我而輸掉啊。
　　我到現在還是很感謝那些曾經和Master對弈的棋手。原本想低調比賽，但後來沒辦法，確實是每一盤都贏、每一盤贏的都是巨大的優勢。這當中，柯潔算是唯一一位可以跟AlphaGo比賽堅持最久的。

　　AlphaGo Zero只用三天走過人類的千年曆程

　　在Master之後，我們研究分出兩條線，一條是讓Master出去比賽，由我來測試，另一條線，則是把所有人類知識拿掉，從零開始學習，看AlphaGo Zero可以達到什麼程度。
　　我們在初期預設AlphaGo Zero絕對不可能贏Master。圍棋被研究了幾千年，一個程序只知道棋盤和規則，一切從零開始，怎麼可能會超越幾千年的圍棋歷史？但我們錯了，40天的訓練後，AlphaGo Zero超越了Master，我們非常意外，深度學習和強化學習的威力太大了。
　　AlphaGo Zero是從亂下開始，找出圍棋的下法，它只用了三天，走過了人類研究圍棋的千年曆程。這也是有趣的地方，人類幾千年的累積，跟科學研究是一致的。
　　AlphaGo Zero前後訓練了40天，但第40天還沒有到達其極限，因為我們機器要做其他事情就先停下了。今年四月，我們也發表了AlphaGo Zero的論文，這篇論文的目的，沒有想要跟人類知識比較、或是討論人類知識有沒有用等問題，而是想證明機器不需要人類知識也可以擁有很強的能力。
　　我認為，未來的人工智能，是要與人類合作，而非跟人類對抗。強人工智能距離我們仍是遙遠，而現在最強的學習技能，其實仍在我們的腦袋裡。

　　高看（每日一圖，與文無關。十一月圖片主題：集市）

　　德國巴伐利亞一小鎮上，初秋一個周末跳蚤市場。

　　近期文章：

　　歷史這一團亂麻，是否真能理出線頭？　　
　　ＢＢＣ給喬治·奧威爾立了一座銅像　　
　　十月革命：理論家的雞湯，陰謀家的雞蛋　　
　　塑造“新人”：紅色帝國的夢囈和結局　　
　　十月革命百年祭來臨，中國人理應關注　　
　　中國詩歌史就是一部中國知識分子夾縫史　　
　　毛左熱捧川普：左派與右派全亂套了　　
　　特朗普來了，你真的不怕？　　
　　個人的粗鄙化與公共權力的粗鄙化


			文章評論

作者：SDK

留言時間：2017-11-18 10:00:32

人類不是在邏輯上甘拜下風，而是在機械計算能力上。人工智能的所有邏輯，包括其學習能力的邏輯，都是人類注入的。


	回復 \| 0 評論前需要先登錄或者註冊哦發表

作者：SDK

留言時間：2017-11-18 09:52:34

"人文學者“討論人工智能，就像中醫討論現代醫學，無非是從貌似哲學的角度說些似是而非，玄而又妙的幾乎正確的廢話。

阿爾法狗或元解決的問題，只不過是一個有明確規則所以可以判斷優劣勝負的遊戲，儘管是一個高級智能遊戲。相對於人類所可能遇到的複雜世界的方方面面，其成功不是簡單可以複製的。作為業內人士，黃士傑很清醒：“強人工智能距離我們仍是遙遠，而現在最強的學習技能，其實仍在我們的腦袋裡。”這是科學的認識。說“人腦不可度量處，恰是AI大顯身手時”，才是痴人囈語。


	回復 \| 0 評論前需要先登錄或者註冊哦發表