設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
老高的博客  
你未必能看到很喜歡的觀點,但一定會進入挑戰性的視野。  
https://blog.creaders.net/u/3843/ > 複製 > 收藏本頁
網絡日誌正文
比起人工智能,人在邏輯上確實甘拜下風 2017-11-14 15:41:33

  人工智能飛速發展,一路輾壓人文學界對它的種種質疑。說人工智能能做什麼很容易,因為相對於人腦,它幾乎無所不能;說人工智能不能做什麼則風險甚高,持論者常因論據失真或前提不確導致結論無效。人腦不可度量處,恰是AI大顯身手時

  老高按:今年中秋節前夕,幾位同窗難得在紐約城郊聚會。這些同窗,有的從中國閃訪,有的在美國蟄居;有的投身媒體,有的經營企業;當天才到的,次日就走的……一別三十年,都有“人生不相見,動如參與商,今夕復何夕,共此燈燭光”(杜甫《贈衛八處士》)之慨,談了美國談中國,談了過去談未來,不知怎麼一來,還談到了人工智能(Artificial Intelligence, AI)對人類的挑戰,給未來增添了越來越濃重的不確定氣氛。
  聊到深夜,酒醒大半,各奔東西。“明日隔山嶽,世事兩茫茫。”這是杜甫那個年代的感嘆,如今不同了!人人有愛瘋,個個有微信,大家共一群,天涯若比鄰。這不,昨晚就收到了其中一位同窗的文章《計劃不是那個計劃,市場也不是那個市場——也說“AI計劃經濟是否可能”》。他說,是那天在紐約市郊聚會,“席間曾提到人工智能話題,現將本人最近心得呈眾學兄,民科之見,見笑見笑!”“民科”,“民間科學家”之謂也,通常帶貶義,他這裡是自謙。
  這位同窗原為南方某省一家報紙的負責人之一,現已退休,既然他用了“老殘油記”的網名,未得其同意,我就不提真實姓名了。這篇文章他已經發表在一家網絡媒體,料想我轉載於此,他不會見怪。這篇文章說是與那夜席間有關,其實倒直接由許成鋼和周為民的文章而來。許成鋼是許良英的大公子,哈佛博士,國內頭銜一大把,國際頭銜更多,倫敦經濟學院教授、哈佛大學國際發展研究所研究員、首爾國立大學講座教授、世行及國際貨幣基金組織顧問等等;周為民這個名字甚為普通,名人中就有好幾位,不知究竟是其中哪一位。他們都被人工智能這一話題所吸引,今後一段時間想必討論更為深入和廣泛。
  也巧,昨天晚上讀到英國《金融時報》中文網發表AlphaGo設計師黃士傑的演講整理稿:《最強的學習技能在人類的腦袋裡》,與我們這裡談到的話題有關,也索性轉貼於此,供大家參考。

  順便提一句,昨天我轉發了紐約時報中文網刊登的文章《中國正想要這樣的特朗普》,在按語中我寫道:“在萬維上,左派博客譴責川普、同情中共;右派博客擁護川普、反對中共——這是大家每天看到的常態。但是現在出現了人們意想不到(其實,是早可料到)的情況,川普與中國竟然合流:中國支持川普,川普對中共、對習近平也好話說盡。”“這奇怪嗎?一點也不奇怪,一點也不令人吃驚!”
  隨後有三位博友跟帖評論,有一位非常痛快地直斥我是“愚蠢之極”,說:即便在萬維這個小世界裡,至少一共有四部分人:反川親中;親川反中;親川親中;反川反中。如果加上中間派,則可細劃為九個部分。他去年就寫過文章《大選將萬維博客分為九塊》。
  他去年的文章我拜讀過,九分法,很有道理!我本人就既反對川普,也反對中共當權者的專制主義。但“九分法”雖有“九分法”的道理,何以與“兩分法”不共戴天?這就像有人說:分紅色、藍色?愚蠢之極:應該分為“深紅”“大紅”“紫紅”“絳紫”“藍紫”“寶藍”“普藍”“深藍”……七種、八種、九種才對!我認同他顏色可以分得更細的觀點,但能說分開紅藍就“愚蠢之極”嗎?
  況且我轉載紐約時報中文網這篇文章,恰恰正是要說明:簡單化地只從意識形態、價值取向來劃分“左派右派”,是多麼彆扭,不合時宜,一遇到現實問題,就解釋不通了!
  今天這位仁兄更撰寫專文:《反川與親共有必然聯繫嗎》,讓我不由得失笑——“反川與親共有必然聯繫嗎?”當然沒有!我本人就是一例:批評川普,但我並不親共。但這位仁兄難道不是自己樹了一個大大的靶子,再來砰砰砰地一通射擊嗎?這裡有誰主張了“反川與親共有必然聯繫”嗎?
  這位仁兄還說:“有人一定要分左右派,想必便於搞運動鬥批改。”不知這是根據什麼邏輯?我想起魯迅在《小雜感》中所說的一段名言:“一見短袖子,立刻想到白臂膊,立刻想到全裸體,立刻想到生殖器,立刻想到性交,立刻想到雜交,立刻想到私生子……”
  還有一位博友,在滿腦子漿糊上跟我有得一拼——我比他唯一強一點的是,我對自己滿腦子漿糊這一點有自知之明,而此兄對此渾然不知。他跟着上面那第一位仁兄說:老高本人就是不斷在演繹“文革”和“階級鬥爭”的思維。呵呵呵,這就相當於從“一見短袖子”,中間什麼聯想環節都不需要,一步就直接跳到“想到私生子”!
  這都是題外話,還是言歸正傳,談談“人工智能”吧。AI是絕不會犯這些邏輯錯誤的,人在AI面前還真不能不氣餒。


  計劃不是那個計劃,市場也不是那個市場

  也說“AI計劃經濟是否可能”

  老殘油記,微博


  一,人腦不可度量處,AI大顯身手時

  關於“AI(人工智能)計劃經濟是否可能”,國內人文學界幾乎眾口一詞:不可能。然而,人工智能的飛速發展卻一路輾壓人文學界對人工智能的種種質疑。目前的情勢是,說人工智能能做什麼很容易,因為相對於人腦,它幾乎無所不能;說人工智能不能做什麼,則風險甚高,持論者常常因論據失真或前提不確,致結論無效。比如,近日網上熱傳的兩篇文章《把市場消滅了,人工智能的基礎也就沒有了》(作者許成鋼)、《計劃經濟不可行性早已證明 大數據也彌補不了》(作者周為民),即無一倖免。
  許文和周文的標題旗幟鮮明,但也直接令人生疑添惑。因為市場只是數據採集的眾多場景之一,斷不至於如許文所說,成為大數據的基礎。至於周文所說公有制計劃經濟之不可行,病根其實也在數據,即數據缺失致“經濟”無從“計劃”(對此,米塞斯在社會主義經濟計算問題論戰中曾有精彩論述);大數據,也不是補漏之器,而是解決之道。除了標題,兩文中的無效論據、論證,也所在多多。比如許文稱,人腦無法感知、無法度量的東西,則人工智能無所施其技(大意)。實情是,人腦智能不可度量,絕不等於人工智能不可度量;而且,人腦不可度量處,恰是AI大顯身手時。
  或許, 人文學界在預測人工智能前景時,應當先嘗試了解人工智能的邏輯理路和技術發展動態,才方便與外界就這一話題作有效率的交流。而學界的認知錯位或缺席,極可能使人類對人工智能失控的局面提前到來。
  何為人工智能邏輯理路?以筆者“民科之見”,其要義或可簡化為三層意思:1)大千世界無處不在的“數學法則”,才是真正的宇宙之王;2)世間萬象,都可以簡化和還原為數據,人腦,則是一台功力強大的數據處理系統;3)人腦的反應和思維過程(包括直覺、創見、靈感),實質是數據採集、識別、整理的複雜計算過程。本乎此,AI界堅信,如果能解開人腦思維之謎,便極有可能研發出效率萬千倍勝過人腦算力的人工智能系統。而人工智能狂飈突進的發展,也正加速將AI業界的信心、信念升華為信仰。
  最新實例,是前科棋聖“阿法狗” (AlphaGo)的胞弟“阿法元”(AlphaGo Zero)。

  二,天不生AI,萬古如長夜

  與從小熟讀兵書、“打譜”無數,並與人類棋手反覆對弈、切磋的“阿法狗”不同, “阿法元”小弟生性孤傲,對於集人類圍棋實戰之大成的“文獻資料”(棋譜)不屑一顧,也不願屈尊讓出一席之地,邀人間棋王手談。如此妙手空空,從零開始,自我對弈,自學成才,三天過後,“阿法元”便批量報捷,將不久前橫掃地球九段人的“阿法狗”殺了個100:0。“阿法元”這一大開殺戒的弒兄戰績意味着,在人工智能面前,人類圍棋領域過往的全部經驗性事實和思考成果,價值歸零。難怪弈壇少帥柯潔聞訊後,在微博上敲下了六個字:“人類太多餘了”。
  
https://wx2.sinaimg.cn/large/593b3de4gy1fldcfzlcszj20ik0apjrr.jpg  棋壇少帥柯潔與“阿法狗”對陣落敗後,淚灑沙場(網絡圖片)

​  “山外青山樓外樓”。繼乃兄之後,“阿法元”再次提醒人類,圍棋招式變化如恆河沙數(據說高達10的170次方,而宇宙已知部分的原子數不過10的80次方),人腦思維半徑所及,不過滄海一粟。數千年來,人類歷代棋手殫精竭慮參悟出來的各種定式、變招,一夜之間,淪為井底蝸殼的“局部最優”。圍棋領域如此,其它領域又如何?初思甚喜,細思極恐。
  綜上所述,人工智能的出現,是名副其實的“劃時代”事件。此前,人類社會只有一個智能系統,即人腦智能系統。由於人腦綜合計算(數據採集、識別、整理)能力遠高於其它動物腦,人類曾信心滿滿地自詡為“宇宙的精華、萬物的靈長”。人工智能橫空出世,將使人類擁有兩個智能系統:人腦智能系統與人工智能系統。更令人類猝不及防的是,人工智能算力之強大,使千百年來困惑人腦的難題,紛紛於一夜之間迎刃而解,而人類千百年來引以為榮的智慧文明成果,也將紛紛於一夜之間淪為偏安一隅的“局部最優”。
  關於人工智能的劃時代意義,或可化用人腦智能名句形容:“天不生AI,萬古如長夜”。

  三,勿以人腦之心,度AI之腹

  回到計劃經濟和市場經濟話題。
  先說公有制計劃經濟。如果我們依前述思路,把“計劃”理解為“數據處理”,把“計劃經濟”理解為基於大數據處理的資源優化配置總體方案,那麼,公有制計劃經濟不過是一種既定算力不足致不可計算、無法落地的“空中樓閣”。對於這一議題,奧地利學派主帥米塞斯曾有“蓋棺”之論,其極簡版表述大約為:公有制致生產資料無交易對手,無交易則無價格,無價格則無從計算。不幸的是,近百年來總有偉人一意孤行,在人類社會重複這種具有先天缺陷,註定失敗的烏托邦實驗。
  需要指出的是,公有制計劃經濟悲慘的實驗記錄,或許可以作為人腦算力有限的“旁證”,但並不能據此推出人類經濟活動不可“計劃”、大數據和人工智能對經濟領域無效的結論。強調這一點,是因為許多學者對人工智能計劃經濟的質疑乃至聲討,不過是將此前學界(尤其是奧派)對公有制計劃經濟理論的深刻批判,直接移作對未來AI計劃經濟的預判。這樣的預判,相當於人間弈者持棋譜評點“阿法元”的落子,是一種“以人腦智能之心,度人工智能之腹”的莽撞之舉。
  附帶一提。以“無法計算” 瓦解公有制計劃經濟理論的米塞斯,邏輯上其實為人工智能計劃經濟預留有邊窗後門——果若算力足夠,爾等不妨一試。
  再說市場經濟。依同一思路,市場經濟不過是人類直面人腦算力有限的現實,經反覆試錯形成的一種次優解決方案。相比公有制計劃經濟,市場經濟可操作性強,而且具有前者望塵莫及的高效率。但是,它仍然受制於既定算力不足的瓶頸,存在貧富不均、市場試錯損耗等不盡如人意之處,仍然只是一種“局部最優”,甚至 “局部次優”。
  隨着人工智能的高速發展,人類有充分理由期待迎來一種非人腦算力可逮、趨於整體最優的資源配置方案,即“AI計劃經濟”。 “AI計劃經濟”決不是公有制計劃經濟的翻版,也不是簡單地在市場經濟中植入一套人工智能系統。說到底,它與公有制計劃經濟及自由市場經濟的區別,不在生產資料公有或私有、一黨專制或三權分立等頂層“構件”,而在最基礎,也是最本質的純技術因素——算法精妙,算力強大,強大到既可規避公有制計劃經濟之禍,又足以摸到市場經濟的“無形之手”,並從容超越之。
  囿於人腦算力,人們目前還難以想象和描述未來AI計劃經濟的種種細節,但可以肯定,屆時,計劃不是那個計劃,市場也不是那個市場——或許,市場也“太多餘了”。


  AlphaGo設計師黃士傑:最強的學習技能在人類的腦袋裡

  英國《金融時報》中文網,2017年11月14日

  AlphaGo的“人肉手臂”、擔任Deepmind資深研究員的黃士傑,在近期公開演講中,分享他身為一名科學家,如何旁觀機器的進步。

  沒有人會否認,AlphaGo在過去一年炒熱全球對人工智能的關注。
  2016年3月,谷歌Deepmind旗下的圍棋程序AlphaGo,以4比1的成績戰勝韓國職業棋手李世石。一年後,拿掉所有人類知識、完全靠自學的AlphaGo Zero,在今年10月又以100比0的戰績碾壓“AI前輩”AlphaGo。從擊敗人類、到自學成材,AlphaGo的進展超乎預期,研發團隊也自然成為關注焦點。這當中,被稱為AlphaGo的“人肉手臂”,替AlphaGo向棋聖聶衛平說“謝謝聶老師”的黃士傑(Aja Huang),就是AlphaGo發展的重要推手。
  1978年出生、現任Deepmind資深研究員的黃士傑,私底下是圍棋業餘六段,在每一場人機對戰中,都代表AlphaGo落子。但他不只是手腳,更貼近他身分的描述,其實是AlphaGo的設計者、是AlphaGo的大腦。讓AlphaGo登上科學期刊《自然》(Nature)封面的那篇知名論文,黃士傑並列為第一作者。
  上周五(11月10日)在台灣中研院舉辦的“2017年人工智慧年會”上,黃士傑首次把AlphaGo的研發過程公開說清楚,除了透露新一代AlphaGo Zero的能力還沒達到極限,他更多的是去分享身為一名科學家,旁觀機器的進步,以及一個科學團隊對基礎研究的使命和專注。
  以下是編輯後的演講摘錄:

  AlphaGo的研發過程,有四個時刻對我影響很大。
  第一,是我們在韓國贏了李世石。當我們開始做AlphaGo時,沒想到它會變得那麼強。在韓國贏了李世石後,DeepMind首席執行官Demis Hassabis立刻發了一個推特,說“我們登上月球”(We landed it on the moon.)。我明白Demis那天的感覺,這是我們團隊的一小步,但卻是人類的一大步。
  第二個時刻,是我在網絡上操作AlphaGo升級版“Master”,下了60盤棋。我從小喜歡下棋,在台灣是業餘六段。Master在網絡上對弈的對象,都是我從小崇拜的人。雖然不是我真正在下棋,但卻感到非常榮幸。
  第三個時刻,是今年在烏鎮進行的人機大戰,由我操作AlphaGo和世界冠軍柯潔九段下棋。柯潔還不滿20歲,非常年輕,當天比賽氛圍和李世石對弈時很不同。我記得在韓國比賽,能感受到李世石承受到很大的壓力,感覺他是在為人類而戰。我當時坐在他對面,也儘量保持謹慎的態度,不喝水、不去上洗手間。但到了第二次和柯潔對弈,比較像是人機合作的氣氛,柯潔還走過來說:“黃博士,很榮幸跟AlphaGo下棋”,坦白說我有點驚訝。這也讓我們知道,如果Master是無敵的,那機器存在價值到底在哪裡?應該是要幫助棋手擴張思路、擴展圍棋理論。
  第四次對我意義重大的時刻,是AlphaGo Zero的出現。什麼是AlphaGo Zero?我們拿掉所有人類對圍棋的知識,只餵AlphaGo Zero圍棋規則,讓它自己學習下棋。我回想起讀博士班的熬夜日子,就是不斷寫代碼、找bug,每天做測試,讓程序進步。但AlphaGo Zero把我過去的所有東西全部取代,它完全不需要我的幫助。有同事問我,Aja,AlphaGo Zero把你這十幾年來對圍棋計算機的研究,一點一點的拿掉,甚至還超越你,有什麼感覺?我的確心情複雜,但後來跟同事說,這會是一個趨勢,如果我阻礙了AlphaGo,我確實應該被拿掉(笑)。AlphaGo有99%的知識是我做的,AlphaGo能走到這一步,我已經很滿足,找到了收尾。

  AlphaGo是怎麼開始的?

  回到一開始,AlphaGo到底是怎麼開始的?起點是有三組人馬的聚集:Deepmind首席執行官Demis Hassabis與AlphaGo項目領導David Silver、我、還有兩位谷歌大腦(Google brain)的同事Chris Maddison和Ilya Sutskever。
  Demis和David原本是劍橋大學的同學,友情深厚。對西方人來說,當1997年IBM超級電腦“深藍”贏了西洋棋棋王卡斯巴羅夫之後,就只剩下流傳幾千年的中國圍棋,是人工智能發展的極大挑戰。一開始,很多研究人員想把研究西洋棋的技術移到圍棋上,但都失敗了。在2006年蒙特卡洛樹搜索出來後,研究才提升一階,讓機器棋手的水平能達到業餘三段,但離職業棋士一段還有距離。Demis和David心中開始藏有一個夢,希望有一天要能做出一個很強的圍棋程序。
  但有夢的不只有他們,故事的另一條線還有我。
  在就讀台灣師範大學資訊工程博士班時,我每天埋頭解bug、寫代碼,就是希望做一個很強的圍棋程序。2010年,我研發出的圍棋計算機程序Erica(事實上是用我妻子的名字來命名),在計算機奧林匹亞獲得19路圍棋的冠軍。雖然Erica只是單機版,但它打敗了用了6台PC的日本程序Zen跟其他參賽者,就像小蝦米對抗大鯨魚。當年還在英國當教授的David,在比賽後寫信問我有沒有興趣加入Deepmind,隔年我也正式加入團隊,成為第40號員工。
  我還記得當年面試,老闆問我,能做出Erica有什麼感覺?我回答,滿有成就的。Demis點頭,他明白我的感覺。
  2014年,Google收購Deepmind,AlphaGo項目也正式浮現。Demis起初還在教書、還不是全職員工,就常三不五時走過來跟我討論圍棋項目的想法。真的要開始時,我們其實都已經有些準備。
  既然決定要做圍棋項目,當時我和Demis有一個共識,就是絕對不要複製Erica。Erica其實有它的極限,最勉強的就是達到業餘三段,繼續複製的意義不大。我們想做不一樣的事,希望能運用到深度學習的原理。過了幾個月,團隊又增加了兩個人,包括深度學習之父以及帶動深度學習革命的研究者。
  我們怎麼判斷深度學習可能應用到圍棋?如果人類可以一看棋盤就知道下哪一步會是好棋,那麼神經網絡也可能辦得到這種“直覺”。但如果人類得想五分鐘才能給出答案,神經網絡可能辦不到。一開始,我們訓練AlphaGo從人類的棋譜去學習人類的直覺。我還記得第一次測試神經網絡,沒想到能表現得那麼好,百分之百對戰都不會輸,是一種碾壓式的勝利。
  AlphaGo第二個突破的是價值網絡(Value Network)。我記得當David跟我說他有這樣一個點子時,我還質疑,這會成嗎?當我們把策略網絡(Policy Network)做出來後,最強的程式可以達到70%到80%的勝率,算得上是世界最強的。但老闆的目標不只於此,我們又繼續找人、繼續擴充團隊。
  這過程其實很辛苦,嘗試很多,譬如網絡要多深、要用什麼架構?數據庫有沒有問題?最終檢驗的,還是看AlphaGo有沒有變強。過了一個月之後,我們找到了問題並且解決掉,我仍然記得,舊版AlphaGo配上價值網絡產生的新版AlphaGo,第一次的實驗結果是達到95%的勝率,棋力非常強。可以這麼說,AlphaGo的成功就是深度學習與強化學習的勝利,因為兩者結合在一起,建構判斷形式的價值網絡,後來也成為AlphaGo Zero的主要理論。
  當價值網絡出來後,Demis希望我們能與歐洲職業一段棋手進行比賽。當下,我除了要做價值網絡,還要研究平行網絡搜索技術,Demis走過來說要比賽,我只想着:真的那麼有信心嗎?
  後來我們與歐洲圍棋冠軍樊麾進行比賽,最終以5比0獲勝,這結果其實也很不可思議。我記得樊麾輸了第二盤棋後,想出去走走,會說中文的我,原本想去陪他,他揮揮手,“不用,我自己出去透透氣。”
  難能可貴的是,樊麾是第一個被AI打敗的職業棋士,但他的態度非常正面。樊麾在第五盤棋雖然認輸了,但他對AI並沒有感到害怕,後來甚至也加入了團隊,幫忙測試AlphaGo。
  當時要把AlphaGo研究投稿到科學期刊《自然》(Nature)也是另一段有趣的故事。我們那時剛弄出價值網絡、剛打敗樊麾,正準備要挑戰韓國職業棋手李世石九段,Demis為什麼又要我們另外花時間去寫論文,而不是準備比賽?為什麼現在就要我們把研究秘密全部公開?
  Demis給了我一個很有意思的答案。他認為,我們是在做研究,科學的精神就是要互相分享,我們要推動整個領域的進步。也因為要寫論文投稿,和《自然》編輯也事先談好,在出版之前,我們不能和任何人說AlphaGo打敗了樊麾。那幾個月,所有人都憋著不講,當論文刊登之後,才正式向李世石九段提出挑戰。
  至於後來AlphaGo和李世石的比賽,大家也都知道了。
  這邊要特別提到的是,TPU(Tensor Processing Unit,谷歌的高性能處理器)在研究過程中對我們有極大的幫助。自從Deepmind加入Google後,我認為Google給我們最大的幫助,就是提供了硬件設備。我還記得當時有一個GPU(圖形處理器)版本,代碼完全一樣,但改用TPU之後,勝率變得強太多。
  而AlphaGo的故事也還沒結束。

  就在我們打敗李世石後,很多人認為AlphaGo項目是不是不動了。如果大家還記得,和李世石下棋時,第四盤棋我們輸得很慘。當時我坐在李世石對面,要幫AlphaGo下那幾步棋,明顯知道那些下法是初學者的錯誤,要擺棋很痛苦,甚至會覺得我來下都比AlphaGo來得好。雖然我們最終贏了,但這一盤棋確實有很大的弱點,如果五盤棋內,有20%的錯誤率,這樣的AI系統,你敢用嗎?所以我們決定,一定要把這個弱點解決掉,不只是解決第四盤的問題,是要把AlphaGo項目全面解決。
  後來過了三個月,我們就把弱點解掉了。怎麼做到的?還是採用深度學習和強化學習的方法,並不是用人類知識的方法。第一,我們加強AlphaGo的學習能力,所謂學習能力就是把網絡程度加深,從第一篇論文的13層加深到40層,而且是改成ResNet。第二個改變是,把策略網絡和神經網絡結合,讓AlphaGo的直覺和判斷一起訓練,使兩者更有一致性。這個解決後的版本,就是Master。
  我那段時間一直說服團隊,要帶Master上線下棋測試棋力,不要等到Master完全無敵後才下棋。2016年年底,我回到台灣,當時特別低調,在線上中文圍棋網站奕城和野狐申請了帳號,偷偷當職業棋士下棋。12月29號開始,我關在自己的房間裡測試Master,一盤棋下一小時,一早下三盤棋,然後吃飯,下午繼續,晚上吃完飯再繼續,非常累,到晚上眼睛都張不開。
  我還記得一開始在奕城下棋,沒人要跟經驗值為零的我對弈,直到第二天邀約才陸續上門,到了第三天,還愈來愈多人觀看。那時壓力很大,很怕自己點擊錯誤或是網絡連線斷掉,AlphaGo不能因為我而輸掉啊。
  我到現在還是很感謝那些曾經和Master對弈的棋手。原本想低調比賽,但後來沒辦法,確實是每一盤都贏、每一盤贏的都是巨大的優勢。這當中,柯潔算是唯一一位可以跟AlphaGo比賽堅持最久的。

  AlphaGo Zero只用三天走過人類的千年曆程

  在Master之後,我們研究分出兩條線,一條是讓Master出去比賽,由我來測試,另一條線,則是把所有人類知識拿掉,從零開始學習,看AlphaGo Zero可以達到什麼程度。
  我們在初期預設AlphaGo Zero絕對不可能贏Master。圍棋被研究了幾千年,一個程序只知道棋盤和規則,一切從零開始,怎麼可能會超越幾千年的圍棋歷史?但我們錯了,40天的訓練後,AlphaGo Zero超越了Master,我們非常意外,深度學習和強化學習的威力太大了。
  AlphaGo Zero是從亂下開始,找出圍棋的下法,它只用了三天,走過了人類研究圍棋的千年曆程。這也是有趣的地方,人類幾千年的累積,跟科學研究是一致的。
  AlphaGo Zero前後訓練了40天,但第40天還沒有到達其極限,因為我們機器要做其他事情就先停下了。今年四月,我們也發表了AlphaGo Zero的論文,這篇論文的目的,沒有想要跟人類知識比較、或是討論人類知識有沒有用等問題,而是想證明機器不需要人類知識也可以擁有很強的能力。
  我認為,未來的人工智能,是要與人類合作,而非跟人類對抗。強人工智能距離我們仍是遙遠,而現在最強的學習技能,其實仍在我們的腦袋裡。

  高看(每日一圖,與文無關。十一月圖片主題:集市)

10Oberstaufen3.JPG

  德國巴伐利亞一小鎮上,初秋一個周末跳蚤市場。

  近期文章:

  歷史這一團亂麻,是否真能理出線頭?  
  
BBC給喬治·奧威爾立了一座銅像  
  
十月革命:理論家的雞湯,陰謀家的雞蛋  
  
塑造“新人”:紅色帝國的夢囈和結局  
  
十月革命百年祭來臨,中國人理應關注  
  
中國詩歌史就是一部中國知識分子夾縫史  
  
毛左熱捧川普:左派與右派全亂套了  
  
特朗普來了,你真的不怕?  
  個人的粗鄙化與公共權力的粗鄙化

瀏覽(1980) (5) 評論(2)
發表評論
文章評論
作者:SDK 留言時間:2017-11-18 10:00:32

人類不是在邏輯上甘拜下風,而是在機械計算能力上。人工智能的所有邏輯,包括其學習能力的邏輯,都是人類注入的。

回復 | 0
作者:SDK 留言時間:2017-11-18 09:52:34

"人文學者“討論人工智能,就像中醫討論現代醫學,無非是從貌似哲學的角度說些似是而非,玄而又妙的幾乎正確的廢話。

阿爾法狗或元解決的問題,只不過是一個有明確規則所以可以判斷優劣勝負的遊戲,儘管是一個高級智能遊戲。相對於人類所可能遇到的複雜世界的方方面面,其成功不是簡單可以複製的。作為業內人士,黃士傑很清醒:“強人工智能距離我們仍是遙遠,而現在最強的學習技能,其實仍在我們的腦袋裡。”這是科學的認識。說“人腦不可度量處,恰是AI大顯身手時”,才是痴人囈語。

回復 | 0
我的名片
高伐林
註冊日期: 2010-05-22
訪問總量: 18,806,608 次
點擊查看我的個人資料
Calendar
我的公告欄
文章歡迎轉載,請注作者出處
最新發布
· 離世整整兩年了,她的星光依然在
· 川普被認定是一霸,不過,是惡霸
· 非不能也,是不願也:川普為何不
· 貼在川普頭上的這些標籤是不是大
· 四十六年前離經叛道之舉,如今竟
· 從“天下大亂”到“大亂天下”的歷史
· 川普的外交:一位帝國精算師的精
友好鏈接
· 虎貓:張石的博客
· 姜克實:姜克實的博客
· 壹嘉出版:壹嘉出版的博客
· 旅泉:旅泉的博客
· 懷斯:懷斯的博客
· 雲鄉客:雲鄉客的博客
· 吳言:吳言的博客
· 寡言:寡言的博客
· lone-shepherd:牧人的博客
· 藝萌:藝萌的博客
· 德孤:德孤的小島
· 馬黑:馬黑的博客
· 郭家院子:郭家院子
· 暗夜尋燈:暗夜尋燈的博客
· 史語:史語的博客
· 王清和:《金瓶梅》揭密市井私生
· 晚秋心情:不繫之舟
· 阿妞不牛:阿妞不牛的博客
· 解濱:解濱
· 汪翔:汪 翔
· 星辰的翅膀:星辰的翅膀
· 歐陽峰:歐陽峰的blog
分類目錄
【詩】
· 譯者眼中先天下之憂而憂的作家,
· 《愛是如此憂傷》記錄了我們一代
· 2024這一年經歷了什麼?藉助這篇
· 她的文字,是可以交到嬰兒面前的
· “雖九死其猶未悔”?十死呢,該不
· 一部童話引發圖書界難得一見的翻
· 讀書要讀有趣的書:走這一條捷徑
· 《長安三萬里》藏着大國由盛轉衰
· 世界上沒有任何人是不受瘟疫侵襲
· 推薦三部中國作家描寫瘟疫的優秀
【識】
· 川普被認定是一霸,不過,是惡霸
· 川普的外交:一位帝國精算師的精
· 川普對“92%”這個數字為何格外鍾
· 海外中文出版的新路基本開通,傳
· 要麼人口下降,要麼引進移民,兩
· 一個世紀的輪迴:美國從拒不就任
· 一本帶笑點的書,展示一個最嚴峻
· 是不是可以放下心來,聽憑“糾錯
· 川普治國:美國的自由市場體系正
· 美國精英中左翼思想占上風是競爭
【史】
· 離世整整兩年了,她的星光依然在
· 四十六年前離經叛道之舉,如今竟
· 從“天下大亂”到“大亂天下”的歷史
· 你站在橋上看風景,看風景人在樓
· 中央下死命令逼李井泉必須往外調
· 跟着依娃走陝西——讀依娃小說集斷
· 想起電視劇里說的:“你爺爺一失
· 閱兵就閱兵吧,怎好意思說是紀念
· 許倬云:歷史學最動人之處,在於
· 《1984》又被禁了!這次是在美國
【事】
· 一位美國總統的格陵蘭情結:它就
· 女孩就在那兒,但是你休想見到她
· 重發一篇舊文,緬懷“中國最後一
· 美籍華人在紐約市長選舉上的代際
· 請用文明作為政治鬥爭的武器——也
· 這一場白宮晚宴可能影響美國未來
· 訂正一個民間失實之辭也並不是輕
· 愛潑斯坦檔案會讓川普陷入最大的
· 這還是美國?這就是美國——這不是
· 人養金毛犬,我養白眼狼:伊朗從
【視】
· 好萊塢科幻題材電影大盤點
· 橫跨美國之旅(第17天續):如何
· 橫跨美國之旅(第17天):在“911
· 橫跨美國之旅(第16天):見識了
· 橫跨美國之旅(第15天續):地平
· 橫跨美國之旅(第15天):第一位
· 橫跨美國之旅(第14天續):一所
· 橫跨美國之旅(第14天):不期而
· 橫跨美國之旅(第13天):在造物
· 橫跨美國之旅(第12天):把開胃
【拾】
· 非不能也,是不願也:川普為何不
· 貼在川普頭上的這些標籤是不是大
· 幹掉獨裁者雖難,更難的是收拾獨
· 川普說曾親自直接對馬杜羅勸降“
· 未來很可能還是一個左的世界——取
· 中國的名校校長們 Vs.美國的名校
· 兩位學術巨擘的恩怨爭辯,催生了
· 誰吹響了美國民主燈塔的熄燈號?
· 若書名之外還要個副標題,建議加
· 既是一份告別信,也是一份懺悔錄
存檔目錄
2026-01-03 - 2026-01-31
2025-12-01 - 2025-12-29
2025-11-02 - 2025-11-25
2025-10-08 - 2025-10-29
2025-09-01 - 2025-09-16
2025-08-04 - 2025-08-29
2025-07-01 - 2025-07-31
2025-06-10 - 2025-06-30
2025-05-06 - 2025-05-30
2025-04-01 - 2025-04-28
2025-03-03 - 2025-03-31
2025-02-03 - 2025-02-24
2025-01-02 - 2025-01-27
2024-12-02 - 2024-12-30
2024-11-01 - 2024-11-25
2024-10-07 - 2024-10-31
2024-09-03 - 2024-09-30
2024-08-05 - 2024-08-29
2024-07-08 - 2024-07-29
2024-06-03 - 2024-06-27
2024-05-06 - 2024-05-30
2024-04-29 - 2024-04-29
2024-03-04 - 2024-03-31
2024-02-17 - 2024-02-28
2024-01-02 - 2024-01-02
2023-12-04 - 2023-12-26
2023-11-06 - 2023-11-27
2023-10-02 - 2023-10-30
2023-09-04 - 2023-09-25
2023-08-01 - 2023-08-28
2023-07-03 - 2023-07-28
2023-06-02 - 2023-06-30
2023-05-01 - 2023-05-31
2023-04-03 - 2023-04-28
2023-03-01 - 2023-03-31
2023-02-01 - 2023-02-27
2023-01-02 - 2023-01-30
2022-12-07 - 2022-12-30
2022-10-03 - 2022-10-17
2022-09-02 - 2022-09-30
2022-08-01 - 2022-08-31
2022-07-01 - 2022-07-29
2022-06-01 - 2022-06-29
2022-05-03 - 2022-05-30
2022-04-06 - 2022-04-29
2022-03-01 - 2022-03-31
2022-02-01 - 2022-02-28
2022-01-02 - 2022-01-27
2021-12-02 - 2021-12-31
2021-11-04 - 2021-11-23
2021-10-01 - 2021-10-30
2021-09-04 - 2021-09-30
2021-08-01 - 2021-08-24
2021-07-01 - 2021-07-28
2021-06-02 - 2021-06-28
2021-05-06 - 2021-05-27
2021-04-02 - 2021-04-26
2021-03-01 - 2021-03-31
2021-02-02 - 2021-02-25
2021-01-01 - 2021-01-30
2020-12-01 - 2020-12-30
2020-11-01 - 2020-11-30
2020-10-07 - 2020-10-29
2020-09-02 - 2020-09-30
2020-08-03 - 2020-08-31
2020-07-04 - 2020-07-29
2020-06-02 - 2020-06-24
2020-05-01 - 2020-05-31
2020-04-02 - 2020-04-30
2020-03-01 - 2020-03-30
2020-02-03 - 2020-02-29
2020-01-01 - 2020-01-27
2019-12-05 - 2019-12-27
2019-11-08 - 2019-11-26
2019-10-01 - 2019-10-29
2019-09-02 - 2019-09-27
2019-08-01 - 2019-08-30
2019-07-17 - 2019-07-31
2019-06-01 - 2019-06-29
2019-05-01 - 2019-05-31
2019-04-01 - 2019-04-30
2019-03-01 - 2019-03-29
2019-02-01 - 2019-02-28
2019-01-01 - 2019-01-31
2018-12-01 - 2018-12-31
2018-11-05 - 2018-11-30
2018-10-01 - 2018-10-18
2018-09-03 - 2018-09-28
2018-08-01 - 2018-08-31
2018-07-02 - 2018-07-31
2018-06-01 - 2018-06-29
2018-05-01 - 2018-05-31
2018-04-02 - 2018-04-30
2018-03-01 - 2018-03-30
2018-02-01 - 2018-02-28
2018-01-01 - 2018-01-31
2017-12-01 - 2017-12-29
2017-11-01 - 2017-11-30
2017-10-02 - 2017-10-31
2017-09-01 - 2017-09-28
2017-08-01 - 2017-08-31
2017-07-03 - 2017-07-31
2017-06-01 - 2017-06-30
2017-05-01 - 2017-05-31
2017-04-03 - 2017-04-16
2017-03-01 - 2017-03-30
2017-02-02 - 2017-02-28
2017-01-02 - 2017-01-31
2016-12-03 - 2016-12-31
2016-11-01 - 2016-11-30
2016-10-03 - 2016-10-22
2016-09-01 - 2016-09-30
2016-08-01 - 2016-08-31
2016-07-14 - 2016-07-29
2016-06-01 - 2016-06-22
2016-05-02 - 2016-05-31
2016-04-04 - 2016-04-28
2016-03-01 - 2016-03-31
2016-02-01 - 2016-02-29
2016-01-01 - 2016-01-31
2015-12-01 - 2015-12-31
2015-11-01 - 2015-11-30
2015-10-09 - 2015-10-31
2015-09-01 - 2015-09-28
2015-08-01 - 2015-08-28
2015-07-01 - 2015-07-31
2015-06-01 - 2015-06-30
2015-05-01 - 2015-05-28
2015-04-02 - 2015-04-30
2015-03-02 - 2015-03-31
2015-02-07 - 2015-02-28
2015-01-01 - 2015-01-29
2014-12-01 - 2014-12-23
2014-11-03 - 2014-11-26
2014-10-01 - 2014-10-29
2014-09-01 - 2014-09-30
2014-08-01 - 2014-08-29
2014-07-01 - 2014-07-30
2014-06-03 - 2014-06-30
2014-05-03 - 2014-05-31
2014-04-02 - 2014-04-29
2014-03-02 - 2014-03-31
2014-02-02 - 2014-02-28
2014-01-01 - 2014-01-31
2013-12-01 - 2013-12-30
2013-11-01 - 2013-11-29
2013-10-01 - 2013-10-31
2013-09-02 - 2013-09-30
2013-08-01 - 2013-08-28
2013-07-01 - 2013-07-29
2013-06-02 - 2013-06-28
2013-05-03 - 2013-05-31
2013-04-02 - 2013-04-30
2013-03-04 - 2013-03-31
2013-02-04 - 2013-02-27
2013-01-02 - 2013-01-31
2012-12-02 - 2012-12-31
2012-11-03 - 2012-11-30
2012-10-01 - 2012-10-28
2012-09-10 - 2012-09-27
2012-08-01 - 2012-08-27
2012-07-01 - 2012-07-31
2012-06-01 - 2012-06-29
2012-05-01 - 2012-05-31
2012-04-01 - 2012-04-30
2012-03-02 - 2012-03-29
2012-02-01 - 2012-02-27
2012-01-02 - 2012-01-31
2011-12-01 - 2011-12-31
2011-11-02 - 2011-11-30
2011-10-01 - 2011-10-29
2011-09-01 - 2011-09-29
2011-08-01 - 2011-08-31
2011-07-01 - 2011-07-31
2011-06-01 - 2011-06-30
2011-05-01 - 2011-05-31
2011-04-01 - 2011-04-29
2011-03-02 - 2011-03-31
2011-02-02 - 2011-02-28
2011-01-02 - 2011-01-31
2010-12-01 - 2010-12-30
2010-11-01 - 2010-11-30
2010-10-04 - 2010-10-31
2010-09-03 - 2010-09-30
2010-08-01 - 2010-08-31
2010-07-01 - 2010-07-30
2010-06-01 - 2010-06-30
2010-05-21 - 2010-05-31
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.