-
陳經:AlphaGo升級成Master后的算法框架分析
關鍵字: 圍棋AlphaGoMaster算法框架【文/觀察者網專欄作者 陳經】
2016年12月29日至2017年1月4日,谷歌AlphaGo的升級版本以Master為名,在弈城圍棋網和野狐圍棋網的快棋比賽中對人類最高水平的選手取得了60:0的壓倒戰績,再次讓人們對圍棋AI的實力感到震驚。
之前《自然》論文對AlphaGo的算法進行了非常細致的介紹,世界各地不少研發團隊根據這個論文進行了圍棋AI的開發。其中進展最大的應該是騰訊開發的“刑天”(以及之前的版本“絕藝”),職業棋手和棋迷們感覺它的實力達到了2016年3月與李世石對戰的AlphaGo版本。但是經過近一年的升級,Master的實力顯然比之前版本要強得多,它背后的算法演變成什么樣了,卻幾乎沒有資料。本文對AlphaGo的升級后的算法框架進行深入的分析與猜測,試圖從計算機算法角度揭開它的神秘面紗一角。
在1月4日AlphaGo團隊的正式聲明中,Deepmind提到了“our new prototype version(我們新的原型版本)”。prototype這個詞在軟件工程領域一般對應一個新的算法框架,并不是簡單的性能升級,可能是算法原理級的改變。由于資料極少,我只能根據很少的一些信息,以及Master的實戰表現對此進行分析與猜測。
下文中,我們將2015年10月戰勝樊麾二段的AlphaGo版本稱為V13,將2016年3月戰勝李世石的版本稱為V18,將升級后在網絡上60:0戰勝人類高手群體的版本稱為V25(這個版本Deepmind內部應該有不同的稱呼)。
V13與V25:從廖化到關羽
版本V13的戰績是,正式的慢棋5:0勝樊麾,棋譜公布了,非正式的快棋3:2勝樊麾,棋譜未公布。樊麾非正式快棋勝了兩局,這說明版本V13的快棋實力并不是太強。
版本V18的戰績是,每方2小時3次1分鐘讀秒的慢棋,以4:1勝李世石。比賽中AlphaGo以非常穩定的1分鐘1步的節奏下棋。比賽用的分布式機器有1202個CPU和176個GPU,據說每下一局光電費就要3000美元。
版本V25的戰績是,Master以60:0戰勝30多位人類棋手,包括排名前20位的所有棋手。比賽大部分是3次30秒讀秒的快棋,開始10多局人們關注不多時是20秒讀秒用時更短,僅有一次60秒讀秒是照顧年過六旬的聶衛平。比賽中Master每步幾乎都在8秒以內落子,從未用掉過讀秒(除了一次意外掉線),所以20秒或者30秒對機器是一回事。在KGS上天元開局三局虐殺ZEN的GodMoves很可能也是版本V25,這三局也是快棋,GodMoves每步都是幾秒,用時只有ZEN的一半。
可以看出,版本V13的快棋實力不強。而版本V18的快棋實力應該也不如慢棋,谷歌為了確保勝利,用了分布式的版本而非48個CPU與8個GPU的單機版,還用了每步1分鐘這種在AI中算多的每步用時。在比賽中,有時AlphaGo的剩余用時甚至比李世石少了。應該說這時的AlphaGo版本有堆機器提升棋力的感覺,和IBM在1997年與卡斯帕羅夫的國際象棋人機大戰時的做法類似。
但是版本V25在比賽用時上進步很大,每步8秒比版本V18快了六七倍,而棋力卻提升很大。柯潔與樸廷桓在30秒用時的比賽中能多次戰勝與版本V18實力相當的刑天,同樣的用時對Master幾盤中卻毫無機會。應該說版本V25在用時大大減少的同時還取得了棋力巨大的進步,這是雙重的進步,一定是因為算法原理有了突破,絕對不是靠提升機器性能。而這與國際像棋AI的進步過程有些類似。
IBM在人機大戰中戰勝卡斯帕羅夫后解散了團隊不玩了,但其它研究者繼續開發國際象棋AI取得了巨大的進步。后來算法越做越厲害,最厲害的程序能讓人類最高水平的棋手一個兵或者兩先。水平極高的國際象棋AI不少,其中一個是鱈魚(stockfish),由許多開發者集體開發,攻殺凌厲,受到愛好者追捧。
另一個是變色龍(Komodo),由一個國際象棋大師和一個程序員開發,理論體系嚴謹,攻防穩健。AI互相對局比人類多得多,二者對下100盤,變色龍以9勝89平2負領先人氣高的鱈魚。因為AI在平常的手機上都可以戰勝人類最高水平的棋手,國際象棋(以及類似的中國象棋)都禁止棋手使用手機,曾經有棋手頻繁上廁所看手機被抓禁賽。國際象棋AI在棋力以及計算性能上都取得了巨大的進步,運算平臺從特別造的大型服務器移到了人人都有的手機上。
-
本文僅代表作者個人觀點。
- 請支持獨立網站,轉發請注明本文鏈接:
- 責任編輯:武守哲
-
哈里斯放話:中國速度可不慢,美國不能干坐著 評論 111“明年特斯拉帶這個技術一來,就能看出中企誰是霸主” 評論 239我軍向太平洋發射洲際彈道導彈,現場圖公布 評論 701參加QUAD也加入金磚,“印度要邊走路邊嚼口香糖” 評論 302最新聞 Hot
-
哈里斯放話:中國速度可不慢,美國不能干坐著
-
日新澳軍艦過航臺海,海軍軍事專家:讓人感到軍國主義復活的危險
-
特朗普炮轟澤連斯基:烏克蘭都快亡了,你還來美國誹謗我
-
“明年特斯拉帶這個技術一來,就能看出中企誰是霸主”
-
美眾議院委員會著急:對華得想想辦法,不然就自掘墳墓
-
黎巴嫩10月航班增加、票價回落,開戰風險小了?
-
“如果美國不與阿聯酋合作,中國就會找上門”
-
澳國庫部長將訪華,“中方想要一個保證”
-
反華情緒蔓延,“美國方向錯了”
-
大眾:我們比不過中企,你們要犧牲
-
“去年中國拿下1500個新船訂單,美國才5個,想當年咱們…”
-
“澤連斯基,我要求你立即炒了她”
-
我軍向太平洋發射洲際彈道導彈,現場圖公布
-
開戰在即?真主黨“史無前例”動作,以軍緊急動員…
-
特魯多終于挺過了這波,但…
-
參加QUAD也加入金磚,“印度要邊走路邊嚼口香糖”
-