-
陳經:即使AlphaGo不出來下棋,我們還有絕藝
關鍵字: 絕藝人工智能AIMasterAlphaGo局面評估柯潔和Master一出來就天下無敵不同,絕藝有著明顯的棋力上升軌跡,經過數次下線開發升級。Master忽然出來對高手們排隊密集敲悶棍,能提升神秘感,但未免顯得重保密、輕交流,是圍棋局外人的做法。AlphaGo的開發思想是,棋力提升靠人類棋譜以及海量自我對局就可以了,不需要真和人下。和人類高手對戰,只是確認機器的棋力,不是用來提升機器實力,也不是幫高手漲棋。
而絕藝卻明顯走了另外一個技術路線,積極和人類高手對戰。無論是勝多還是敗多,盡量從中發現問題,快速解決后又出來下棋,循環開發。這個路線顯然更為親民,也給高手們更多觀察的機會,自身弱點暴露得更充分,神秘感不多。如果以后絕藝有機會與AlphaGo進行“機機大戰”,它將以“圍棋界自己人”的身份,與“局外人”AlphaGo對戰,而且感覺這一天的到來并不遙遠。我肯定希望絕藝獲勝,相信這也是多數棋界人士的愿望。
此前從未有這樣高水平的AI與高手們持續作戰數月,絕藝清晰的戰績軌跡,有助于我們理解圍棋AI的特性,甚至人類高手自己的特性,也可以讓我們對Master的無敵戰績加深理解。
絕藝最初打出名頭,是靠20秒的快棋。這是高手們在弈城、野狐等網站上練習時的標準時間配置,三次20秒讀秒。高手們認為20秒時間足夠思考了,絕大多數棋都在20秒內下出,關鍵時候才會用掉一次讀秒。有的高手甚至認為20秒長了,下15秒甚至10秒的快棋。棋手們普遍認為自己快棋水平不比慢棋差多少,就差一先,有的甚至感覺實力差不多。孟泰齡在下棋的同時還能清楚地錄制解說,大多數是20秒的對局,中間還跑去收快遞盒飯。高手們20秒對戰搞得有模有樣,有時還戰得很精彩。
但是絕藝的20秒,早在2016年12月高手們就擋不住了,基本可以肯定不是絕藝的對手,硬來就是樸廷桓式的五連敗。絕藝證明了高手們的20秒是充滿了錯誤的低質量對局。中國棋院院長王汝南說:“騰訊搞的人工智能圍棋,20秒一步,職業高手們不好對付”,就是這個意思。
20秒還是更長時間,對絕藝以及Master的棋力毫無影響,因為它們都會在10秒內出手沒有區別。但是對人類來說,20秒是絕對不夠用的,真正能用于思考的時間很少。對方落子以后,人先要理解對方下的棋。預料之中的可能花個2秒就夠了,出乎預料的,就要花更長時間去建立棋感。20秒的棋,到10秒就開始有讀秒聲,其實并不能怎么專注思考,一不小心就要超時,需要早點想好招確認。真正有效思考推理的時間可能就是10秒左右,推不了多深,多半是憑感覺拍。之所以下得有模有樣,是因為下套路棋很熟。套路完了,后面會犯很多錯。
但雙方水平差不多用時都不夠,出錯未必能抓住,抓住了下一個局面又送回去,概率性地互相翻盤,圍觀的人也沒時間發現這些錯誤。即使是網棋水平最高的柯潔、樸廷桓、范廷鈺等人,也不過是七成勝率,經常犯錯,水平高主要體現在勝率高一些。有時說不清是棋更熟,還是真的對圍棋理解更深。20秒的對局,主要培養的是棋感,以及快速計算的能力,但計算的深度廣度就談不上了,本質上是和業余棋手差不多的“感覺行棋”。業余棋手是沒有計算的能力,高手們下20秒就是主動搞極限運動了。
高手們面對絕藝,這個弱點暴露無疑。絕藝不用Master那么高水平,但是發揮也足夠穩定,不會出簡單的錯招。高手們頓時顯得壓力極大,一出明顯的錯招一局可能就斷送了,而絕藝會毫不留情地抓住,“感覺行棋”明顯不行。絕藝雖然下得更快,但是計算機出身速度是本行,每招的計算都可以保證基本的水準。
2016年12月開始,絕藝主要和高手們下30秒的快棋。多出來的10秒時間很關鍵,相當于實質思考時間翻倍還多,時間多了心態也會好,能夠進行一些穩定計算了。高手們30秒的實力相比20秒明顯提高,在“感覺行棋”上也加入了相當多的計算驗證,能夠設計一些手段。這一段時間,柯潔對絕藝戰績明顯占優,曾連續獲勝,顯得對付AI很有辦法,高手們也經常能殺掉絕藝的大龍或者吃掉局部一塊棋獲勝。絕藝的弱點也暴露出來,局部死活搞不清,大龍的死活掉以輕心。柯潔在野狐看棋時透露了對付絕藝的心得:做大模樣,等它進來犯錯。
春節期間,絕藝也過年去了。假期結束后,絕藝似乎修復bug得力,棋力明顯上升,對高手們30秒戰績提升明顯。從2 月14日開始到3月5日,柯潔對絕藝慘遭13連敗,對局時心態明顯變異,經常很快就輸掉了。這也可能是柯潔在試一些特殊招法,但絕藝對高手們的30秒戰績顯然是壓倒性的。絕藝的進步,讓高手們的30秒又顯得時間不夠了。
看到絕藝的出色戰績,可能是出于宣傳目的,野狐適時地推出了升10段的規則。
成為10段后,絕藝又與高手們下了一陣子30秒,仍然是9成勝率。因此3月5日之后,絕藝與高手們都是下60秒的對局。每步棋60秒,這給高手們相當大的時間自由,能夠進行的思考要深入多了。在高手們的正式對局中,這是常見的情形。有些喜歡長考的高手早早進入1分鐘讀秒,但面對時間充裕的對手一直能頂住,對局質量很高。
60秒的棋,人類高手算是拿出真本事和AI對局了。Master的60連勝基本是20、30秒的,只有對聶衛平給了60秒。面對Master的不拘一格的新手,高手們根本沒有時間反應,往往一個局部就吃大虧,整局再無機會。看到新手,心里本來就有壓力,又只有30秒,還不知道對手要干啥。應對的選擇會有幾個,根本沒時間細算,連感覺一下時間都不夠,多半是胡亂蒙一招了,很容易吃虧。
Master對人類高手的壓迫主要就是兩個,一是時間攻勢,二是新手攻勢。事實證明,幾乎沒有高手能頂住。我認為人類高手輸得其實有些冤,因為平時正式對局有1-3個小時思考時間,Master式的新手肯定出現在開局,人類高手會有充足時間去仔細琢磨,不可能象網上對局這樣20、30秒就得下。人類高手正式對局也不時下出新手,但對方一看是新手,就會仔細琢磨,一般能找出妥善應對,很少被新手擊潰。如果也是20、30秒就被逼下子,新手多半會很成功。
可以承認Master的思維方式和人類高手不一樣,把圍棋布局與局面評估藝術帶到了人類高手不曾想到的新境界。在職業棋手開局嚴重套路化千篇一律之時,這一股新風無比珍貴。但是不能說Master的新手,或者截然不同的布局風格,人類就無法應對。如果給人類高手多一些時間應對新手,同時主觀上提升對布局的思考,不再機械地擺“常形”,那么人的表現會好得多。不說戰勝Master,至少能逼出Master更多本事。現在Master就靠“新思維”,在布局階段就打敗了人類高手,這是很遺憾的。因為這是人類的思考時間不夠,太可惜了。如果能看到Master在復雜死活、復雜劫爭、大對殺、耍大龍等局面的表現,無疑會更為精彩,這也是圍棋藝術必不可少的精華。
如果再大膽一點,或者說為了人類棋手鼓勁,可以提出一個猜想:
AlphaGo比人類主要強在思考速度快、布局理念創新、局面評估準確、水平穩定。但是一些復雜死活、復雜劫爭、大對殺局面,AI搜索算法有本質困難,人類卻能發揮邏輯推理的優勢,比AI表現更好。可能的情況是,AlphaGo團隊尚未給出解決復雜死活、復雜劫爭、大對殺問題的可信算法,但把局面評估上的優勢做到遠超人類的程度(還通過把對局時間限制在20、30秒極度放大了這些優勢),成功掩蓋了這些弱點。
而絕藝和高手們60秒對局的表現,似乎能對這個猜想提供一些證據。60秒對局,絕藝的勝率從30秒時的90%下降到60-70%,經常連輸。相當于人類高手的勝率從10%升到了30%-40%,勝局數增加兩三倍,表現大為好轉。
-
本文僅代表作者個人觀點。
- 請支持獨立網站,轉發請注明本文鏈接:
- 責任編輯:武守哲
-
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 48“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 101“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 50“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 116美國政府“逃過一劫” 評論 126最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-