關鍵字: 圍棋 國際象棋 中國象棋 人工智能 Master AlphaGo Stockfish 數據分析
柯潔與阿法狗的三番棋較量,今天(《宇視》編者注:2017 年5 月27 日)迎來了最后一場。其實早在圍棋之前,其他棋類AI 就已經刮起過世界級的旋風,在過去二十年里,至少有過兩次,都帶有革命性、顛覆性的意義。
如果把1996年與卡斯帕羅夫對弈的“深藍”比作橫空出世的利維坦(Leviathan),最近一次在棋界刷屏的則是它的“赤屁股兄弟”比希莫斯(Behemoth),這兩個人造怪物在幾乎是純智力比拼的場合中接連將一流頂尖高手挑落馬下。
雖然在十多年前研究國際象棋殘局的專家穆勒(Karsten Müller)就預計,頂尖圍棋棋手臣服于AI 腳下并不遙遠,但是這一天到來之時,還是讓廣大棋迷不勝唏噓,因為對今天的國際象棋(以下簡稱國象)和中國象棋(以下簡稱中象)來說,普通PC 機上的某一款軟件就可以隨便吊打世界級棋手,圍棋幾乎已經成了棋類中保有人類尊嚴最后的地盤。
國象的AI 到底強到什么程度?看美國華爾街日報的一篇報道就可窺一二。2016 年4月,美國頂尖的日裔棋手中村光來了一場人機大戰,但必須要“機”讓一個兵(下圖中白方Komodo 讓了一個f2 兵),最后才勉強逼和。中村光在美國棋手中骨骼清奇天賦異稟,而且喜歡搞怪,兩年前他曾心血來潮,假裝以普通棋手的身份在街頭擺攤挑戰路人,賺了300 多美元。
冢中枯骨?枯骨也能在冢中舞
1997年卡斯帕羅夫負于深藍之后,世界輿論大嘩。顏面無光的老卡(和“三卡”中的卡爾森比他絕對算老卡)喝了半杯伏特加,漲紅的臉色漸漸復了原,旁人便又問道,“老卡,你當真是世界頭號棋手嗎?怎么執白20多步就被反先了?”老卡看著問他的人顯出頹唐不安模樣,臉上籠上了一層灰色,嘴里說些話,這回可是全是“有人幫機器作弊”,“卡羅康防御太消極”之類的話,眾人也都哄笑起來,棋場內外充滿了快活的空氣。
在卡爾森成長起來之前,國象界的很多名宿甚至認為老卡創造的2857分的等級分將是人類棋手不可逾越的高峰。

棋手個人史上最高積分前十名(注:這是棋手動態積分的最高,不是國際棋聯月初公布的官方等級分),圖片來源:作者截圖
筆者在此模仿一下魯迅,拿老卡砸個掛,并非不敬,而只是要說明,今天人類如果想在棋盤上和引擎一較高下,就如同孔乙己以回字的四種寫法一樣妄圖復士大夫昨日之榮光。
雖然在過去一百多年的歷史上,無論是國象還是中象,在沒有AI 輔助的情況下,都經過了從戰術型(tactical)到局面型(positional)的理論進化,換言之,每一步棋之后的局面分析已經取代了原有局部范圍內的戰術組合(哪怕這種戰術組合很有美感),成為職業棋手必須優先訓練的項目。但是,今天國象和中象棋手的中局變化、深度計算以及殘局推演在AI 面前都成為了冢中枯骨。
但正所謂“天道損有余而補不足”,盡管棋界沒有人會認為國象和中象的game tree(游戲樹,直接決定棋類的計算深度)會高過圍棋,但在圍棋界還在糾結棋盤內的勝負的今天,國象和中象已經完成了優雅的轉身,駛進了一個“互訓”的新局面:即AI 的計算和數據呈現輔助棋手訓練,棋手以實戰場景幫助優化AI 的運算模式。當然,絕藝等圍棋AI 現在也已經在這方面有了一些嘗試,但仍無法與國象界的“互訓”相比較。
以國象為例,在AI 的研發與反饋利用方面,已經開辟了一個具有相當深度和廣度的理論范式,這一點上倒是和“邏輯經驗主義”的路線圖頗為類似,即通過早先較為粗糙地采用“窮舉法”存儲開局庫,模擬人類對戰,在繁復的“變招”中揀選出最優解,然后把這些暫時的“最優解”投放到世界頭號棋手的實戰中進行二次反饋,雖然這些過程都是在歸納主義的運行邏輯下進行的,但這種具體而微的“覆蓋率演繹”模型是以達到未來可觀測效應的預測系統為導向的,而且此模型對“歸納——演繹”兩種古老推論模式的交互運用,能迅速提高AI 自我學習的能力。
對此,我們不能不提國象AI 居功至偉的“群像”作用。
和圍棋目前阿爾法狗暫時獨霸天下的局面不同,在國象的“凌煙閣功臣譜”上,至少就有Houdini,Komodo,Rybka, Stockfish 等眾多實力接近的機器人高手群芳爭艷,圍棋迷們設想的阿爾法公狗和母狗左右互搏的局面,在國象AI 的研發領域里已能初見端倪。
《周易·系辭》中有六字真言:物相雜,故曰文,與國象的“品色繁殊,才能目悅心娛”(Varietas delectat)的拉丁文古訓若合符節。
也就是說,如果能在AI 的研發中形成比學趕幫超的競爭局面,無疑對推動這個行業向前發展是極為有利的。
在著名的國際象棋對戰直播網chessbomb上,已經成系統地、有規模地舉辦了多年的AI比拼大賽,令廣大棋迷大飽眼福。如圖:

圖片來源:chessbomb截圖
在今年最后的超級總決賽中,沖破重圍的Houdini 和擂主Stockfish 展開了驚天動地的百輪大戰,最終Houdini 稍遜一籌,以45.5 比54.5 負于對手,這也再次確立了Stockfish 的AI 總盟主地位。
廣受棋迷喜愛的英國國際象棋解說員丹尼爾· 金(Daniel King), 在觀看第70 輪Stockfish 執黑輸棋的過程中,對Stockfish 評價如下:“在絕對的敗勢下它好像發出了嘶嘶聲(hissing),和其他同類的引擎不同,在陷于絕境時并沒有自暴自棄,還在執著地進行著挽回顏面的深度運算,它表現出的是一個對失敗充滿厭惡感的,有孩子氣的棋手一樣。”他這個充滿人類情感的評論,也許能從側面說明為什么Stockfish 目前是各類國象AI 的翹楚。

以王翼印度防守開局的Stockfish,在殘局中形成了雙馬對象車高兵的不利局面,最終敗北,圖片來源:chessbomb截圖
此外,國象AI 在微觀和宏觀的盤內計算和盤外資料過濾,為國象的理論研究提供了海量的經驗數據(empirical data),反哺了棋手在中局搏殺中戰術組合多樣化能力,也糾正了大批棋迷一直以來對局面判斷的固有印象。
在此僅舉一例,斯堪的納維亞防御(白方e4, 黑方對以d5)被棋界廣泛詬病為出動子力太慢,在高水平對局中已經比較罕見,而且一線教練不建議初學者采用此開局(有些類似中國象棋中的飛象局,筆者對弈時,曾遇到過以飛象局對五七炮的局面,這類棋手往往對自己的中盤厚實的磨纏功底很自信,給筆者傳授了不少后發制人的人生經驗)。
但是Stockfish 給出了最近10 年2700 等級分以上的棋手(2700 分是世界級棋手的一道坎)的對弈數據,顯示黑方用斯堪的納維亞防御的和棋比例有65.7% 左右,負的比例為11.3%,勝率居然高達23% !這一勝率絕對超過了柏林防御和格倫菲爾德防御等一大批常見防御開局,這讓棋界理論家們這些年以來不得不重新審視這一“非常規”的冷門開局。
國象AI 的迅速發展不是在一朝一夕間完成的,拿Stockfish 來說,數年來它從未停止過自我革新的步伐,雖然直到今天它仍非完美,但相比幾年前已經進步許多,比如在2013 年的阿廖欣紀念賽上,首輪由中國棋手丁立人對陣亞美尼亞頭號棋手阿羅尼揚,Stockfish 在中局的一個棄子變例中把局面誤判為了雙方重復三次的和棋,而忽略了丁立人有底線挪車(Re1)的勝招。

圖片來源:chessbomb截圖
中國象棋:寡與眾的反差
國象中象,心同理同,漢語中都以一“棋”概括(包括圍棋),含一月映萬川之意。事實上此二棋界的職業棋手基本上都能兼通,這也是老一輩棋手留下來的寶貴的訓練方式,如1962 年出生的棋界老江湖徐俊早年投身中象,后來半路出家轉攻國象,也拿到了GM(男子特級大師)的稱號。由于這兩類棋種的近親關系,筆者也時常能讀到一些有趣的小品文,比如“國象如果有炮會如何”,“中象可否有兵的升變”等腦洞大開卻很有啟發性的探索文章。
而且,新一代的職業棋手,無論國象還是中象,都是靠AI 訓練出來的“半人半機”的新型棋手,如丁立人、余泱漪、王天一、鄭惟桐等,各類軟件引擎是他們日常訓練時不可缺少的輔助工具,這與當年葉江川、胡榮華們背著厚厚的棋書滿世界跑形成了鮮明對比。圍棋AI 分析專家陳經先生在文章中就曾提到,由于王天一下棋很像AI,曾被指責有作弊的嫌疑。
文中前面提到,在人類棋手被AI 吊打已成現實的情況下,國象走出了“弈”“研”結合,雙翼兩驅的路子,而反觀中象,不得不一聲嘆息:呈現出了尷尬的“寡”與“眾”的多重張力。
大體說來,就是進弈者眾而退思者寡,善其事者眾而利其器者寡,博論者眾而約理者寡。在圍棋、國際象棋和中國象棋這三類受眾面相對較廣的棋類中(五子棋和跳棋愛好者們,今天算得罪你們一下),毫無疑問中象有著最廣泛的群眾基礎。不說別的,就拿觀網這些年報道的街頭擺棋攤騙錢的新聞就可見一斑,騙術的基本法其實就是靠著極為厚實的群眾家底來支撐的。但很遺憾的是,中象在AI 開發程度不弱于國象的局面下(比如倚天、象棋巫師、棋癮等實戰效果都得到了業內肯定),業界在數據分析、優劣勢量化的系統性反饋進展卻很緩慢,尤其是在比賽資料庫的建立方面很是乏力。
舉一例來講,國象中執白的一方由于是先手,那么這個先手量化為棋盤上輕重子的權重,大約應該是多少?德國萊比錫大學數學系的研究團隊的計算結果是:0.37 個pawn(兵)。也就是說,執白先走的一方,一開始就相當于比黑棋多了0.37 個兵。而且馬與象的兌子在何種局面下對等以及不對等,都有深度的探索。而中象在這方面的研究進展如何?筆者斗膽直言,在對AI 的研究和利用方面,國象至少領先了中象一個車的優勢。
我很期待有讀者拿出具體數據和文章鏈接打我的臉。雖然我很享受這個打臉的過程,但還是不得不問一句:就算你給了我鏈接,這些內容有專業且統一的發布平臺嗎?這就涉及到另外一個問題, 中象到今天為止, 連一個能和國象的chessbase、chessbomb 對等的網站都沒有,在10 多年前中象直播的低潮期,某“王子”兢兢業業地為棋迷們手動現場直播錄入棋局,卻因為他是疑似“蔣胖”(蔣川)的粉絲,被其他粉絲們大罵。其實今天中象業界絕對不乏學者型棋論者,可惜由于資金以及組織問題,往往各自為戰,一盤散沙,沒有形成合力將棋論的深度推向更高的層次。
最令筆者感到不解而且悲哀的是,多年前的中國象棋的個人錦標賽上,棋手和裁判還在因為“長將長打”問題爭論不休,一方面是比賽組織管理人員和棋手之間的溝通不到位,一方面則揭示了中象當年曠日持久的規則明晰性難題。
很多棋迷在談到比賽規則時,討論往往都在集中在規則的“公平度”上,而忽略了公平度之外的另一個重要前提,就是明晰性(explicity)。只有在徹底剔除規則的模糊性(ambiguity),讓棋手對規則的理解明白無誤且“普世”的前提下,才能談是否公平的問題。這方面,也許可以說國象某種程度上犧牲了比賽的觀賞度(比如,雙方三次重復不變就是和棋),但絕對保證了規則清晰可理解:只有殺王才能算將死(checkmate),而困死對手(stalemate)只能算和棋。其實解決中象規則明晰性的問題并不難,只需類似于增加國象中的“索菲亞規則”那樣的附加條款,就可以既讓棋手和裁判不至于產生誤會,也能保證比賽的觀賞性。
另外不得不提的是,中象上述眾與寡的反差,根子并不在棋盤之內,而在之外。多年以前,一篇吐槽中國象棋甲級聯賽比賽現場的文章吹皺了業內的一池春水,文章尖刻地抨擊了賽場內種種不專業的現象,比如參賽選手邋里邋遢,居然有穿著短褲拖鞋的棋手魏晉風度般地晃進了場內,而且進場前棋手根本沒有進行防作弊的身檢;比賽中噴嚏、打嗝、哈欠、屁聲不一而足,裁判員和書記員時不時還嬉笑打鬧一下。
當時,“屌絲”這個比較低俗的詞才剛剛在網上傳開尚未大肆流行,所以文內一句“棋手穿的都跟個窮屌絲似的”讓筆者印象很是深刻。稍顯刻薄的行文卻的確反映出了中象包裝不力的難堪事實。讀者可以瀏覽下面兩張圖,分別是李炳賢對王天一,和王天一對鄭惟桐,都是國內中象最高水平的個人賽。第一張雙方在沒有空調的賽場內只能穿著厚厚的衣服,第二張圍觀的吃瓜群眾在旁邊吸溜吸溜地喝水。

圖片來源:見水印
讓我們再看看圍棋和國象,場內寂靜肅穆,棋手穿著職業,工作人員也個個正襟危坐,賽后的新聞發布會的規矩、板眼更是不在話下:

圖片來源:棋賽官方網站
如果把對弈比作戰爭,在有正式組織的高等級棋手的比賽場上,圍棋和國象感覺有宋襄公拒絕“半渡而擊”的貴族騎士風范,而中象就好比是張士誠和陳友諒的“鹽漁互撕”。雖然自2011 年以來,中象棋協認真反省了這個問題并有了不小的改觀,但某些長久存在的頑疾要治愈尚需時日,比如趙鑫鑫“買棋”案,頭號棋手王天一身份造假案(弄了一個化名,參加了農民象棋比賽,被棋迷揭露后,送給了他一個“王農民”的諷刺性綽號)。就在最近,爆出了王天一因為被拖欠薪水不得不起訴“老東家”的新聞,繼續給中象的管理體系敲響警鐘。
結語:方寸棋盤內,家國天下中
文章寫到這里也進入了“殘局”階段,也該到了販賣點私貨的時候了(此處應有畫外音:好像你之前的行文就不是私貨似的)。在馬象聯營,車炮滾滾的棋盤上,絕不是單純的原子個人的智力較量。20 紀初,俄國棋院的成立與發展就是為了阻擋社會達爾文主義者噴出的毒液;70 年代美國人費舍爾在棋王大戰中戰勝蘇聯人斯帕斯基之后,尼克松喜笑顏開地送給了勃列日涅夫一個棋盤;80 年代有多少國人為聶衛平熱淚盈眶,他和五連冠的中國女排一起,詮釋了一個振興中華、奔向四化的嶄新時代精神。
當2014 年中國國象團體男隊拿到奧賽金牌的時候,總教練葉江川說中國的國象已經完成了三步走的其中兩步:女子棋后(已經拿到手軟了),和男女團金牌(男女加起來都6個了)。接下來要完成第三步:培養出一個男子棋王。葉老擲地有聲,筆者不免狐疑幾句:國際象棋西方玩了上千年的東西,你滿打滿算真正玩才30 年都不到,要給他們留點飯碗啊。

冷戰時代,美蘇爭霸的另一個戰場,圖片來源:資料圖
那么中象呢? 20 年前,象棋AI 還只是海岸遙望海中已經看得見桅桿尖頭了的一只航船,如今這只航船早已登陸后再次揚帆起航。中象人必須要有面向全世界的眼光和雄心,在AI 的高端研究,以及中象的推廣方面砥礪前行。馬嘶象鳴,吞吐韓流日潮,車馳炮擊,收放歐風美雨。
(本文得到了陳經先生的修改和校對,謹此致謝)