2017/01/05
作者:Dexter

謝謝你,藤原佐為。—長達十個月的人機大戰總論述

好久不見了,藤原佐為。 一月,元旦。神秘棋士Master從無何有之鄉突然現於武林,在肆虐了棋壇得老、中、少三代後,已經被確定為人工智能的他,於網絡上再戰五場,先後擊敗包括「疤面棋王」周俊...

請繼續往下閱讀

李世石戰敗/美聯社/達志影像

客觀來說,李世石能從AI手上拿下一盤已經相當了不起,我們甚至可以說從三月以來,沒有任何一個人類高手能找出它們真正意義上的破綻。

因此就再次掀起了一個新的話題,野狐聊天室、知乎各路網路大神無不在討論一件事情:AI為什麼強?如何擊敗它?

這非常像03-07年昔日費德勒統治網球的年代的盛況,一個無可爭議的王統治著一切,人類骨子裡好鬥的本質促使我們總是去想著如何贏,卻忘記欣賞最高技藝的美好。

Alpha go又或著Master為何這麼強?這個問題或許還需要讓它本人來回答。

DeepMind曾在一份的《Nature》雜誌的封面文章中提到,圍棋有 3^361 種局面,而可觀測到的宇宙,原子數量才 10^80。而Alpha go這些電腦之所以能突破這個難題,關鍵就在於深度思考系統。

「深度學習是機器學習的一個分支。機器學習這個概念認為,對於待解問題,無需編寫任何專門的程式碼,只需要輸入數據,演算法會在數據之上建立起它自己的邏輯。AlphaGo 運用到的深度神經網路是 Policy Network(策略網路)以及 Value Network(價值神經網路)。」該篇文章如此表示。

也就是說,AlphaGo和過去AI不同的地方在於,它不再去列算所有的可能性,而是用邏輯推算出幾個比較有可能贏的策略,以此將複雜的搜索數減少到可運作的模式。策略網路估算最有機會的幾十種棋路,然後價值神經網路負責減少搜索的深度,將過去可能的300步的推算減少到1、20步。

也就是說這種系統變得非常像人類的神經系統,每受到刺激一次,它就得到一次正面的強化,這就是學習的過程。它在這個過程不斷進化、找出更適合當下的下法。這種類似於動物直覺得思考模式,令人戰慄。

就像創造AlphaGo和Master的科技服務平台所表述的,它們之所以能征服圍棋,靠的不再是「深藍」或著「瘋石Crazy stone」的暴力(brute-force)式搜索,而是找到一種是用於人工智慧的「棋感」。他們吸收了人類全部的優點,同時又沒有人類一切的缺點(緊張、自負、腦容量),所以在快棋局中,他們幾乎是無敵的。

那麼?這代表人類沒有戰勝AI的可能了嗎?當然不是。李世石不是早就已經為我們贏得了一場勝利了嗎?

在連輸掉3場後,李世石在面對第4場時的態度明顯較輕鬆,但在對弈開始後,手執白子的他卻又隨即進入十足的專注模式,代表著這或許就是當世棋王的最強狀態了。

在開局AlphaGo明顯占優,而李世石則進入沉思。但在看似時間將用盡的困局之中,李世石開始展現他過往為人稱道的翻盤能力,連三手好棋,接著在第78手下出那「神之一手」。

最終,AlphaGo 自去年10月後,首次在對奕中向人類「投降」。當然這一勝並不改變結果,最終李世石以1:4輸掉了比賽。

但是人類冠軍在第3戰落敗、陷入絕望之下,說出這句話,讓這次對決有了勝負之外的深度:「這只是我李世石個人的失利,並不是全人類的落敗。」

是的是的,多次冠軍經驗讓他深知競技的本質並非如動物搏鬥般不是生就是死,非得追求勝負結果不可。更不存在所謂把一個族群的希望投注在某一團體或一人身上的說法。李世石贏了我們要讚美他的天才,輸了也同樣可以欣賞科技智慧的奧妙。所以,這句話應該要這麼看:李世石沒有原罪,更不該背負著人類的期待。

聶衛平沒能擋住科技海嘯的攻勢,成為Master第54勝的犧牲者。然後在當晚它戰勝最後一位上場的人類高手、中國籍世界冠軍古力後,以60勝1和(斷線)0負的戰績宣布自己就是AlphaGo。端傳媒隔天的文章如此評述著:掃地僧橫空出世。

在這全面潰敗的戰局下,唯一能讓我們欣慰的,是眾家高手在落敗後的反應。就像金庸筆下剛在泰山之巔進行完決戰的武林高手一樣,對於失敗不是絕望,而是顯現出一種專注於大時空的達觀。

聶衛平說,「看了40多盤Master對年輕高手們的對局,深感當年日本名譽棋聖藤澤秀行老師說的那句話『棋道一百,我只知七』是何等地深刻貼切!在看似不能出招的地方出招,而且最後證明它的選擇都成立,都不是錯的!」

訂閱運動視界電子報

追蹤我們