谷歌人工智慧如何連贏人類圍棋冠軍五局 如何評價它?

@ 2016-02-01

通過對神經網絡進行的3000萬步訓練,AlphaGo預測出人類對手下一步走法的正確率已經達到了57%,其使用兩個不同的神經網絡「大腦」,通過兩者合作得出移棋決定。

圖片來源:網絡

一石激起千層浪。當人工智慧戰勝人類……這個原本看似遙遠的事情真正的發生了,在2015年10月5日,全程沒有讓棋。

1月28日,《金融時報》援引《自然》雜誌的報道,由谷歌倫敦子公司DeepMind開發的AlphaGo機器,以5:0的戰績擊敗了歐洲圍棋三屆冠軍樊麾(出生於中國,現籍法國)。DeepMind是2014年被Google以4億英鎊的價格收購的人工智慧團隊。

在1月27日,DeepMind團隊發表的《Mastering the game of Go with deep neural networks and tree search》作為《自然》(Nature)封面論文上線。團隊創始人Demis Hassabis表示,他們開發的圍棋程序AlphaGo融合了高級樹狀查找和深度神經網絡。

同一天,Google在官方博客中表示:「我們很驕傲地公告天下,我們的科學家已經搞定了圍棋,並攻克了人工智慧領域的一項重大挑戰。」

今年3月,AlphaGo將在首爾與過去十年全世界最頂級的圍棋選手李世石對決。

谷歌AlphaGo是怎麼贏的?——雙大腦工作

通過對神經網絡進行的3000萬步訓練(所有棋譜均來自人類專業棋手的比賽),AlphaGo預測出人類對手下一步走法的正確率已經達到了57%,之前的紀錄是44%。

AlphaGo使用兩個不同的神經網絡「大腦」,通過兩者合作得出移棋決定。

AlphaGo的兩個大腦分工如下:

大腦1:「監督學習(SL)政策網絡」。著眼於棋盤中的位置,並試圖決定最佳的下一步。實際上,它用來估計每個合法下一步行動為最好的一步的可能性,其頂層猜測就是具有最高機率的那步。該團隊通過幾百萬個優秀的人類棋手在KGS上的下棋選擇,訓練這個大腦,其目的僅僅是複製優秀的人類棋手的移動選擇。它一點也不關心贏得比賽,只下那步頂級人類棋手會下的那步棋。AlphaGo的下棋選擇器有57%的機率可以正確匹配優秀的棋手下棋選擇。

大腦2:「價值網絡」。它不猜測具體的下一步怎麼走,而是通過設想的棋盤分布,估計每個玩家贏得比賽的機率。它通過提供整體的位置判斷來配合「監督學習(SL)政策網絡」。這個判斷只是近似的,但它對加快閱讀速度非常有用。通過將未來可能的位置分為「好」或「壞」的分類,AlphaGo可以決定是否要沿著一個特定的變化進行更深的閱讀。如果位置評估器說某個具體的變化看起來情況不妙,那麼AI可以跳過閱讀,不沿著那條線繼續發揮。

據論文介紹,當只使用一個大腦時,AlphaGo大概和目前最好的電腦圍棋AI實力相當,但結合兩個大腦是,它可能達到人類職業棋手的水平。

專業圍棋手是怎麼看的?

2013-2015年三度歐洲圍棋冠軍樊麾,也是本次人機大戰的主角之一,他表示:

在中國,圍棋不僅是一項比賽,它還是生活的一面鏡子。我們說,假如你的棋下得有問題,那很可能是你心性的問題——棋如其人。

輸棋確實很難過。和AlphaGo對戰之前,我覺得我能贏。在第一局失利後,我改變了戰術,增強了進攻,但還是輸了。問題是人類有時會犯致命的錯誤,因為我們是人。有時我們會疲憊,有時我們求勝心切,我們總有這樣那樣的壓力。電腦程式不會這樣,它非常強,也非常穩定,簡直就像一堵牆一樣。對我來說這是很大的差別。我知道AlphaGo是個電腦,但如果沒人告訴的話,我可能會覺得它是個有點陌生卻又非常強大的對手,是個真人。

當然,輸掉比賽讓我不太開心,不過作為職業選手,我們輸過很多比賽。所以,失敗了就從中學習,也許會有所收穫。總之從長遠來講這是一件好事。

隨後在一個微信群里,樊麾說:「一切都是真的,因為一直在保密中,所以大家都不知道。我沒有放水,不過下得確實不好。只能告訴大家,這個系統確實很強!拭目以待和李世石的棋吧!這是去年10月下的,還有些條款在保密範圍之內的,我不能告訴大家,不過我覺得跟李世石的棋會很精彩!」

曹大元九段:昨晚就看到了,所以睡不著覺了,壓力很大啊!

孟泰齡:我認為樊麾布局有三盤占優,另兩盤劣勢。我覺得電腦確實有職業水準。感覺電腦棋風穩健,酷愛實地,如果後半盤它真的可以滴水不漏的話,那距離頂尖真的只有一層窗戶紙的距離了。顯然電腦大局觀差一些,但局部棋型的感覺及計算已經有相當水準了。

業內人士怎麼看?

DeepMind創始人Demis Hassabis:

AlphaGo正在突飛猛進,甚至會超越最棒的人類選手。能夠看它在圍棋規則內去創造新的東西,感覺很神奇。我們對自己創造的這個系統有種很密切的感情,特別是它被創造的方式——它會學習,我們也會教它,它的風格就像人一樣。和其他編出來的程序不同,你不知道它到底都會什麼,因為它能夠自己學習。

阿爾伯塔大學計算機科學家、Chinook設計師Jonathan Schaeffer:

我想這還不是圍棋版的深藍時刻。真正的成就是這個程序能作為選手在頂級比賽中較量的時候。深藍從1989年開始就常常戰勝各路大師,最後登頂則是八年之後的事情。但就目前情況來看,我認為AlphaGo和頂級人類選手之間的差距被大大縮短了。可能只需要再進行一點努力和改善,再提高一點計算能力,不出一兩年,它就能打敗人類。

就今年3月份的比賽來說,不是打擊AlphaGo團隊,我還是看好人類。我們可以把AlphaGo看成是少年天才。它突然學了一手好棋,進步神速,但畢竟還是經驗有限。從西洋棋和西洋跳棋來看,經驗還是很重要的。

國際圍棋聯合會秘書長Hajin Lee:

當我知道那個電腦要挑戰職業頂尖棋手李世石的時候,真的很吃驚。我當時覺得這個挑戰者絕對對頂級選手有多強完全沒概念。但實際上,可能我才是那個不知道這個電腦有多強的人。現在我對這個比賽非常興奮。

誰會贏呢?我不知道。李世石自己也覺得可能那電腦跟他一樣強。可能是我聽到了太多AlphaGo的消息,我現在驚訝於它的強大。同時我也非常了解李世石的水平,所以我認為他們雙方五五開吧。

我覺得圍棋是個很有內涵的競技,我不覺得如果電腦AI擊敗了人類會對圍棋造成什麼傷害。我想人們會接受自己被電腦技術超越這件事。

最後,讓我們通過下面五張GIF圖回顧一下這五局棋,樊麾是怎麼輸給谷歌AlphaGo機器的(來自微信公眾號:棋文弈事):

第一局

第二局

第三局

第四局

第五局


相关文章