賽事背景
圍(wei)(wei)棋(qi)(qi)人(ren)(ren)機大(da)戰,源于2016年(nian)1月27日英國(guo)《自然》雜(za)志的一篇文章(zhang)(zhang)。這篇文章(zhang)(zhang)稱(cheng),谷歌的人(ren)(ren)工智(zhi)能系統阿(a)爾法圍(wei)(wei)棋(qi)(qi)(AlphaGo)2015年(nian)10月份(fen)以5比(bi)0的戰績完勝歐洲冠軍(jun)、職業圍(wei)(wei)棋(qi)(qi)二段樊麾,這是(shi)人(ren)(ren)類歷史上,圍(wei)(wei)棋(qi)(qi)人(ren)(ren)工智(zhi)能(AI)第一次在公平比(bi)賽中(zhong)戰勝職業圍(wei)(wei)棋(qi)(qi)手。
棋(qi)(qi)(qi)(qi)(qi)(qi)類(lei)(lei)(lei)(lei)游戲(xi)一直(zhi)(zhi)被視(shi)為(wei)頂(ding)級人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)智力(li)的(de)(de)試(shi)金石(shi)。人(ren)(ren)(ren)工(gong)智能與人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)棋(qi)(qi)(qi)(qi)(qi)(qi)手的(de)(de)對抗(kang)一直(zhi)(zhi)在(zai)上(shang)演(yan),此前在(zai)三(san)子棋(qi)(qi)(qi)(qi)(qi)(qi)、跳棋(qi)(qi)(qi)(qi)(qi)(qi)和國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi)等棋(qi)(qi)(qi)(qi)(qi)(qi)類(lei)(lei)(lei)(lei)上(shang),計算機程序(xu)都曾打敗過人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)。在(zai)圍(wei)棋(qi)(qi)(qi)(qi)(qi)(qi)人(ren)(ren)(ren)機大戰之前的(de)(de)歷史(shi)上(shang),最著名的(de)(de)人(ren)(ren)(ren)機大戰要(yao)數國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi)世界冠軍(jun)加里·卡斯帕羅(luo)夫對國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi)人(ren)(ren)(ren)工(gong)智能程序(xu)“深藍”的(de)(de)國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi)比賽。1997年,國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi)人(ren)(ren)(ren)工(gong)智能第一次打敗頂(ding)尖(jian)的(de)(de)人(ren)(ren)(ren)類(lei)(lei)(lei)(lei);2006年,人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)最后一次打敗頂(ding)尖(jian)的(de)(de)國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi)人(ren)(ren)(ren)工(gong)智能。自那時起,歐美傳統(tong)里的(de)(de)頂(ding)級人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)智力(li)游戲(xi)國(guo)際(ji)(ji)象(xiang)(xiang)棋(qi)(qi)(qi)(qi)(qi)(qi),已經在(zai)電(dian)腦面前一敗涂地(di)。圍(wei)棋(qi)(qi)(qi)(qi)(qi)(qi)成了(le)人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)智力(li)游戲(xi)最后的(de)(de)一塊高地(di)。
圍棋(qi)人工智(zhi)(zhi)(zhi)能(neng)長(chang)期以(yi)來舉步維艱,頂級人工智(zhi)(zhi)(zhi)能(neng)甚至不能(neng)打敗稍強的業余選手。這似乎也(ye)合情合理。因為要是人工智(zhi)(zhi)(zhi)能(neng)用暴力列舉所有情況的方(fang)式(shi),圍棋(qi)需要計(ji)算的變化數(shu)量遠遠超過已經觀測到的宇(yu)宙中原子的數(shu)量。這一(yi)巨大的數(shu)目,足以(yi)令任(ren)何蠻力窮(qiong)舉者望而卻步。而人類,可以(yi)憑借某(mou)種難(nan)以(yi)復制的算法跳(tiao)過蠻力,一(yi)眼(yan)看到棋(qi)盤的本質。
后(hou)來,人工智能研究者(zhe)們(men)祭出了終極殺器——“深(shen)度學(xue)習(xi)”。深(shen)度學(xue)習(xi)是(shi)人工智能領域中(zhong)的熱門(men)科目,它(ta)能完成(cheng)筆跡識別(bie)、面部識別(bie)、駕(jia)駛(shi)自動汽(qi)車、自然語言處(chu)理、識別(bie)聲音、分(fen)析生物信息(xi)數據等非常復(fu)雜的任務。谷(gu)歌人工智能程序阿(a)爾(er)法圍棋(qi)(qi)(qi)(AlphaGo)就是(shi)基于深(shen)度學(xue)習(xi)技術研究開發的。為了測試(shi)阿(a)爾(er)法圍棋(qi)(qi)(qi)的水(shui)平,谷(gu)歌于2016年3月(yue)份(fen)向圍棋(qi)(qi)(qi)世(shi)界冠(guan)軍、韓國頂尖棋(qi)(qi)(qi)手李(li)世(shi)石發起挑戰(zhan)。李(li)世(shi)石接受(shou)挑戰(zhan)。
比賽規程
李(li)世石與(yu)阿(a)爾法圍(wei)棋(qi)(qi)的(de)圍(wei)棋(qi)(qi)人機大戰為五(wu)番棋(qi)(qi)挑(tiao)戰,但無(wu)論比分如(ru)(ru)何(he)將下滿五(wu)局,比賽(sai)采用中國(guo)(guo)圍(wei)棋(qi)(qi)規則,執黑一方貼3又3/4子(即7.5目),各方用時為2小時,3次60秒(miao)的(de)讀秒(miao)機會。五(wu)局比賽(sai)分別于(yu)2016年3月(yue)9日(ri)、3月(yue)10日(ri)、3月(yue)12日(ri)、3月(yue)13日(ri)和(he)3月(yue)15日(ri)在(zai)韓國(guo)(guo)首爾鐘路區四季酒店進行,獲(huo)得(de)三(san)勝(sheng)(sheng)者獲(huo)得(de)100萬(wan)美(mei)元(yuan)獎(jiang)金(約11億韓元(yuan))。若阿(a)爾法圍(wei)棋(qi)(qi)獲(huo)勝(sheng)(sheng),獎(jiang)金將捐贈(zeng)給聯(lian)合國(guo)(guo)兒童基金會、STEM教育以及圍(wei)棋(qi)(qi)慈善機構。除(chu)了(le)100萬(wan)美(mei)元(yuan)基礎獎(jiang)金外,李(li)世石還可獲(huo)得(de)15萬(wan)美(mei)元(yuan)出場(chang)費。此外每勝(sheng)(sheng)一局還有(you)2萬(wan)美(mei)元(yuan)勝(sheng)(sheng)局獎(jiang)金,如(ru)(ru)果五(wu)盤全(quan)勝(sheng)(sheng),勝(sheng)(sheng)局獎(jiang)金為10萬(wan)美(mei)元(yuan)。
賽程賽果
第一局
第(di)一局:阿爾法圍棋執(zhi)白中盤勝李世石
2016年(nian)3月9日,圍(wei)(wei)棋(qi)(qi)人機大戰(zhan)首局在(zai)韓國(guo)首爾(er)四季酒(jiu)店打(da)響(xiang)。賽(sai)前猜(cai)(cai)先阿(a)爾(er)法圍(wei)(wei)棋(qi)(qi)猜(cai)(cai)錯,李世石(shi)(shi)(shi)選擇黑(hei)棋(qi)(qi),率(lv)先展開布(bu)局。黑(hei)棋(qi)(qi)布(bu)局走(zou)出(chu)新(xin)型(xing),阿(a)爾(er)法應對(dui)不(bu)佳,出(chu)現失誤(wu)。李世石(shi)(shi)(shi)抓住電腦(nao)布(bu)局不(bu)擅長應對(dui)新(xin)型(xing)的(de)弱點(dian)獲得(de)不(bu)錯的(de)局面(mian)。但圍(wei)(wei)棋(qi)(qi)的(de)勝負關鍵(jian)往往是中盤(pan)階段。阿(a)爾(er)法圍(wei)(wei)棋(qi)(qi)之后(hou)的(de)下(xia)法變得(de)強硬,雙(shuang)方展開接觸(chu)戰(zhan)。李世石(shi)(shi)(shi)抓住機會,圍(wei)(wei)住一(yi)塊大空,在(zai)大局上搶得(de)先機。就在(zai)觀戰(zhan)棋(qi)(qi)手都認為李世石(shi)(shi)(shi)占優(you)的(de)情況下(xia),他(ta)卻放出(chu)了(le)非常業余的(de)手法,瞬間使微弱的(de)優(you)勢(shi)化為烏有,還變成了(le)劣勢(shi)。進入官子(zi)(zi),阿(a)爾(er)法圍(wei)(wei)棋(qi)(qi)根本不(bu)犯一(yi)點(dian)錯誤(wu),著著精準。等阿(a)爾(er)法圍(wei)(wei)棋(qi)(qi)下(xia)了(le)186手,李世石(shi)(shi)(shi)算清后(hou)投子(zi)(zi)認輸。
第二局
第(di)二局:阿爾法圍棋執黑中盤(pan)勝李(li)世(shi)石
2016年3月10日,圍(wei)棋(qi)(qi)(qi)(qi)人(ren)機大(da)戰(zhan)展開(kai)第二局較量。阿爾(er)法圍(wei)棋(qi)(qi)(qi)(qi)執(zhi)黑(hei)先(xian)行,李(li)世(shi)石(shi)轉變了行棋(qi)(qi)(qi)(qi)的(de)(de)(de)風格,開(kai)局下得非(fei)(fei)常穩(wen)健(jian)。阿爾(er)法圍(wei)棋(qi)(qi)(qi)(qi)也下出了不少新手(shou)(shou),這讓(rang)李(li)世(shi)石(shi)應對得非(fei)(fei)常謹慎,不時陷入長考(kao),這讓(rang)他在時間上(shang)一直(zhi)落后。你來我往中,黑(hei)37和41兩步尖沖令(ling)人(ren)匪夷所思,尤其是第41手(shou)(shou),致目數大(da)虧。中盤階段,本來形(xing)勢占優(you)的(de)(de)(de)李(li)世(shi)石(shi)行棋(qi)(qi)(qi)(qi)過緩,右上(shang)角的(de)(de)(de)一步二路打(da)拔被(bei)視作敗手(shou)(shou),阿爾(er)法圍(wei)棋(qi)(qi)(qi)(qi)的(de)(de)(de)優(you)勢逐漸清晰起(qi)來。在形(xing)勢陷入被(bei)動的(de)(de)(de)情(qing)況下,李(li)世(shi)石(shi)下出一手(shou)(shou)扳的(de)(de)(de)好棋(qi)(qi)(qi)(qi),但幾(ji)(ji)次轉換(huan)后,黑(hei)棋(qi)(qi)(qi)(qi)還是牢(lao)(lao)牢(lao)(lao)守住了領(ling)先(xian)的(de)(de)(de)局面,而且(qie)棋(qi)(qi)(qi)(qi)形(xing)很厚(hou)。李(li)世(shi)石(shi)雖然(ran)脫了幾(ji)(ji)手(shou)(shou),但并(bing)無實質性改變,最終阿爾(er)法圍(wei)棋(qi)(qi)(qi)(qi)執(zhi)黑(hei)于211手(shou)(shou)獲勝(sheng)且(qie)優(you)勢明顯,總比分2比0領(ling)先(xian)。
第三局
第三局(ju):阿爾(er)法圍(wei)棋執白中盤(pan)勝(sheng)李世石
2016年(nian)3月12日(ri),圍棋(qi)(qi)(qi)人機大(da)(da)戰展開(kai)第三局(ju)較量。李(li)(li)(li)世石(shi)執(zhi)黑先(xian)行,該局(ju)開(kai)始前,還有(you)棋(qi)(qi)(qi)迷(mi)希望李(li)(li)(li)世石(shi)能夠實現逆轉,但(dan)阿爾法(fa)圍棋(qi)(qi)(qi)徹底(di)摧毀了(le)這種可(ke)能。布局(ju)階段,李(li)(li)(li)世石(shi)左下(xia)(xia)掛角(jiao)后(hou)(hou)走高中國流。行不(bu)到二十手(shou),李(li)(li)(li)世石(shi)局(ju)面就落(luo)入下(xia)(xia)風。隨(sui)后(hou)(hou),雙方在左上角(jiao)展開(kai)戰斗,阿爾法(fa)圍棋(qi)(qi)(qi)對(dui)(dui)全局(ju)的(de)(de)把握一如既往地強大(da)(da)。李(li)(li)(li)世石(shi)不(bu)但(dan)自己的(de)(de)模(mo)樣被對(dui)(dui)手(shou)輕(qing)松打入,阿爾法(fa)圍棋(qi)(qi)(qi)還借助戰斗在下(xia)(xia)邊圍起一大(da)(da)塊(kuai)空,局(ju)面看上去還不(bu)如前兩(liang)盤好看。隨(sui)后(hou)(hou)的(de)(de)比賽,雖然李(li)(li)(li)世石(shi)仍(reng)然極力抵抗,并且祭出劫爭的(de)(de)手(shou)段,但(dan)是(shi)電腦(nao)精確應對(dui)(dui),讓(rang)他無功而返。到阿爾法(fa)圍棋(qi)(qi)(qi)下(xia)(xia)了(le)176手(shou)后(hou)(hou),李(li)(li)(li)世石(shi)只有(you)投子認負。圍棋(qi)(qi)(qi)人機大(da)(da)戰前三盤人類三連(lian)敗。
第四局
第四局:李世石執白中盤(pan)勝阿(a)爾法圍棋
2016年3月13日,圍(wei)棋(qi)人機大戰展開第四局(ju)較量。在接連三局(ju)負于“阿(a)爾(er)法(fa)圍(wei)棋(qi)”后(hou)(hou),脫去(qu)勝(sheng)負包袱的(de)李(li)世(shi)石為榮(rong)譽而戰,終于迎(ying)來(lai)了“圍(wei)棋(qi)人機大戰”的(de)首次(ci)勝(sheng)利(li)。與前(qian)幾局(ju)比(bi)賽(sai)(sai)相比(bi),李(li)世(shi)石此局(ju)更(geng)多次(ci)陷入(ru)了長時(shi)間(jian)思考(kao),導(dao)致耗(hao)時(shi)過(guo)多。在比(bi)賽(sai)(sai)進行(xing)到兩個(ge)(ge)半小時(shi)后(hou)(hou),李(li)世(shi)石僅剩(sheng)下17分鐘,比(bi)“阿(a)爾(er)法(fa)圍(wei)棋(qi)”剩(sheng)余(yu)時(shi)間(jian)足(zu)足(zu)少1個(ge)(ge)小時(shi)。但隨后(hou)(hou)李(li)世(shi)石祭出(chu)白(bai)78“挖”的(de)妙手(shou),一(yi)場“逆襲”之(zhi)戰也(ye)由此開始。阿(a)爾(er)法(fa)圍(wei)棋(qi)被(bei)(bei)李(li)世(shi)石的(de)“神之(zhi)一(yi)手(shou)”下得陷入(ru)混亂,走出(chu)了黑93一(yi)步常理(li)上的(de)廢棋(qi),導(dao)致棋(qi)盤右側一(yi)大片黑子“全死”。此后(hou)(hou),“阿(a)爾(er)法(fa)圍(wei)棋(qi)”判(pan)斷(duan)局(ju)面對自己(ji)不(bu)利(li),每步耗(hao)時(shi)明顯增長,更(geng)首次(ci)被(bei)(bei)李(li)世(shi)石拖入(ru)讀(du)秒。最(zui)終,李(li)世(shi)石冷靜收官鎖(suo)定勝(sheng)局(ju)。到180手(shou),阿(a)爾(er)法(fa)圍(wei)棋(qi)中盤認輸。
第五局
第(di)五(wu)局:阿爾法圍棋執白中盤(pan)勝李世石
2016年3月15日,圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)人機大戰(zhan)展開第五局(ju)對(dui)決。在(zai)上(shang)局(ju)比(bi)(bi)賽扳回一城后,李(li)(li)(li)(li)世(shi)(shi)石向阿(a)(a)(a)爾(er)法(fa)(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)團隊(dui)提出(chu)(chu)(chu)要在(zai)末戰(zhan)中執黑(hei)(hei),因為他覺得(de)阿(a)(a)(a)爾(er)法(fa)(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)執黑(hei)(hei)時發揮并(bing)不完美,戰(zhan)勝執白的(de)阿(a)(a)(a)爾(er)法(fa)(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)才更有(you)意(yi)義。執黑(hei)(hei)的(de)李(li)(li)(li)(li)世(shi)(shi)石選(xuan)擇了(le)穩健(jian)的(de)錯(cuo)小目、無憂角(jiao)開局(ju),阿(a)(a)(a)爾(er)法(fa)(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)則以(yi)二(er)連(lian)星應(ying)對(dui)。進入中盤(pan),李(li)(li)(li)(li)世(shi)(shi)石意(yi)圖非常明顯,以(yi)撈實地為主。但(dan)李(li)(li)(li)(li)世(shi)(shi)石在(zai)79和81手(shou)連(lian)出(chu)(chu)(chu)緩手(shou),被視為敗招。阿(a)(a)(a)爾(er)法(fa)(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)82靠也并(bing)非好的(de)應(ying)手(shou)。一波錯(cuo)進錯(cuo)出(chu)(chu)(chu)后,黑(hei)(hei)棋(qi)(qi)(qi)(qi)(qi)在(zai)87和89手(shou)再出(chu)(chu)(chu)緩手(shou),致使白棋(qi)(qi)(qi)(qi)(qi)左上(shang)角(jiao)的(de)圍(wei)(wei)剿更加(jia)有(you)力,黑(hei)(hei)棋(qi)(qi)(qi)(qi)(qi)形勢瞬間坍塌(ta)。此(ci)后,占據優(you)勢的(de)阿(a)(a)(a)爾(er)法(fa)(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)展現(xian)了(le)它強(qiang)大的(de)中后盤(pan)計算能力,鮮有(you)失誤,落子效率極高。不過(guo)李(li)(li)(li)(li)世(shi)(shi)石也并(bing)未放(fang)棄(qi),連(lian)續(xu)走出(chu)(chu)(chu)強(qiang)硬應(ying)手(shou),可(ke)惜棋(qi)(qi)(qi)(qi)(qi)盤(pan)下得(de)越(yue)來越(yue)小,難再覓逆轉機會(hui)。第280手(shou),李(li)(li)(li)(li)世(shi)(shi)石投子認負。這次圍(wei)(wei)棋(qi)(qi)(qi)(qi)(qi)人機大戰(zhan)的(de)最終比(bi)(bi)分定格為1比(bi)(bi)4。
賽事影響
對圍棋項目
圍棋(qi)人機大戰前,不(bu)(bu)(bu)少(shao)人擔心圍棋(qi)這塊陣(zhen)地一旦失(shi)守,將對整個項目(mu)產(chan)生滅頂之災,因為不(bu)(bu)(bu)少(shao)人或許會產(chan)生這樣的想法:號稱棋(qi)類智(zhi)力(li)(li)最頂尖的圍棋(qi)也不(bu)(bu)(bu)過爾(er)爾(er),從(cong)而魅力(li)(li)大減。可(ke)實際的情況(kuang)卻(que)是恰恰相(xiang)反(fan),很多平時不(bu)(bu)(bu)關心圍棋(qi)或者說根本連圍棋(qi)規則都不(bu)(bu)(bu)了解(jie)的人,也因為人機大戰開始(shi)了解(jie)和關心這項運動(dong)。
圍棋(qi)人機大(da)戰期間,關于人機大(da)戰的報道充斥于國(guo)內各種媒體的“頭(tou)條”,風頭(tou)完全蓋過了足(zu)球(qiu)、籃球(qiu)這(zhe)些風靡世界的運動;就(jiu)連圍棋(qi)普及(ji)率極低的歐(ou)美國(guo)家,英國(guo)廣播公司(BBC)、路(lu)透(tou)社、美聯(lian)社這(zhe)些主流媒體也(ye)對比賽進行了詳細報道,這(zhe)在以往(wang)幾(ji)乎是不可(ke)能的。
對人工智能
“人工(gong)智(zhi)能”這(zhe)個概念是人機大戰最終極的受(shou)益(yi)者(zhe)。圍(wei)棋(qi)人機大戰前,人工(gong)智(zhi)能對于普(pu)通人而言還是那么“云山霧罩(zhao)”;圍(wei)棋(qi)人機大戰后,人們通過各(ge)種報道已經(jing)了解(jie)到,人工(gong)智(zhi)能已經(jing)滲透到每個人的工(gong)作和(he)生(sheng)活(huo)中。智(zhi)能化(hua)服務將會快(kuai)速地(di)接入餐飲、出行、旅游、電影(ying)、教育(yu)、醫療等(deng)生(sheng)活(huo)服務領域,覆蓋用戶吃(chi)、住、行、玩,人工(gong)智(zhi)能在未來可能媲美人類的專(zhuan)職秘(mi)書。
阿爾法圍棋最大的(de)(de)勝利(li)是(shi)(shi)為(wei)人工(gong)智能打(da)造了一場(chang)全球性(xing)的(de)(de)科普,也代表(biao)了高(gao)科技企業對(dui)人工(gong)智能技術(shu)充滿“野心”的(de)(de)宣告。過(guo)去的(de)(de)人工(gong)智能只是(shi)(shi)存(cun)在于實驗室(shi)的(de)(de)智慧探索;而未(wei)來的(de)(de)科學技術(shu),人工(gong)智能將是(shi)(shi)基礎(chu),是(shi)(shi)推動商(shang)業與(yu)社會發展的(de)(de)強大動力。
李世石簡介
李世石(shi)是(shi)李昌鎬之(zhi)后(hou),韓國最(zui)具代表性的棋(qi)手(shou),他(ta)在2003年獲第16屆富士通(tong)杯冠(guan)軍后(hou)升(sheng)為九段棋(qi)手(shou)。自2002年加冕富士通(tong)杯以來,十年時間里他(ta)共獲18個世界冠(guan)軍。李世石(shi)屬(shu)于典(dian)型的力戰型棋(qi)風,善(shan)于敏銳地抓住對手(shou)的弱處主動(dong)出擊(ji),以強大的力量擊(ji)垮對手(shou),他(ta)的攻擊(ji)可以用“穩,準,狠(hen)”來形容(rong),經(jing)常能在劣勢下完成(cheng)逆(ni)轉。
AlphaGo2015年10月擊敗歐洲冠軍
谷歌曾于2014年以4億歐(ou)元收購人工智能(neng)公司DeepMind。由DeepMind研(yan)發的(de)AlphaGo項目已有兩(liang)年歷史,AlphaGo曾在去年戰勝了(le)歐(ou)洲圍棋冠軍樊(fan)麾(職業二段)。
去年10月5日-10月9日,谷歌(ge)AlphaGo在比賽(sai)中(zhong)以5:0的比分完勝了歐洲冠(guan)軍。除了戰(zhan)勝人類外,AlphaGo還與其他的圍棋程序對戰(zhan),獲得了500場勝利。
AlphaGo原理簡介
傳統的(de)(de)人工智能方法(fa)(fa)是(shi)將(jiang)所有可能的(de)(de)走法(fa)(fa)構建成一(yi)棵(ke)搜索樹 ,但這種方法(fa)(fa)對(dui)圍棋并(bing)不適(shi)用。此次谷歌推出的(de)(de)AlphaGo,將(jiang)高級搜索樹與深度神經(jing)網絡(luo)結合在(zai)一(yi)起。這些神經(jing)網絡(luo)通(tong)過12個處理層(ceng)傳遞對(dui)棋盤的(de)(de)描述,處理層(ceng)則包含數百萬個類似于神經(jing)的(de)(de)連接點。
其中一個(ge)神(shen)(shen)(shen)經(jing)網(wang)絡(luo)“決(jue)策網(wang)絡(luo)”(policy network)負(fu)責選擇(ze)下一步走法(fa),另一個(ge)神(shen)(shen)(shen)經(jing)網(wang)絡(luo)“值(zhi)網(wang)絡(luo)”(“value network)則(ze)預測比賽勝利方(fang)。谷(gu)歌方(fang)面用人類(lei)圍(wei)棋高手的(de)(de)三千(qian)萬步圍(wei)棋走法(fa)訓練神(shen)(shen)(shen)經(jing)網(wang)絡(luo),與此同(tong)時,AlphaGo也自行(xing)研(yan)究新戰略,在它的(de)(de)神(shen)(shen)(shen)經(jing)網(wang)絡(luo) 之間運行(xing)了數(shu)千(qian)局圍(wei)棋,利用反(fan)復(fu)試驗調(diao)整連接點,這個(ge)流程也稱為鞏(gong)固學習(xi)(reinforcement learning)。通過廣泛(fan)使(shi)用Google云平臺,完成了大量(liang)研(yan)究工作。
AlphaGo在與人的(de)對弈中用了“兩個大(da)腦”來(lai)解決問題:“決策網絡”和“值網絡”。通俗來(lai)說(shuo)就是,一個大(da)腦用來(lai)決策當前應該如何落(luo)子,另(ling)一個大(da)腦來(lai)預(yu)測比賽(sai)最終的(de)勝利(li)方。
值得一(yi)提(ti)的(de)是,李(li)世石(shi)也是第一(yi)次與機器對戰(zhan),所(suo)以他無(wu)法像和(he)人(ren)類對戰(zhan)那樣,先(xian)研究對方的(de)棋譜和(he)下棋風格。李(li)世石(shi)所(suo)能做(zuo)的(de)就是和(he)自(zi)己對弈。谷歌AlphaGo也是通過這種方式鍛煉自(zi)己,真正做(zuo)到了“人(ren)工智能”。
李世石之后 谷歌AlphaGo還會挑戰誰?
谷歌旗下DeepMind創始人哈薩比(bi)斯曾表示,還有很(hen)多實力很(hen)強的選手(shou),所(suo)以這次比(bi)賽之(zhi)后(hou),也(ye)許也(ye)會去中國、日本,與當地(di)高手(shou)切(qie)磋棋藝。
中國(guo)圍(wei)棋(qi)圍(wei)棋(qi)九段柯潔也對(dui)此表示了(le)興(xing)趣,昨天(tian)AlphaGo戰(zhan)勝李世石(shi)(shi)后,他發微(wei)博稱(cheng),“就算阿法狗戰(zhan)勝了(le)李世石(shi)(shi),但它贏不了(le)我”,并且還置(zhi)頂了(le)該微(wei)博。
并且他來頭也不小(xiao),柯潔自述,“現在暫(zan)時是世界圍棋第一人(特地用(yong)了暫(zan)時,謙(qian)虛是美德)正式比賽我是單(dan)盤8:2碾壓李(li)世石(他贏得這兩盤沒有任何作(zuo)用(yong))世界冠(guan)軍獲得過三次(此(ci)(ci)年齡如此(ci)(ci)成績前無古人)”。