ITBear旗下自媒體矩陣:

從Bingo看百度人工智能 一場關(guān)于未來的博弈

   時間:2014-09-22 11:38:01 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

1997年,在IBM“深藍(lán)”戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫之后,《時代》雜志提出了一項新的挑戰(zhàn):“讓計算機(jī)與人類下圍棋吧,它獲勝的機(jī)會很小。計算機(jī)要在圍棋上戰(zhàn)勝人類,還要再過一百年,甚至更長的時間”。

《時代》雜志絕對不會想到,僅僅是十幾年后,他們眼中這個“百年難題”就被中國互聯(lián)網(wǎng)巨頭百度解決了。“我們現(xiàn)在做的Bingo智能圍棋系統(tǒng),9×9圍棋上已經(jīng)達(dá)到了業(yè)余六段,是準(zhǔn)職業(yè)水平了;在19路圍棋上也能達(dá)到業(yè)余一二段。”9月20日,在第五十四期百度技術(shù)沙龍上,百度公司自然語言處理部高級工程師,BINGO智能圍棋系統(tǒng)技術(shù)負(fù)責(zé)人楊程這樣說。

今年7月25日,百度舉辦了“挑戰(zhàn)Bingo”人機(jī)圍棋大戰(zhàn)。在最終的決戰(zhàn)中,Bingo分別以兩個2:1擊退兩名5段選手的挑戰(zhàn),最終以15戰(zhàn)全勝、總盤數(shù)38勝4負(fù)的絕對優(yōu)勢取得勝利。而Bingo智能圍棋系統(tǒng),僅僅是百度人工智能發(fā)展的一個縮影,目前百度很多被業(yè)界使用的技術(shù),比如說語音識別、海量識別、智能推薦,都是跟人工智能有關(guān)。習(xí)近平主席曾說,人工智能是第三代技術(shù),麻省理工學(xué)院科技雜志也將人工智能技術(shù)列為十大通用技術(shù)之首。而如今百度正在人工智能領(lǐng)域取得最突破性的進(jìn)展并且迅速在互聯(lián)網(wǎng)界產(chǎn)生影響。

長期以來,計算機(jī)圍棋是計算機(jī)科學(xué)領(lǐng)域公認(rèn)的最具挑戰(zhàn)性的研究課題之一。這個難題困擾了人類幾十年,如今,百度Bingo朝著這個方向邁出了堅實的一步。

打破常規(guī),獨(dú)創(chuàng)算法成突破關(guān)鍵

為什么計算機(jī)更擅長國際象棋,而在圍棋上遭遇到困難了呢?人工智能依靠對棋盤上不同位置進(jìn)行搜索分析、并找出棋盤上的“重點(diǎn)位置”,來決定自己落子的位置與套路,這也是“深藍(lán)”戰(zhàn)勝國際象棋大師的方法。與國際象棋不同的是,19路圍棋的空間復(fù)雜度比國際象棋復(fù)雜10的120(+)次方倍,;更嚴(yán)重的問題是,沒有人能夠用計算語言說清楚棋盤上哪個地方是重點(diǎn),一個子的好壞或許要到幾十步以后才顯現(xiàn)出來,甚至與盤上十幾格以外的子有關(guān)。在國際圍棋中風(fēng)光無限的“阿爾法貝塔搜索”已不足以應(yīng)對圍棋的復(fù)雜性。在這種情況下,百度Bingo的獨(dú)特算法成為了計算機(jī)圍棋突破的關(guān)鍵。

進(jìn)入21世紀(jì),基于蒙特卡洛樹狀搜索的UCT算法一直被業(yè)界視為解決計算機(jī)為其問題的關(guān)鍵,但UCT算法同樣存在著取樣量巨大、運(yùn)行緩慢的致命問題。在UCT算法的基礎(chǔ)上,楊程老師及其團(tuán)隊進(jìn)行了大量的優(yōu)化改進(jìn),最終提出了全新的學(xué)習(xí)算法,并成功應(yīng)用于Bingo系統(tǒng)中。在相同時間內(nèi),新算法可以產(chǎn)生比UCT多若干倍的統(tǒng)計值,這可以大大加快Bingo的在線學(xué)習(xí)速度;其次,楊程和他的團(tuán)隊還定義了一種弱化形式的Alpha-Beta搜索,將其與在線強(qiáng)化學(xué)習(xí)和離線監(jiān)督學(xué)習(xí)結(jié)合起來,并成功地嵌入到蒙特卡洛搜索當(dāng)中,這使得探索更加深入地往極具前景的方向發(fā)展。“因為統(tǒng)計值多了,所以Bingo學(xué)習(xí)很快,而且基本上成功地實現(xiàn)了Rapid Action…可能的勝率在百分之七八十左右。”在談到新算法帶來的改進(jìn)時,楊程說。

“自學(xué)成才”,計算機(jī)學(xué)下圍棋無需高手調(diào)教

楊程也是一位圍棋熱情愛好者,但想要讓自己開發(fā)出的百度Bingo達(dá)到戰(zhàn)勝職業(yè)棋手的水準(zhǔn),僅僅依靠愛好者的經(jīng)驗調(diào)教顯然是不夠的。那在Bingo的開發(fā)過程中,百度是否專門為之請來了圍棋高手進(jìn)行一對一教學(xué)?

答案是否定的。Bingo系統(tǒng)采用了監(jiān)督學(xué)習(xí)的方法,利用在線學(xué)習(xí),自動歸納總結(jié)每一局棋的每一步落子哪里好,哪里壞。結(jié)合機(jī)器學(xué)習(xí)與搜索技術(shù),Bingo會自動棋局進(jìn)行分析,并對自己的棋路進(jìn)行評分,長期競賽積累的上萬、至幾千萬的“學(xué)習(xí)經(jīng)驗”都將匯總歸納進(jìn)算法公式中,并以此形成新的對弈策略。對除此之外,來自職業(yè)棋手的海量棋譜也是Bingo學(xué)習(xí)的“參考資料”。

“我們希望(在開發(fā)智能系統(tǒng)時),開發(fā)者不需要很高深的知識,只通過純粹技術(shù),就能讓計算機(jī)具備相應(yīng)的智能能力,我想這就是我們?nèi)斯ぶ悄芩非蟮哪繕?biāo)。”楊程說。

在百度,像楊程這樣致力于人工智能研究的人還有很多,經(jīng)過這些科學(xué)家不懈的努力,百度在人工智能領(lǐng)域也取得了不少突破,比如百度的圖像識別能力已經(jīng)做到了全球一流水平,穩(wěn)坐國內(nèi)第一把交椅,識別度達(dá)到92%左右,超過了過去15年識別率增幅的總和。

發(fā)散思維 Bingo技術(shù)助推一線產(chǎn)品

在作為計算機(jī)最前沿領(lǐng)域之一的人工智能研究中,解決一項理論化的問題的時候,往往將同步產(chǎn)生很多與之相關(guān)的分支理論和技術(shù),并在不同的學(xué)科與產(chǎn)品之間建立溝通的橋梁,而這也是高尖端科研最重要的現(xiàn)實意義。“數(shù)學(xué)上‘四色定理分割地圖’的問題實際上現(xiàn)在已經(jīng)基本上被解決了,但是在這個解決的過程中并沒有誕生太多新東西,所以數(shù)學(xué)界也認(rèn)為‘四色定理’不是一個特別好的問題。”在論及這一點(diǎn)時,楊程評論說。百度Bingo系統(tǒng)所致力的,不僅僅是要攀登計算機(jī)圍棋問題的高峰,還要將這項技術(shù)最大化的應(yīng)用于產(chǎn)品之中。

這一目標(biāo),Bingo同樣做到了。Bingo智能圍棋系統(tǒng)中應(yīng)用到的前沿搜索技術(shù),已經(jīng)被應(yīng)用到生物統(tǒng)計,包括經(jīng)典規(guī)劃,網(wǎng)頁搜索,個性化推薦等等百度旗下相關(guān)產(chǎn)品之中;而讓Bingo更加智能的機(jī)器學(xué)習(xí)、監(jiān)督學(xué)習(xí)等技術(shù),同樣也已經(jīng)在PS結(jié)果主動展現(xiàn)、索引分層、圖片搜索、知心卡片推薦、移動app推薦等產(chǎn)品層面中被加以廣泛應(yīng)用。技術(shù)的進(jìn)步真正被帶到了消費(fèi)領(lǐng)域之中,百度在人工智能領(lǐng)域的領(lǐng)先優(yōu)勢也同樣在平民化的消費(fèi)市場中得到了延續(xù)和延伸。

業(yè)界一直認(rèn)為,人工智能的應(yīng)用場景非常豐富,帶給人們的想象空間也很大,百度首席科學(xué)家吳恩達(dá)說,誰贏了人工智能,誰就贏得了未來。如今看來,一個市值幾千億美金的公司正在向百度招手。

百度技術(shù)沙龍是全國最早的技術(shù)開放交流活動,由百度組織策劃,至今已經(jīng)持續(xù)舉辦4年,經(jīng)歷了54期。百度技術(shù)沙龍一直致力于以“技術(shù)開放”的心態(tài),分享 行業(yè)領(lǐng)先的技術(shù)理念和技術(shù)實踐。目前,百度技術(shù)沙龍已經(jīng)成為北京中高端技術(shù)人員的精神家園,百度技術(shù)沙龍希望日后能夠有效推動中國互聯(lián)網(wǎng)的技術(shù)發(fā)展與行業(yè)創(chuàng)新。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version