比2016年強10倍 AlphaGo之父揭密致勝關鍵

▲「AlphaGo 之父」Demis Hassabis透露,和2016年相比,本次參賽的新版AlphaGo,採用Cloud TPU技術,運算速度是之前的10倍。(圖/翻攝自wired) 大 中 小 AlphaGo連勝柯潔兩場,讓世人見識到人工智慧的厲害。Google旗下DeepMind團隊CEO,有「AlphaGo 之父」之稱的Demis Hassabis透露,和2016年相比,本次參賽的新版AlphaGo,採用Cloud TPU技術,運算速度是之前的10倍。▲「AlphaGo 之父」Demis Hassabis透露,和2016年相比,本次參賽的新版AlphaGo,採用Cloud TPU技術,運算速度是之前的10倍。(影片/取自YouTube,若遭移除請見諒)前一個版本AlphaGo Lee以「只考慮人類可能走的位置」和「預先判定50回合」的準則,來限制搜索規模,去年的AlphaGo 混合了蒙特卡洛樹搜索、監督學習、增強學習等三種演算法。如今AlphaGo Master已提升到可以優先考慮哪裡是最有價值的位置,並預測更少回合數目,達到更高的準確率。AlphaGo運用蒙特卡洛樹(Monte Carlo tree search)啟發式搜尋演算方法,在比賽回合進行時,考慮的走子位置更少、預判回合數更少,預判依靠更強大的網路,僅用了4個TPU,只需要舊版AlphaGo Lee 10分之1的計算能力,速度更快,棋力更加強大。▲蒙特卡洛樹(Monte Carlo tree search)啟發式搜尋演算方法。(影片/取自YouTube,若遭移除請見諒)DeepMind 資深研究員 David Silver 表示,AlphaGo 對戰柯潔比賽當中,主要是採用「單一機器」運作,與2016年對戰韓國棋王李世乭的「分布式」的電腦們共同運作,透過 Cloud TPU 技術,運算法比去年更強大。此外,它的自我對弈能力更強,研究團隊會利用此次跟柯潔比賽,觀察AlphaGo弱點為何。David Silver 指出,AlphaGo最初設計主要目的就是為了透過跟人類對弈的方式來學習,因此必須要跟世上頂尖的棋手對弈,才能不斷改善進步,在目前最新版本當中,AlphaGo Master 現在已是自己的導師,能夠不斷自我學習、探索,因此對人類數據的依賴性日益減弱,能夠繼續不斷超越。原文詳見:http://www.limitlessiq.com/【本文經智慧機器人網同意授權刊出】


本篇
不想錯過? 請追蹤FB專頁!    
前一頁 後一頁
追好文 :) 點個讚吧!
支持網站營運,有空請觀看一下我們的贊助商
echo '';
3