比2016年強10倍　AlphaGo之父揭密致勝關鍵

:0:0

▲「AlphaGo 之父」Demis Hassabis透露，和2016年相比，本次參賽的新版AlphaGo，採用Cloud TPU技術，運算速度是之前的10倍。（圖／翻攝自wired）大中小 AlphaGo連勝柯潔兩場，讓世人見識到人工智慧的厲害。Google旗下DeepMind團隊CEO，有「AlphaGo 之父」之稱的Demis Hassabis透露，和2016年相比，本次參賽的新版AlphaGo，採用Cloud TPU技術，運算速度是之前的10倍。▲「AlphaGo 之父」Demis Hassabis透露，和2016年相比，本次參賽的新版AlphaGo，採用Cloud TPU技術，運算速度是之前的10倍。（影片／取自YouTube，若遭移除請見諒）前一個版本AlphaGo Lee以「只考慮人類可能走的位置」和「預先判定50回合」的準則，來限制搜索規模，去年的AlphaGo 混合了蒙特卡洛樹搜索、監督學習、增強學習等三種演算法。如今AlphaGo Master已提升到可以優先考慮哪裡是最有價值的位置，並預測更少回合數目，達到更高的準確率。AlphaGo運用蒙特卡洛樹（Monte Carlo tree search）啟發式搜尋演算方法，在比賽回合進行時，考慮的走子位置更少、預判回合數更少，預判依靠更強大的網路，僅用了4個TPU，只需要舊版AlphaGo Lee 10分之1的計算能力，速度更快，棋力更加強大。▲蒙特卡洛樹（Monte Carlo tree search）啟發式搜尋演算方法。（影片／取自YouTube，若遭移除請見諒）DeepMind 資深研究員 David Silver 表示，AlphaGo 對戰柯潔比賽當中，主要是採用「單一機器」運作，與2016年對戰韓國棋王李世乭的「分布式」的電腦們共同運作，透過 Cloud TPU 技術，運算法比去年更強大。此外，它的自我對弈能力更強，研究團隊會利用此次跟柯潔比賽，觀察AlphaGo弱點為何。David Silver 指出，AlphaGo最初設計主要目的就是為了透過跟人類對弈的方式來學習，因此必須要跟世上頂尖的棋手對弈，才能不斷改善進步，在目前最新版本當中，AlphaGo Master 現在已是自己的導師，能夠不斷自我學習、探索，因此對人類數據的依賴性日益減弱，能夠繼續不斷超越。原文詳見：http://www.limitlessiq.com/【本文經智慧機器人網同意授權刊出】