當前位置: 首頁 » 行業資訊 » 機器人»經過一年的修煉，AlphaGo的哪些能力突飛猛進了？

經過一年的修煉，AlphaGo的哪些能力突飛猛進了？

[點擊復制]

發布日期：2017-05-24 來源：雷鋒網瀏覽次數：580

核心提示：　　烏鎮圍棋峰會第一局曾經停止了，用時4個半小時，以柯潔九段執黑負于 AlphaGo，AlphaGo 贏四分之一子了結，如許河清海晏的成果想必許多人都猜測到了，不外年夜家從一開端就曉得存眷的重點，不在于柯潔怎樣輸的，

　　烏鎮圍棋峰會第一局曾經停止了，用時4個半小時，以柯潔九段執黑負于 AlphaGo，AlphaGo 贏四分之一子了結，如許河清海晏的成果想必許多人都猜測到了，不外年夜家從一開端就曉得存眷的重點，不在于柯潔怎樣輸的，而是AlphaGo曾經退化到甚么水平了，間隔Deep Mind團隊出論文來詳解AlphaGo有多強還有一段時光，So我們其實可以從現場不雅戰中來看出一些眉目。

　　棋速

　　第一局棋下到一半的時刻，很多棋友群里的人沸騰了，發明AlphaGo落子速度異常快，每步棋落子速度在30S－40S之間動搖，對此圍棋專業5段趙先生表現：“（這局棋）像安泰逝世，不知不覺就輸了，（比擬客歲）機械落子飛快但毛病根本沒有”。

　　綜合整局，AlphaGo落子表示沉著、武斷，而柯潔的落子狀態較多變。終究在競賽停止了四個多小時以后，AlphaGo贏四分之一子。

　　棋風

　　AlphaGo1.0的時刻（客歲3月跟李世石對戰的時刻），它的棋風歸納綜合起來就是善于記住棋譜+加強進修+盤算才能，身上還能看到人類棋風的影子，等AlphaGo喬裝成Master60連勝的時刻，很多圍棋年夜師包含聶衛平在內開端評價其棋風“很難忖度Master的作風……它永久都沒有臉色，永久不受情感影響，永久一個節拍，就是要贏你。”而明天，第一局棋還沒停止的時刻，搜狗王小川已在知乎上發文分析AlphaGo2.0 棋風“完整離開人類經歷”——“而AlphaGo2.0離開了機械對人模擬，走棋作風也將完整離開人的定式。在與柯潔的競賽中，會賡續涌現我們意想不到的走棋，并且這些走棋在教科書中會被以為是初級毛病或許完整弗成理喻，凡是一個正常的棋手都不會這么玩，凡是一個老手這么玩都邑被點撥如許紕謬。而AlphaGo2.0會賡續制作如許的局勢，癥結他照樣對的。”

　　不外最初照樣柯潔說了算，他在會后的采訪頂用了一個很好的例子解釋了AlphaGo的棋風莫測：（在回想競賽時也對第54手的斷）時，他表現了確定：“很震動，這在人類的下法中是不克不及有的。在斷以后，它把本身的腳步實地化，變得更厚，一舉兩得。”。

　　算法

　　AlphaGo1.0的時刻（客歲3月跟李世石對戰的時刻）應用的算法精華，依據FB田淵棟看完Nature論文的解讀，由估值收集評價棋局，戰略收集選擇落子，疾速走子（Fast rollout）恰當加快，再用蒙特卡羅樹搜刮把以上這三個部門連起來，構成一個完全的體系。

　　這一次固然知乎服裝論壇t.vhao.net等活潑地皮曾經開端紛紜推想此次的AlphaGo2.0用了甚么牛叉的算法，有了硬件的猜測掉誤，本相照樣等Deep Mind前面來親身頒布，目測算法猜測這個要依據它的單機版10個GPU＋TPU助力猜測比擬靠譜。

　　硬件需求下降

　　依據DeepMind員工揭橥在2016年1月Nature期刊的論文，散布式版本（AlphaGo Distributed）應用了1202個CPU和176個GPU。

　　不外此次競賽AlphaGo用的何種硬件設置裝備擺設，DeepMind在會后的消息宣布會中表現，此次競賽的AlphaGo是新版本，它改良了新的算法，重要提高是盤算量少了十倍，自我棋戰更強。Hassabis稱，在競賽中法式是在一個單一的機械上運作的，這與客歲紛歧樣，其時是散布式的。此次有更壯大的算法，運作起來更簡略也更好，取得的速度更快。別的Hassabis表現，盤算力可以“在Google云中取得，用的是TPU，十個處置單元，少了十倍的盤算量”。簡略點說，此次的AlphaGo是單機版。

　　迭代速度

　　哈薩比在此鏈接中的劍橋年夜學的一次演講中提到，之前從零練習一個AlphaGo要三個月，如今只須要一個禮拜（“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”）。

　　假如稱對戰李世石時代的版本為V18迭代版本，喬裝成Master60連勝并宣告進級完成的時辰為V25版本，如今的AlphaGo又是V若干版本，練習的時刻會不會一周都不要了？這是我們今天要親身問DeepMind團隊的。

　　從單人對戰到團隊對戰

　　心細的同伙確定留意到了，柯潔和AlphaGo棋戰以外，5月26號上午還有一場配對賽，配對賽兩邊－－－古力＋AlphaGoV連笑＋AlphaGo，即棋戰兩邊分離由一名棋手與AlphaGo構成，棋手與AlphaGo協作停止競賽。5月26號上午下晝則是陳耀華，周睿羊，羋昱延，時越，唐韋星和AlphaGo的5對1團隊賽。

　　Google之所以敢如許設置賽制，獨一的說明就是，AlphaGo如今既懂人類下圍棋的那部門，又懂AI下圍棋的那部門，并可以做到融合貫穿，所以它才敢挑釁配對賽這類跟另外一個錯誤高度合營的賽制，又敢挑釁測試本身“戰役力”極限的集團賽。AI最恐怖的部門不是它單個力氣有多強，而是它開端理解和方圓“互動”，如許的融匯是否是比客歲3月的人機年夜戰恐怖多了呢？

　　小結：

　　前次AlphaGo喬裝成Master測試的時刻，柯潔曾經落敗給Master過一次，他不是沒見識過AI圍棋的兇猛，但聯合柯潔明天在現場的沉著表示，和他昨晚莫明其妙地深夜感嘆，我們有來由信任，這不是一場比AI圍棋選手和人類圍棋選手哪一個更兇猛的選手，DeepMind團隊必定有些懸而未決的謎底須要這場競賽給一個確定的驗證，然后再往誰人偏向完成更深一步的摸索。

下一篇：大數據產業前景廣闊未來三年年均復合增長率將達30%左右
上一篇：《中華人民共和國衛星導航條例》已被列入立法工作計劃

[ 行業資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關閉窗口 ]

同類行業資訊

共0條 [查看全部] 相關評論

展會更多+

第26屆上海國際清	2025數控機床與金
2025中國(上海)機	2025武漢國際工業

視頻更多+

中舟智能固守科技	玉灃科技：精研滑
新松機器人自動化	羅克韋爾自動化（

• 7年投資44.2億元！廣東持續推進AI與機器人關鍵	• 人形機器人商業化落地可期
• 在成都，機器人批量造機器人	• 持續構建創新生態，浦東加速人形機器人多元場景
• 人形機器人生產節奏漸趨明確多家公司布局絲杠	• 從實驗室到賽場我國人形機器人迎來迅猛發展
• 機器人產業前景廣闊汽車零部件企業入局搶抓先	• 外媒：人形機器人首次在中國汽車工廠協作應用
• 馬斯克：今年目標生產5000臺人形機器人	• 廣東推出12項硬核舉措力促AI與機器人產業躍升

天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

我的供應

我的求購

商鋪管理

工業機器人及行業應用

智能機器人

工業自動化

智能裝備

經過一年的修煉，AlphaGo的哪些能力突飛猛進了？