天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當前位置: 首頁 » 行業資訊 » 機器人»經過一年的修煉,AlphaGo的哪些能力突飛猛進了?
   

經過一年的修煉,AlphaGo的哪些能力突飛猛進了?

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2017-05-24   來源:雷鋒網   瀏覽次數:580
核心提示:  烏鎮圍棋峰會第一局曾經停止了,用時4個半小時,以柯潔九段執黑負于 AlphaGo,AlphaGo 贏四分之一子了結,如許河清海晏的成果想必許多人都猜測到了,不外年夜家從一開端就曉得存眷的重點,不在于柯潔怎樣輸的,

  烏鎮圍棋峰會第一局曾經停止了,用時4個半小時,以柯潔九段執黑負于 AlphaGo,AlphaGo 贏四分之一子了結,如許河清海晏的成果想必許多人都猜測到了,不外年夜家從一開端就曉得存眷的重點,不在于柯潔怎樣輸的,而是AlphaGo曾經退化到甚么水平了,間隔Deep Mind團隊出論文來詳解AlphaGo有多強還有一段時光,So我們其實可以從現場不雅戰中來看出一些眉目。

  棋速

  第一局棋下到一半的時刻,很多棋友群里的人沸騰了,發明AlphaGo落子速度異常快,每步棋落子速度在30S-40S之間動搖,對此圍棋專業5段趙先生表現:“(這局棋)像安泰逝世,不知不覺就輸了,(比擬客歲)機械落子飛快但毛病根本沒有”。

  綜合整局,AlphaGo落子表示沉著、武斷,而柯潔的落子狀態較多變。終究在競賽停止了四個多小時以后,AlphaGo贏四分之一子。

  棋風

  AlphaGo1.0的時刻(客歲3月跟李世石對戰的時刻),它的棋風歸納綜合起來就是善于記住棋譜+加強進修+盤算才能,身上還能看到人類棋風的影子,等AlphaGo喬裝成Master60連勝的時刻,很多圍棋年夜師包含聶衛平在內開端評價其棋風“很難忖度Master的作風……它永久都沒有臉色,永久不受情感影響,永久一個節拍,就是要贏你。”而明天,第一局棋還沒停止的時刻,搜狗王小川已在知乎上發文分析AlphaGo2.0 棋風“完整離開人類經歷”——“而AlphaGo2.0離開了機械對人模擬,走棋作風也將完整離開人的定式。在與柯潔的競賽中,會賡續涌現我們意想不到的走棋,并且這些走棋在教科書中會被以為是初級毛病或許完整弗成理喻,凡是一個正常的棋手都不會這么玩,凡是一個老手這么玩都邑被點撥如許紕謬。而AlphaGo2.0會賡續制作如許的局勢,癥結他照樣對的。”

  不外最初照樣柯潔說了算,他在會后的采訪頂用了一個很好的例子解釋了AlphaGo的棋風莫測:(在回想競賽時也對第54手的斷)時,他表現了確定:“很震動,這在人類的下法中是不克不及有的。在斷以后,它把本身的腳步實地化,變得更厚,一舉兩得。”。

  算法

  AlphaGo1.0的時刻(客歲3月跟李世石對戰的時刻)應用的算法精華,依據FB田淵棟看完Nature論文的解讀,由估值收集評價棋局,戰略收集選擇落子,疾速走子(Fast rollout)恰當加快,再用蒙特卡羅樹搜刮把以上這三個部門連起來,構成一個完全的體系。

  這一次固然知乎服裝論壇t.vhao.net等活潑地皮曾經開端紛紜推想此次的AlphaGo2.0用了甚么牛叉的算法,有了硬件的猜測掉誤,本相照樣等Deep Mind前面來親身頒布,目測算法猜測這個要依據它的單機版10個GPU+TPU助力猜測比擬靠譜。

  硬件需求下降

  依據DeepMind員工揭橥在2016年1月Nature期刊的論文,散布式版本(AlphaGo Distributed)應用了1202個CPU和176個GPU。

  不外此次競賽AlphaGo用的何種硬件設置裝備擺設,DeepMind在會后的消息宣布會中表現,此次競賽的AlphaGo是新版本,它改良了新的算法,重要提高是盤算量少了十倍,自我棋戰更強。Hassabis稱,在競賽中法式是在一個單一的機械上運作的,這與客歲紛歧樣,其時是散布式的。此次有更壯大的算法,運作起來更簡略也更好,取得的速度更快。別的Hassabis表現,盤算力可以“在Google云中取得,用的是TPU,十個處置單元,少了十倍的盤算量”。簡略點說,此次的AlphaGo是單機版。

  迭代速度

  哈薩比在此鏈接中的劍橋年夜學的一次演講中提到,之前從零練習一個AlphaGo要三個月,如今只須要一個禮拜(“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”)。

  假如稱對戰李世石時代的版本為V18迭代版本,喬裝成Master60連勝并宣告進級完成的時辰為V25版本,如今的AlphaGo又是V若干版本,練習的時刻會不會一周都不要了?這是我們今天要親身問DeepMind團隊的。

  從單人對戰到團隊對戰

  心細的同伙確定留意到了,柯潔和AlphaGo棋戰以外,5月26號上午還有一場配對賽,配對賽兩邊---古力+AlphaGoV連笑+AlphaGo,即棋戰兩邊分離由一名棋手與AlphaGo構成,棋手與AlphaGo協作停止競賽。5月26號上午下晝則是陳耀華,周睿羊,羋昱延,時越,唐韋星和AlphaGo的5對1團隊賽。

  Google之所以敢如許設置賽制,獨一的說明就是,AlphaGo如今既懂人類下圍棋的那部門,又懂AI下圍棋的那部門,并可以做到融合貫穿,所以它才敢挑釁配對賽這類跟另外一個錯誤高度合營的賽制,又敢挑釁測試本身“戰役力”極限的集團賽。AI最恐怖的部門不是它單個力氣有多強,而是它開端理解和方圓“互動”,如許的融匯是否是比客歲3月的人機年夜戰恐怖多了呢?

  小結:

  前次AlphaGo喬裝成Master測試的時刻,柯潔曾經落敗給Master過一次,他不是沒見識過AI圍棋的兇猛,但聯合柯潔明天在現場的沉著表示,和他昨晚莫明其妙地深夜感嘆,我們有來由信任,這不是一場比AI圍棋選手和人類圍棋選手哪一個更兇猛的選手,DeepMind團隊必定有些懸而未決的謎底須要這場競賽給一個確定的驗證,然后再往誰人偏向完成更深一步的摸索。

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
展會更多+
視頻更多+
點擊排行
 
網站首頁 | 網站地圖 | 排名推廣 | 廣告服務 | 積分換禮 | 網站留言 | RSS訂閱
主站蜘蛛池模板: 色综合五月 | 97天天摸天天碰天天爽 | 日韩中文在线观看 | 亚洲无线一二三四区手机 | 欧美精品在欧美一区二区 | 高h猛烈做哭bl壮汉受欧美 | 国产aⅴ一区二区 | 在线不卡一区二区三区日韩 | 欧美顶级xxxxbbbb | 精品亚洲一区二区 | 天干天干夜天干天天爽 | 亚洲 国产 日韩 欧美 | 欧美91在线 | 免费视频色 | 成人短视频网站 | 亚洲丁香婷婷综合久久小说 | 欧美福利网| 国产大片在线播放 | 午夜影视在线观看 | 日本二区视频 | 午夜日韩在线 | 国产激情视频一区二区三区 | 亚洲欧美一区二区三区在线播放 | 在线国产视频一区 | 欧洲亚洲一区 | 日韩三级黄色片 | 福利视频h| 在线天堂资源 | 亚洲综合无码一区二区 | 男人趴在女人身上曰皮免费 | 污视频黄| 被窝国产理论一二三影院 | 男女男在线精品网站免费观看 | 视频一区二区三区在线观看 | 色婷婷激婷婷深爱五月小说 | 欧美一区综合 | 亚洲欧美日韩高清一区二区一 | 国产精品视频白浆免费视频 | 欧美日韩性视频一区二区三区 | 欧美在线色图 | 欧美日操 |