Vincent Vanhoucke是Google的首席迷信家,斯坦福年夜學(xué)電子工程學(xué)博士,今朝在Google Brain主導(dǎo)機械人相干的項目。Vanhoucke重要的研討范疇是語音辨認(rèn)、盤算機視覺和機械人等范疇,他還行將掌管機械人范疇的嘉會CoRL 2017(Conference on Robot Learning)。
Vanhoucke以為,機械智能如今曾經(jīng)成長到一個相當(dāng)?shù)乃疁?zhǔn),在某些特定情境下的表示可以媲美(乃至超出)人類,好比機械視覺、機械翻譯、語音辨認(rèn),如今是時刻讓這些才能在物理世界中施展效應(yīng)了。他在明天的演講中提到,robotics的研討如今也正面對著一場深度進修的改革,完成這一點,須要如今的機械進修從業(yè)者跳出監(jiān)視進修的溫馨區(qū),面對一些辣手的成績:數(shù)據(jù)稀缺,若何使機械完成技巧轉(zhuǎn)換和連續(xù)性的進修等等。Vanhoucke也提到,這也是人工智能從實際到理論的必經(jīng)之路。
Vanhoucke說,2011年,語音辨認(rèn)研討者采取神經(jīng)收集技巧下降語音辨認(rèn),毛病率年夜幅下降,是語音辨認(rèn)范疇十多年來最年夜的提高;2016年,簡直就曾經(jīng)到達人類水準(zhǔn)了。
而機械翻譯,2014年機械進修的引入也讓機械翻譯有了質(zhì)的提高,但要說到達人類水準(zhǔn),照樣比擬委曲……
(看keynote上的名單,為Google的機械翻譯做出進獻的,華人數(shù)目很多。)
這個柱狀圖是人類翻譯、神經(jīng)收集翻譯和PBMT翻譯的質(zhì)量差異,順次遞加。
Vanhoucke以為,機械進修研討比曩昔更輕易了,有更多的開源對象和模子,更多的收集教程(他本身就在Udacity上開了收集課程),GPU和高機能盤算硬件門坎也變低了,研討者也比之前更多。
圖片辨認(rèn)范疇,除底層技巧的完美,Google曾經(jīng)將圖片辨認(rèn)技巧運用在醫(yī)療范疇,贊助大夫診斷病情,而且取得了一些成效。
但他也說,圖象辨認(rèn)如今遠遠沒有到“succes”的田地,有40%基于圖象監(jiān)測做的決議計劃,成果是很蹩腳的。
接上去是機械人的部門。Vanhoucke是電子工程專業(yè)出生,在Google Brain重要的任務(wù)是機械人項目。他先強調(diào)了一個和許多人認(rèn)知有收支的不雅點:今朝的機械人研討其實跟深度進修沒有多年夜關(guān)系。
他做了個示范,讓手里的筆失落在地上,說,假如機械人的義務(wù)是抓取筆的話,那末捉住了和抓不住,從內(nèi)部不雅察不到機械人的舉措有甚么差異(按:是以不克不及從中獲得甚么紀(jì)律)。
機械抓取特定的物體是有跡可循的,抓取未知的物體還沒有法處理。(Vanhoucke播了一段機械人摔交集錦視頻,說曩昔他認(rèn)為這些機械人摔交很可笑,然則后來本身開端做機械人項目以后,看到這類畫面就再也笑不出來了。研討機械抓取真的很難,但他很enjoy。)
越是少的圖象辨認(rèn)技巧參與,機械的魯棒性就越好,能應(yīng)對更龐雜的物體。后續(xù)有聽眾問及抓取對象的數(shù)據(jù)庫時,Vanhoucke說他們(Google)其實不愿望樹立一個如許的常識圖譜。
強化進修的引入關(guān)于機械人的研討能夠有贊助,條件是先有一個能發(fā)生海量樣本的參照模子。
最初的結(jié)論:
1、robotics和機械進修正在產(chǎn)生成心思的融會;
2、關(guān)于慣例的robotics成績,要有做出分歧謎底的覺醒;
3、It hits all the right difficult problems on the road to practical AI。