隨著自然語言處理、知識庫等人工智能技術(shù)的發(fā)展,許多媒體已經(jīng)開始了機器人報道的探索。《紐約時報》數(shù)字部門開發(fā)了機器人編輯 Blossomblot,每天推送300篇文章,每篇文章的平均閱讀量是普通文章的38倍。此外,《紐約時報》還會在財報季、運動比賽報道的時候使用機器人來寫稿;美聯(lián)社在過去一年多時間里使用Wordsmith系統(tǒng)編發(fā)企業(yè)財報;在華爾街引起巨大反響的Kensho可以通過接入美國勞工部等數(shù)據(jù)源來自行創(chuàng)造投資分析報告;電訊社也計劃使用雅虎在報導(dǎo)夢幻橄欖球聯(lián)賽時用到的技術(shù),用來發(fā)布一些美式橄欖球回顧;AutomatedInsights的寫作軟件去年寫了150億篇文章,宣稱自己是世界上最大的內(nèi)容生產(chǎn)者;路透社也在發(fā)表機器撰寫的文章,該系統(tǒng)的負責人認為「在一次盲測中,機器的作品表現(xiàn)得比人類作品更具可讀性。」;此外,還有專門提供「標題黨」服務(wù)的Click-o-Tron公司。
媒體領(lǐng)域出現(xiàn)這種趨勢的原因在于相關(guān)技術(shù)已經(jīng)達到了一定的成熟度,而且這種成熟度是和新聞媒體的要求很好的匹配在了一起。在卡斯韋爾的「結(jié)構(gòu)化故事」系統(tǒng)中,所謂的「故事」完全不是個故事,而是一個信息網(wǎng),我們可以像對待文案、信息圖表或者其它表達形式一樣去組裝它,閱讀它,就像我們擺弄音樂音符一樣。任何一類信息——從法院報道到天氣預(yù)報——都能夠最終能放入到這個數(shù)據(jù)庫中。這樣的系統(tǒng)的潛力是巨大的。
「大多數(shù)自然語言系統(tǒng)都是在簡單地描述一個事件。但是大多數(shù)新聞都是描繪性的,甚至是事件驅(qū)動的」來自密蘇里大學DonaldWReynolds新聞機構(gòu)的大衛(wèi)·卡斯韋爾說。「事件們在不同的地點發(fā)生,這些事件之間的因果關(guān)系是這些事件的核心敘述結(jié)構(gòu)。」需要把它們放到古老的新聞術(shù)語中:誰,發(fā)生了什么,在哪里,什么時候。
根據(jù) DonaldWReynolds的說法,人工智能系統(tǒng)在進行新聞創(chuàng)作時需要解決非常多的技術(shù)難題,包括自然語言處理中的自動摘要、文本分類等,還有知識庫和知識發(fā)現(xiàn)(KDD)等相關(guān)技術(shù),比如實體定義、關(guān)系抽取、問答系統(tǒng)等。簡單來說,就是機器首先需要理解自然語言,然后通過知識管理弄明白新聞中各個要素(各類知識)之間的關(guān)系。
Xiaomingbot、CFO只是頭條實驗室眾多研究布局中的階段性成果,后者旨在推動人工智能技術(shù)研究,讓算法更好地理解文字、圖片、視頻、環(huán)境場景和用戶興趣,從而促進人類信息與知識交流的效率和深度。今日頭條不僅僅是新聞客戶端,是一款基于機器學習的個性化資訊推薦引擎,是所有信息、內(nèi)容分享創(chuàng)作的平臺。人工智能和機器學習的算法起到了重要作用,能夠幫助高效精準地把用戶感興趣的內(nèi)容推薦出去。今日頭條的內(nèi)容平臺對應(yīng)著雙邊用戶:一邊是內(nèi)容的創(chuàng)作者,另一邊是內(nèi)容的消費者。所以為了把最好的內(nèi)容推薦給最需要的讀者,就需要機器學習的技術(shù)。今日頭條等媒體巨頭對人工智能技術(shù)在研發(fā)和應(yīng)用上的加碼,讓我們看到了人工智能在未來對媒體業(yè)造成的巨大影響。《淺狽中提到,互聯(lián)網(wǎng)作為一種智力工具,在給我們帶來便利的同時也在重塑著我們的思維方式。隨之而來的問題是,互聯(lián)網(wǎng)這種媒介傳遞的信息越多,我們想找到優(yōu)質(zhì)或者自己所需信息的難度也就越大。而這正是人工智能的優(yōu)勢所在,它可以讓大數(shù)據(jù)從負擔變成便利,會重塑媒體的內(nèi)容生產(chǎn)和分發(fā)。
在采用Wordsmith之前,美聯(lián)社需撰寫約300家公司的財報文章,可想而知這并不是個輕松的工作量。在使用機器人Wordsmith之后,美聯(lián)社每季度可以出3000家公司財報,雖然其中仍有120篇需要人力更新或添加獨立的后續(xù)報道,但顯然它替人類編輯承擔了絕大部分的工作量。
在哥倫比亞大學慶祝普利策獎?wù)Q生一百年之際,智能機器人也將在財經(jīng)報道、體育實況報道、騙點擊的標題黨新聞(clickbait)以及其它原本只有受過訓練的記者才能報導(dǎo)的領(lǐng)域開始一展身手。「總有一天,機器人會贏得普利策獎」,來自NarrativeScience的KrisHammond如此預(yù)測。這家公司專注于「自然語言生成」。「我們能講述隱藏在數(shù)據(jù)中的故事。」最近的進步味著,人工智能現(xiàn)在能夠撰寫出具有可讀性的流暢文字,并且還能比亢奮的寫手更快地大量炮制模板型文章。「有了自動化,我們現(xiàn)在能為4,000家公司追蹤、撰寫季度收益報告,」來自世界第一個也是迄今為止唯一個使用自動化編輯的通訊社——美通社的賈斯汀·邁爾斯說,「以前我們只能做到400家。」
而對于機器人能否拿普利策新聞獎這個問題,邁爾斯也「絕對相信」——因為機器人已經(jīng)做到了。BillDedman因一篇抵押貸款中存在種族主義問題的調(diào)查報道,而獲得了普利策獎。這篇報道雖然發(fā)表于1988年,卻是由電腦協(xié)助寫作成的。
自動化新聞不僅僅具有數(shù)量優(yōu)勢,還有助于定位客戶需求——通過用戶畫像、情感分析等技術(shù)為用戶提供個性化內(nèi)容,或者對于智能對話系統(tǒng)與用戶進行交互。
隨著人工智能技術(shù)在新聞領(lǐng)域的參與程度越來越高,對于人工智能技術(shù)是否造成失業(yè)問題的爭論也愈演愈烈。牛津大學此前發(fā)布了一篇報告稱,目前47%的工作崗位將最終被自動化。但對此的批評意見認為,工作被取代,并不意味著勞動者將失去工作,正如曾經(jīng)汽車的出現(xiàn)取代了許許多多的馬車夫和馬童,但同時創(chuàng)造了更多修建高速公路和服務(wù)加油站的工作。
對于媒體領(lǐng)域來說同樣如此,機器人負責這項單調(diào)而又乏味的工作就能把記者們解放出來,讓他們追求一些需深度思考的報道,同時機器人也可以將消費者從海量信息中解放出來,提高他們獲取信息和知識的效果和效率,而這就是人工智能對媒體的最重要影響。不久的未來,我們將看到人工智能作為工具在新聞產(chǎn)業(yè)產(chǎn)出發(fā)揮重要的作用。