當前位置: 首頁  >  熱點關注 > 正文

專家預言機器人20年內競逐普利策獎:對手?幫手?

來源:科技日報 作者:李釗      2016-09-22

  寫稿機器人: 我們的對手還是幫手?

  表述明確,文筆犀凌!未來的某天,一早翻看新聞的你,不禁贊嘆起某位記者的高水平。不過你心里也清楚,即便當面聽到,這位從不吃飯、睡覺的“作者”也不會說聲謝謝。因為“他”,是機器人。

  預言完畢,讓我們回到今天。奧運會雖然結束了,但寫稿機器人在新聞界所引發(fā)的震動,乃至恐懼,依然余音未消。有人預言,在不遠的未來,寫稿機器人將徹底取代人力記者。

  那么,所有的媒體同行,以及看熱鬧的圍觀群眾,寫稿機器人到底是我們的對手還是幫手呢?

  機器記者能拿普利策獎

  人工智能注定將滲透到各個行業(yè),媒體業(yè)亦不能“幸免”。

  奧運會期間,寫稿機器人“張小明”通過直接對接奧組委的數(shù)據(jù)庫信息,實時撰寫新聞稿件,以電視直播的速度發(fā)布稿件,主要報道了乒乓球、網(wǎng)球、羽毛球和女足的比賽,在16天的時間內共發(fā)布456篇奧運簡訊和資訊,平均每條新聞生成到發(fā)布時間不到2秒鐘,為103萬讀者提供了第一時間的賽事報道,單篇最高閱讀量超過11萬。

  隨著自然語言處理、大數(shù)據(jù)計算等人工智能技術的發(fā)展,國內外許多媒體已經(jīng)開始了機器人報道的探索與實踐。以寫稿機器人為代表的人工智能可讓大數(shù)據(jù)從負擔變成便利,重塑媒體的內容生產(chǎn)和分散發(fā)布。

  美國《紐約時報》在財報季、運動比賽報道中用機器人寫稿已成慣例,其數(shù)字部門開發(fā)的機器人編輯Blossomblot每天推送300篇文章,受推薦文章的平均閱讀量是未推薦文章的38倍;美聯(lián)社在過去一年多時間里均使用Wordsmith系統(tǒng)編發(fā)企業(yè)財報;國際文傳電訊社計劃用雅虎的機器人算法來發(fā)布美式橄欖球回顧式報道;成立于2007年的Automated Insights是一家有美聯(lián)社融資背景的科技公司,2015年寫了150億篇文章,宣稱自己是世界上最大的內容生產(chǎn)者;路透社也在嘗試發(fā)表機器撰寫的文章,其負責人稱在一次盲測中,機器的作品表現(xiàn)得比人類作品更具可讀性……有專家預言,機器人將在20年內競逐普利策獎。

  寫稿機器人在國內的發(fā)展也十分迅速。2015年9月,騰訊財經(jīng)一篇名為《8月CPI漲2%創(chuàng)12個月新高》的文章刷爆各大媒體頭條,其作者就是騰訊開發(fā)的自動化新聞寫作機器人“Dreamwriter”。今年5月29日,四川綿陽發(fā)生地震,一條題為《綿陽安州發(fā)生4.3級地震》的新聞開始流傳于網(wǎng)絡,寫下這篇560字的新聞稿件并第一時間發(fā)布在網(wǎng)絡上的正是國家地震臺網(wǎng)研發(fā)的智能機器人,且全程僅花了6秒鐘,可以說幾乎跑贏了地震波的速度。

  人工智能發(fā)展的必然結果

  媒體領域遭遇機器人入侵,原因就在于自然識別和信息數(shù)據(jù)庫技術已經(jīng)達到了相當成熟度,且這種成熟度是和新聞媒體的要求很好地匹配了起來。

  寫稿機器人的背后是一個高度結構化的海量信息網(wǎng),無論是文案、信息圖表或其他表達形式,機器人編輯都可以像音樂家擺弄音符一樣去重構組裝。無論是天氣預報還是地震預警再到賽事報道等各種信息,都最終能夠放入到機器人數(shù)據(jù)庫中去,這樣的系統(tǒng)潛力巨大,可以構建無限可能。

  北大計算機研究院教授萬小軍告訴記者,寫稿機器人實際上是一種數(shù)字技術和智能寫稿編程系統(tǒng)。它用機器代替人完成實時監(jiān)控信息源,利用文本解析和信息抽取技術實現(xiàn)自動信息抽取,采用機器學習算法并融合編輯記者團隊的經(jīng)驗和智慧,以模板和規(guī)則知識庫的方式,根據(jù)實時抽取的信息作出判斷,輸出相應的模板及規(guī)則知識庫內容,從而產(chǎn)生新聞,以此應對海量、高速、多樣的大數(shù)據(jù)產(chǎn)生的信息。

  和傳統(tǒng)媒體人相比,寫稿機器人可以瞬間完成海量閱讀、海量分析,尤其是針對上市公司的公告、財務報表、官方發(fā)布、社交平臺、證券行情等信息源。與此同時,又可以根據(jù)互聯(lián)網(wǎng)活躍點擊量數(shù)據(jù),瞬時篩選出下一個熱點新聞,并通過后臺的算法快速合成新聞。整體上看來,寫稿機器人在速度和數(shù)量上有著不可忽視的絕對優(yōu)勢。

  依靠海量的大數(shù)據(jù)平臺和不斷演進的算法設計,生成一篇深度報道的時間已經(jīng)由最初的30秒縮短到2秒以內,其精度和準確率還在不斷提升,而且擬人化、情感化的技能也在持續(xù)加強。

  “張小明”團隊的技術總監(jiān)李磊說,近兩年的國際自然語言大會(ACL)給人感受最深的是,在自然語言處理和理解方面,機器深度學習的進步非常之大,2016年幾乎超過2/3的論文在研究深度學習領域。雖然深度學習和自然語言處理在文本方面還沒有達到語音和圖像處理技術一樣的成熟度,但現(xiàn)在也已有了很大進步。事實上,國外已經(jīng)出現(xiàn)了新一代智能寫作軟件“Narrative”。

  “活人”記者依然是師傅

  當然,純技術角度做新聞編輯報道還是存在一定局限性。萬年進化而成的人腦,絕非幾十歲的機器人能輕易代替。

  美國密蘇里大學教授唐納德·里諾茲曾表示,大多數(shù)自然語言系統(tǒng)都在簡單描述一個事件,但大多數(shù)新聞都是描繪性的,甚至是事件驅動型的。人工智能系統(tǒng)在進行新聞創(chuàng)作時需要解決海量技術難題,包括自然語言處理中的自動摘要、文本分類等,還有知識庫和知識發(fā)現(xiàn)(KDD)等相關技術,比如實體定義、關系抽取、問答系統(tǒng)等。簡單來說,就是機器首先需要理解自然語言,然后通過知識管理弄明白新聞中各個要素之間的關系。

  有問題,就有答案。谷歌開源了SyntaxNet,將神經(jīng)網(wǎng)絡和搜索技術結合起來,在解決歧義問題上取得顯著進展,該軟件能像訓練有素的語言學家一樣分析簡單句法;Facebook推出了文本理解引擎DeepText,每秒能理解幾千篇博文內容,語言種類多達20多種,準確度接近人類水平。

  今年6月,人工智能創(chuàng)業(yè)公司Maluuba公司發(fā)表了一篇關于機器理解的論文,提出了目前最先進的機器閱讀理解系統(tǒng)EpiReader,該模型在CNN和童書測試(CBT)兩個數(shù)據(jù)集上的成績都超過了谷歌DeepMind、Facebook和IBM。EpiReader采取兩個步驟來確定問題答案。第一步(Extractor),使用了一個雙向GPU逐字閱讀故事和問題,接著采用一種類似Pointer Network中的Attention機制在故事中挑選出可能作為答案備選的單詞。第二步(Reasoner),這些備選答案被插入(完型填空)式的問題中,構成一些“假設”,接著卷積神經(jīng)網(wǎng)絡會將每個假設與故事中的每個句子加以比較,尋找文本蘊涵(Textual Entailment)關系。簡單來說,蘊涵是指,兩個陳述具有很強的相關性。因此,最近似故事假設的蘊涵得分最高。最后,將蘊涵得分與第一步得到的分數(shù)相結合,給出每一個備選答案正確的概率。

  萬小軍教授說,記者聯(lián)系采訪對象,觀察對方,用心去感受人物,再對大量資料進行整理,做出取舍,對這些復雜細致的情感工作,目前人工智能機器人用深度學習的算法尚不能搞定。由于目前的技術制約,寫稿機器人還無法開展自行思考,智能寫稿系統(tǒng)在稿件的深度以及稿件個性化上很難在短時間內取得突破。從這個意義上講,寫稿機器人為傳統(tǒng)記者節(jié)省了大量查閱資料的檢索時間,有助于人力記者寫出更有深度和富含情感的新聞作品。新聞的字里行間包含著記者的判斷、價值觀與人文關懷,未來新聞人應該把精力重點放在機器人無法完成的調查性、深度解釋性報道上,這樣雙方才可以真正實現(xiàn)互相補充、相得益彰。

  李磊說,新聞機器人并不會取代記者,相反會成為記者的好幫手。機器人寫稿將大大提高記者產(chǎn)出新聞的數(shù)量和速度,節(jié)省媒體的時間成本和運營成本,提升媒體運營的成本收益率。用戶的閱讀興趣呈長尾分布,單篇閱讀量高的新聞可以由人力記者來寫,但是更大量的單篇閱讀量稍低的新聞同樣很有價值,由人來寫則收益率并不高,而請機器人來寫既能彌補這部分閱讀需求,又能降低新聞采編的成本,可謂一舉多得。

  ——記者觀察——

  有了“他”們會更好

  撰寫這篇稿件時,我始終無法不去想這樣一個問題:寫稿機器人來了,自己會不會失業(yè)呢?

  當然,目前還不至于。對于媒體,內容是王道,沒有深度的媒體人可能會被寫稿機器人淘汰,而能做出好內容的深度報道記者則不會。

  人工智能要想達到替代人類的水平,需要好幾個階段的演化。第一階段首先是在各個垂直領域誕生若干超級智能,比如健康和知識問答領域的“沃森”、圍棋領域的“AlphaGo”等。這些垂直超級智能可以在特定領域內展現(xiàn)出遠超人類的能力,但是在擅長領域之外沒有任何作為。不過,他們將為誕生在所有領域內具備超人能力的終極智能打下初步基礎。

  知識改變命運,技術改變世界。相信在以寫稿機器人為代表的人工智能技術引領下,全球終將步入一個全新的信息技術時代。憑借不斷進步的技術的力量和更多的試驗、更早的調整及更好的準備,人類將會建設出一個更加智能化的美好世界。

【責任編輯:天亮】

掃一掃關注北疆風韻微信公眾號

微信