當(dāng)前位置: 首頁(yè)  >  熱點(diǎn)關(guān)注 > 正文

專家預(yù)言機(jī)器人20年內(nèi)競(jìng)逐普利策獎(jiǎng):對(duì)手?幫手?

來(lái)源:科技日?qǐng)?bào) 作者:李釗      2016-09-22

  寫(xiě)稿機(jī)器人: 我們的對(duì)手還是幫手?

  表述明確,文筆犀凌!未來(lái)的某天,一早翻看新聞的你,不禁贊嘆起某位記者的高水平。不過(guò)你心里也清楚,即便當(dāng)面聽(tīng)到,這位從不吃飯、睡覺(jué)的“作者”也不會(huì)說(shuō)聲謝謝。因?yàn)椤八保菣C(jī)器人。

  預(yù)言完畢,讓我們回到今天。奧運(yùn)會(huì)雖然結(jié)束了,但寫(xiě)稿機(jī)器人在新聞界所引發(fā)的震動(dòng),乃至恐懼,依然余音未消。有人預(yù)言,在不遠(yuǎn)的未來(lái),寫(xiě)稿機(jī)器人將徹底取代人力記者。

  那么,所有的媒體同行,以及看熱鬧的圍觀群眾,寫(xiě)稿機(jī)器人到底是我們的對(duì)手還是幫手呢?

  機(jī)器記者能拿普利策獎(jiǎng)

  人工智能注定將滲透到各個(gè)行業(yè),媒體業(yè)亦不能“幸免”。

  奧運(yùn)會(huì)期間,寫(xiě)稿機(jī)器人“張小明”通過(guò)直接對(duì)接奧組委的數(shù)據(jù)庫(kù)信息,實(shí)時(shí)撰寫(xiě)新聞稿件,以電視直播的速度發(fā)布稿件,主要報(bào)道了乒乓球、網(wǎng)球、羽毛球和女足的比賽,在16天的時(shí)間內(nèi)共發(fā)布456篇奧運(yùn)簡(jiǎn)訊和資訊,平均每條新聞生成到發(fā)布時(shí)間不到2秒鐘,為103萬(wàn)讀者提供了第一時(shí)間的賽事報(bào)道,單篇最高閱讀量超過(guò)11萬(wàn)。

  隨著自然語(yǔ)言處理、大數(shù)據(jù)計(jì)算等人工智能技術(shù)的發(fā)展,國(guó)內(nèi)外許多媒體已經(jīng)開(kāi)始了機(jī)器人報(bào)道的探索與實(shí)踐。以寫(xiě)稿機(jī)器人為代表的人工智能可讓大數(shù)據(jù)從負(fù)擔(dān)變成便利,重塑媒體的內(nèi)容生產(chǎn)和分散發(fā)布。

  美國(guó)《紐約時(shí)報(bào)》在財(cái)報(bào)季、運(yùn)動(dòng)比賽報(bào)道中用機(jī)器人寫(xiě)稿已成慣例,其數(shù)字部門(mén)開(kāi)發(fā)的機(jī)器人編輯Blossomblot每天推送300篇文章,受推薦文章的平均閱讀量是未推薦文章的38倍;美聯(lián)社在過(guò)去一年多時(shí)間里均使用Wordsmith系統(tǒng)編發(fā)企業(yè)財(cái)報(bào);國(guó)際文傳電訊社計(jì)劃用雅虎的機(jī)器人算法來(lái)發(fā)布美式橄欖球回顧式報(bào)道;成立于2007年的Automated Insights是一家有美聯(lián)社融資背景的科技公司,2015年寫(xiě)了150億篇文章,宣稱自己是世界上最大的內(nèi)容生產(chǎn)者;路透社也在嘗試發(fā)表機(jī)器撰寫(xiě)的文章,其負(fù)責(zé)人稱在一次盲測(cè)中,機(jī)器的作品表現(xiàn)得比人類作品更具可讀性……有專家預(yù)言,機(jī)器人將在20年內(nèi)競(jìng)逐普利策獎(jiǎng)。

  寫(xiě)稿機(jī)器人在國(guó)內(nèi)的發(fā)展也十分迅速。2015年9月,騰訊財(cái)經(jīng)一篇名為《8月CPI漲2%創(chuàng)12個(gè)月新高》的文章刷爆各大媒體頭條,其作者就是騰訊開(kāi)發(fā)的自動(dòng)化新聞寫(xiě)作機(jī)器人“Dreamwriter”。今年5月29日,四川綿陽(yáng)發(fā)生地震,一條題為《綿陽(yáng)安州發(fā)生4.3級(jí)地震》的新聞開(kāi)始流傳于網(wǎng)絡(luò),寫(xiě)下這篇560字的新聞稿件并第一時(shí)間發(fā)布在網(wǎng)絡(luò)上的正是國(guó)家地震臺(tái)網(wǎng)研發(fā)的智能機(jī)器人,且全程僅花了6秒鐘,可以說(shuō)幾乎跑贏了地震波的速度。

  人工智能發(fā)展的必然結(jié)果

  媒體領(lǐng)域遭遇機(jī)器人入侵,原因就在于自然識(shí)別和信息數(shù)據(jù)庫(kù)技術(shù)已經(jīng)達(dá)到了相當(dāng)成熟度,且這種成熟度是和新聞媒體的要求很好地匹配了起來(lái)。

  寫(xiě)稿機(jī)器人的背后是一個(gè)高度結(jié)構(gòu)化的海量信息網(wǎng),無(wú)論是文案、信息圖表或其他表達(dá)形式,機(jī)器人編輯都可以像音樂(lè)家擺弄音符一樣去重構(gòu)組裝。無(wú)論是天氣預(yù)報(bào)還是地震預(yù)警再到賽事報(bào)道等各種信息,都最終能夠放入到機(jī)器人數(shù)據(jù)庫(kù)中去,這樣的系統(tǒng)潛力巨大,可以構(gòu)建無(wú)限可能。

  北大計(jì)算機(jī)研究院教授萬(wàn)小軍告訴記者,寫(xiě)稿機(jī)器人實(shí)際上是一種數(shù)字技術(shù)和智能寫(xiě)稿編程系統(tǒng)。它用機(jī)器代替人完成實(shí)時(shí)監(jiān)控信息源,利用文本解析和信息抽取技術(shù)實(shí)現(xiàn)自動(dòng)信息抽取,采用機(jī)器學(xué)習(xí)算法并融合編輯記者團(tuán)隊(duì)的經(jīng)驗(yàn)和智慧,以模板和規(guī)則知識(shí)庫(kù)的方式,根據(jù)實(shí)時(shí)抽取的信息作出判斷,輸出相應(yīng)的模板及規(guī)則知識(shí)庫(kù)內(nèi)容,從而產(chǎn)生新聞,以此應(yīng)對(duì)海量、高速、多樣的大數(shù)據(jù)產(chǎn)生的信息。

  和傳統(tǒng)媒體人相比,寫(xiě)稿機(jī)器人可以瞬間完成海量閱讀、海量分析,尤其是針對(duì)上市公司的公告、財(cái)務(wù)報(bào)表、官方發(fā)布、社交平臺(tái)、證券行情等信息源。與此同時(shí),又可以根據(jù)互聯(lián)網(wǎng)活躍點(diǎn)擊量數(shù)據(jù),瞬時(shí)篩選出下一個(gè)熱點(diǎn)新聞,并通過(guò)后臺(tái)的算法快速合成新聞。整體上看來(lái),寫(xiě)稿機(jī)器人在速度和數(shù)量上有著不可忽視的絕對(duì)優(yōu)勢(shì)。

  依靠海量的大數(shù)據(jù)平臺(tái)和不斷演進(jìn)的算法設(shè)計(jì),生成一篇深度報(bào)道的時(shí)間已經(jīng)由最初的30秒縮短到2秒以內(nèi),其精度和準(zhǔn)確率還在不斷提升,而且擬人化、情感化的技能也在持續(xù)加強(qiáng)。

  “張小明”團(tuán)隊(duì)的技術(shù)總監(jiān)李磊說(shuō),近兩年的國(guó)際自然語(yǔ)言大會(huì)(ACL)給人感受最深的是,在自然語(yǔ)言處理和理解方面,機(jī)器深度學(xué)習(xí)的進(jìn)步非常之大,2016年幾乎超過(guò)2/3的論文在研究深度學(xué)習(xí)領(lǐng)域。雖然深度學(xué)習(xí)和自然語(yǔ)言處理在文本方面還沒(méi)有達(dá)到語(yǔ)音和圖像處理技術(shù)一樣的成熟度,但現(xiàn)在也已有了很大進(jìn)步。事實(shí)上,國(guó)外已經(jīng)出現(xiàn)了新一代智能寫(xiě)作軟件“Narrative”。

  “活人”記者依然是師傅

  當(dāng)然,純技術(shù)角度做新聞編輯報(bào)道還是存在一定局限性。萬(wàn)年進(jìn)化而成的人腦,絕非幾十歲的機(jī)器人能輕易代替。

  美國(guó)密蘇里大學(xué)教授唐納德·里諾茲曾表示,大多數(shù)自然語(yǔ)言系統(tǒng)都在簡(jiǎn)單描述一個(gè)事件,但大多數(shù)新聞都是描繪性的,甚至是事件驅(qū)動(dòng)型的。人工智能系統(tǒng)在進(jìn)行新聞創(chuàng)作時(shí)需要解決海量技術(shù)難題,包括自然語(yǔ)言處理中的自動(dòng)摘要、文本分類等,還有知識(shí)庫(kù)和知識(shí)發(fā)現(xiàn)(KDD)等相關(guān)技術(shù),比如實(shí)體定義、關(guān)系抽取、問(wèn)答系統(tǒng)等。簡(jiǎn)單來(lái)說(shuō),就是機(jī)器首先需要理解自然語(yǔ)言,然后通過(guò)知識(shí)管理弄明白新聞中各個(gè)要素之間的關(guān)系。

  有問(wèn)題,就有答案。谷歌開(kāi)源了SyntaxNet,將神經(jīng)網(wǎng)絡(luò)和搜索技術(shù)結(jié)合起來(lái),在解決歧義問(wèn)題上取得顯著進(jìn)展,該軟件能像訓(xùn)練有素的語(yǔ)言學(xué)家一樣分析簡(jiǎn)單句法;Facebook推出了文本理解引擎DeepText,每秒能理解幾千篇博文內(nèi)容,語(yǔ)言種類多達(dá)20多種,準(zhǔn)確度接近人類水平。

  今年6月,人工智能創(chuàng)業(yè)公司Maluuba公司發(fā)表了一篇關(guān)于機(jī)器理解的論文,提出了目前最先進(jìn)的機(jī)器閱讀理解系統(tǒng)EpiReader,該模型在CNN和童書(shū)測(cè)試(CBT)兩個(gè)數(shù)據(jù)集上的成績(jī)都超過(guò)了谷歌DeepMind、Facebook和IBM。EpiReader采取兩個(gè)步驟來(lái)確定問(wèn)題答案。第一步(Extractor),使用了一個(gè)雙向GPU逐字閱讀故事和問(wèn)題,接著采用一種類似Pointer Network中的Attention機(jī)制在故事中挑選出可能作為答案?jìng)溥x的單詞。第二步(Reasoner),這些備選答案被插入(完型填空)式的問(wèn)題中,構(gòu)成一些“假設(shè)”,接著卷積神經(jīng)網(wǎng)絡(luò)會(huì)將每個(gè)假設(shè)與故事中的每個(gè)句子加以比較,尋找文本蘊(yùn)涵(Textual Entailment)關(guān)系。簡(jiǎn)單來(lái)說(shuō),蘊(yùn)涵是指,兩個(gè)陳述具有很強(qiáng)的相關(guān)性。因此,最近似故事假設(shè)的蘊(yùn)涵得分最高。最后,將蘊(yùn)涵得分與第一步得到的分?jǐn)?shù)相結(jié)合,給出每一個(gè)備選答案正確的概率。

  萬(wàn)小軍教授說(shuō),記者聯(lián)系采訪對(duì)象,觀察對(duì)方,用心去感受人物,再對(duì)大量資料進(jìn)行整理,做出取舍,對(duì)這些復(fù)雜細(xì)致的情感工作,目前人工智能機(jī)器人用深度學(xué)習(xí)的算法尚不能搞定。由于目前的技術(shù)制約,寫(xiě)稿機(jī)器人還無(wú)法開(kāi)展自行思考,智能寫(xiě)稿系統(tǒng)在稿件的深度以及稿件個(gè)性化上很難在短時(shí)間內(nèi)取得突破。從這個(gè)意義上講,寫(xiě)稿機(jī)器人為傳統(tǒng)記者節(jié)省了大量查閱資料的檢索時(shí)間,有助于人力記者寫(xiě)出更有深度和富含情感的新聞作品。新聞的字里行間包含著記者的判斷、價(jià)值觀與人文關(guān)懷,未來(lái)新聞人應(yīng)該把精力重點(diǎn)放在機(jī)器人無(wú)法完成的調(diào)查性、深度解釋性報(bào)道上,這樣雙方才可以真正實(shí)現(xiàn)互相補(bǔ)充、相得益彰。

  李磊說(shuō),新聞機(jī)器人并不會(huì)取代記者,相反會(huì)成為記者的好幫手。機(jī)器人寫(xiě)稿將大大提高記者產(chǎn)出新聞的數(shù)量和速度,節(jié)省媒體的時(shí)間成本和運(yùn)營(yíng)成本,提升媒體運(yùn)營(yíng)的成本收益率。用戶的閱讀興趣呈長(zhǎng)尾分布,單篇閱讀量高的新聞可以由人力記者來(lái)寫(xiě),但是更大量的單篇閱讀量稍低的新聞同樣很有價(jià)值,由人來(lái)寫(xiě)則收益率并不高,而請(qǐng)機(jī)器人來(lái)寫(xiě)既能彌補(bǔ)這部分閱讀需求,又能降低新聞采編的成本,可謂一舉多得。

  ——記者觀察——

  有了“他”們會(huì)更好

  撰寫(xiě)這篇稿件時(shí),我始終無(wú)法不去想這樣一個(gè)問(wèn)題:寫(xiě)稿機(jī)器人來(lái)了,自己會(huì)不會(huì)失業(yè)呢?

  當(dāng)然,目前還不至于。對(duì)于媒體,內(nèi)容是王道,沒(méi)有深度的媒體人可能會(huì)被寫(xiě)稿機(jī)器人淘汰,而能做出好內(nèi)容的深度報(bào)道記者則不會(huì)。

  人工智能要想達(dá)到替代人類的水平,需要好幾個(gè)階段的演化。第一階段首先是在各個(gè)垂直領(lǐng)域誕生若干超級(jí)智能,比如健康和知識(shí)問(wèn)答領(lǐng)域的“沃森”、圍棋領(lǐng)域的“AlphaGo”等。這些垂直超級(jí)智能可以在特定領(lǐng)域內(nèi)展現(xiàn)出遠(yuǎn)超人類的能力,但是在擅長(zhǎng)領(lǐng)域之外沒(méi)有任何作為。不過(guò),他們將為誕生在所有領(lǐng)域內(nèi)具備超人能力的終極智能打下初步基礎(chǔ)。

  知識(shí)改變命運(yùn),技術(shù)改變世界。相信在以寫(xiě)稿機(jī)器人為代表的人工智能技術(shù)引領(lǐng)下,全球終將步入一個(gè)全新的信息技術(shù)時(shí)代。憑借不斷進(jìn)步的技術(shù)的力量和更多的試驗(yàn)、更早的調(diào)整及更好的準(zhǔn)備,人類將會(huì)建設(shè)出一個(gè)更加智能化的美好世界。

【責(zé)任編輯:天亮】

掃一掃關(guān)注北疆風(fēng)韻微信公眾號(hào)

微信