關(guān)于大數(shù)據(jù)對新聞生產(chǎn)的影響,過去我們關(guān)注怎么樣用大數(shù)據(jù)對用戶行為進(jìn)行分析,對他們進(jìn)行個(gè)性化的服務(wù),或者用大數(shù)據(jù)進(jìn)行市場分析調(diào)查。但是我們目前有這樣一個(gè)未被給予太多關(guān)注的環(huán)節(jié),就是大數(shù)據(jù)對于新聞報(bào)道本身的影響,新聞中一些不管是事實(shí)還是相關(guān)要素等資源,會(huì)在大數(shù)據(jù)當(dāng)中發(fā)生什么樣的變化?
過去所有的新聞都是由專業(yè)媒體人員生產(chǎn)的,在大數(shù)據(jù)時(shí)代,未來新聞是不是一定由人或者全部一定由人來生產(chǎn)呢?當(dāng)物聯(lián)網(wǎng)和大數(shù)據(jù)結(jié)合在一起的時(shí)候,這個(gè)答案是否定的。
物聯(lián)網(wǎng)數(shù)據(jù)所帶來的變革,可以使所有的物體都自己開口說話,這不僅僅對我們的健康監(jiān)測會(huì)產(chǎn)生這樣的作用,同時(shí)這些信息可能會(huì)轉(zhuǎn)化為新聞生產(chǎn)的信息。過去新聞專業(yè)信息的采集主要是由專業(yè)媒體進(jìn)行,但是將來所有的用戶都將會(huì)參與到這個(gè)環(huán)節(jié)中,所有可能的物體,你只要愿意,你就可以在物體身上提取數(shù)據(jù)來為你的內(nèi)容服務(wù)。物聯(lián)網(wǎng)的基礎(chǔ)是有一個(gè)傳感器,當(dāng)傳感器變成一個(gè)信息的產(chǎn)業(yè)終端時(shí),可能會(huì)帶來一種所謂的傳感新聞?,F(xiàn)在有專門的互聯(lián)網(wǎng)分享信息平臺(tái),未來這些平臺(tái)也會(huì)成為大數(shù)據(jù)的來源。
從預(yù)測信息的角度來說,傳感器在采集一些我們重點(diǎn)觀察不到的,或者憑我們個(gè)別的記者眼睛觀察不到的,更廣泛、深層的領(lǐng)域,在新聞和其他信息的傳播效果測量方面,傳感器的功能也將日益得到開發(fā)。針對地理位置或者是今天某一個(gè)個(gè)體的傳感器可以幫助我們做到個(gè)性化服務(wù),實(shí)際上今天我們手機(jī)上的一些設(shè)備也是早期的一個(gè)開拓者。我們不僅僅依靠幾個(gè)記者敏銳的頭腦觀察能力了,我們更需要物聯(lián)網(wǎng)相關(guān)傳感器的合作。
南京大學(xué)的一個(gè)傳媒學(xué)院,在前不久啟動(dòng)了一個(gè)非常有意思的實(shí)驗(yàn),在觀眾身上放了一些傳感器,測試他看戲劇知道他的情緒,他的興奮點(diǎn)在什么地方,這就是所謂的機(jī)器人新聞。
他們做的一個(gè)叫Narrative Science的軟件(下文有介紹),讓很多美國的媒體很關(guān)注。這個(gè)軟件已經(jīng)開始和我們很多記者日常所做的工作在既定,他們不僅僅是做用戶工作做收集,甚至把這些數(shù)據(jù)自動(dòng)的放到一個(gè)一個(gè)的模塊里面。比如說,看比賽的時(shí)候很多人都會(huì)拿出手機(jī)來發(fā)比賽信息,這些比賽的消息,被Narrative Science收集起來后,就可以知道這場比賽的過程怎樣,比分如何,把這些數(shù)據(jù)放到關(guān)于比賽的模板中,同時(shí)讓媒體和觀眾參與,像城市化程度很高的新聞就可以由一個(gè)機(jī)器人來完成。他們公司一位負(fù)責(zé)人介紹,這樣的新聞在未來可能90%的新聞都是由他們的新聞來完成。首先收集數(shù)據(jù),然后到了下一個(gè)環(huán)節(jié),像人寫新聞一樣去尋找特定的或者比較有新意的角度,再根據(jù)收集到的消息去設(shè)計(jì)結(jié)構(gòu),之后變成一條一條的新聞。我們不敢確定在機(jī)器人新聞是不是會(huì)在將來打破人寫的新聞,從理論上來說,在龐大的數(shù)據(jù)面前,人類越來越依賴機(jī)器的時(shí)候,實(shí)際上新聞的寫作,僅依靠數(shù)據(jù)已經(jīng)完成了70、80%,所以說新聞?dòng)蓹C(jī)器來形成也不是不可能的。不管是誰寫的新聞,只要提供足夠的事實(shí)足夠的觀察,受眾是可以接受的。
大數(shù)據(jù)和媒體是有兩個(gè)相應(yīng)的方面,不管是傳感器也好或是機(jī)器人也好,都是一個(gè)科學(xué)概念,現(xiàn)今只存在一些實(shí)驗(yàn),不論這些實(shí)驗(yàn)會(huì)不會(huì)成功,至少這些實(shí)驗(yàn)的方向,對我們媒體有啟發(fā)和借鑒。從另外一個(gè)意義上來說,在未來的媒體推廣中,人將處于媒體新聞生產(chǎn)中怎樣的位置是未可知的,我們需要調(diào)整我們的思路和技術(shù)手段,同時(shí)也需要有更多的對外合作。
不管怎么樣,未來大數(shù)據(jù)在我們新聞生活中間所扮演的角色一定越來越重要,但并不是說大數(shù)據(jù)進(jìn)入到這個(gè)領(lǐng)域我們一定要接受它或者我們沒有辦法阻止數(shù)據(jù)被采集,數(shù)據(jù)采集合法性是非常重要的前提,未來怎么樣保證數(shù)據(jù)的隱私,保證數(shù)據(jù)采集的合法性,是保證大數(shù)據(jù)的一個(gè)前提。
在這樣的時(shí)代,我們面臨的挑戰(zhàn)是非常多元的,雖然不是說技術(shù)至上,但是技術(shù)是我們今天做一切新媒體的基礎(chǔ)。
人工智能技術(shù)或許比我們大多數(shù)人想象中來得更快。
如果說 Siri 企圖在信息輸入上有所突破,那么 Narrative Science 的努力方向就是更加擬人化的“輸出”。過去,計(jì)算機(jī)“寫作”技術(shù)只停留在利用龐大文本庫所進(jìn)行的簡單拼湊。因此,生成的結(jié)果當(dāng)然不盡如人意。
西北大學(xué)教授 Kristian Hammond 聯(lián)手前 Double Click 管理團(tuán)隊(duì)的成員,Stuart Frankel 和西北大學(xué)計(jì)算機(jī)系和新聞系的精英們花費(fèi)了兩年時(shí)間在2010年共同研發(fā)出了新一代的智能寫作軟件 Narrative Science,將新聞報(bào)道和電腦工程進(jìn)行了一次新世代的結(jié)合。
這個(gè)在學(xué)校實(shí)驗(yàn)室代號(hào)為“Stats Monkey”的項(xiàng)目,通過對給定主題的數(shù)據(jù)分析,會(huì)自動(dòng)選擇合適的寫作角度,快速“寫就”一篇具有標(biāo)準(zhǔn)新聞報(bào)道結(jié)構(gòu)的文章。神奇的是,程序甚至可以根據(jù)不同的出版社特點(diǎn)用不同的行文風(fēng)格“寫作”。Narrative Science 最初被應(yīng)用在即時(shí)報(bào)道西北大學(xué)棒球和壘球的比賽中。自此以后,Narrative Science 也被應(yīng)用在財(cái)經(jīng)報(bào)道等領(lǐng)域,包括 Forbes 等網(wǎng)站都已經(jīng)開始與 Narrative Science 建立了合作伙伴關(guān)系。
Hammond 教授認(rèn)為 Narrative Science 的特別之處就在于滿足了人們傾向讀故事的心理。在此之前,雖然計(jì)算機(jī)已經(jīng)擁有了強(qiáng)大的運(yùn)算能力,可以圖形化復(fù)雜的數(shù)據(jù),卻依然不能根據(jù)數(shù)據(jù)以自然語言輸出成一篇人性化的文章。而Narrative Science 就是為解決這個(gè)問題而設(shè)計(jì)的。當(dāng)前,該程序的寫作表現(xiàn)足以達(dá)到一位八年級(jí)學(xué)生的寫作水平。
隨著技術(shù)的持續(xù)完善,有業(yè)界專家大膽預(yù)測,類似計(jì)算機(jī)記者將在未來二十年內(nèi)成為普利策(Pulitzer)新聞獎(jiǎng)的有力競爭者。雖然 Hammond 教授始終在強(qiáng)調(diào) Narrative Science 是在真正地進(jìn)行“創(chuàng)作(Composition)” 而非生搬硬套,仍有相當(dāng)部分人對此技術(shù)持保留態(tài)度。在這群人中(相當(dāng)一部分是記者),主要認(rèn)為再先進(jìn)的計(jì)算機(jī)算法始終也無法模仿人類的感性流露,這項(xiàng)技術(shù)最終只能生成低質(zhì)量的數(shù)據(jù)報(bào)告式的文章。
同時(shí),自動(dòng)化寫作也讓諸如 Google 等在線搜索公司產(chǎn)生隱憂。如果程序已經(jīng)能自動(dòng)生成如此高質(zhì)量的“擬人化”文章,那么辨別在線垃圾內(nèi)容的任務(wù)將會(huì)變得異常艱巨。華盛頓大學(xué)人工智能的專家 Oren Etzioni 在談及這個(gè)問題時(shí),毫無掩飾地將 NarrativeScience 比作數(shù)字化裝備競賽中的核武器。而 Narrative Science 則表示,他們不會(huì)將此技術(shù)轉(zhuǎn)讓/部署到這些網(wǎng)站中。