本報與第一財經(jīng)頭腦風暴節(jié)目合作探討大數(shù)據(jù)時代下的問題。參與這次討論的嘉賓有大數(shù)據(jù)概念的提出者、牛津大學教授維克托·邁爾·舍恩伯格,微軟亞太研發(fā)集團、云計算操作系統(tǒng)首席架構(gòu)師徐明強,上海市信息化專家、專業(yè)委員會專家、復旦大學計算機學院院長王曉陽,科爾尼管理咨詢?nèi)蚝匣锶藢O健,復旦大學現(xiàn)代哲學研究所所長俞吾金,啟明創(chuàng)投合伙人童士豪,著名財經(jīng)評論員石述思。
1 到底什么是大數(shù)據(jù)?
維克托:我認為它就是新黃金,我覺得是21世紀最主要的資源,這種資源對社會、企業(yè)、個人是否能成功,還是會受苦受難有著很重要的作用。解釋一下,雖然此前我們都有數(shù)據(jù),可把它們整理在一起然后分析是非常昂貴的,因此我們更多的注意力都放在了實體資源上,就是真正的黃金、金塊,像勞動力這種資源。但只有最近我們才靠人的知識、創(chuàng)新來創(chuàng)造財富,更靠前一步,我們可以根據(jù)數(shù)據(jù)來進行,因為數(shù)據(jù)收集以及分析,成本上升的程度都已經(jīng)改變了,然后我們的數(shù)據(jù)就可以達到一定規(guī)模。最后,大家所尋求的不管你是一個人、一個公司、一個組織,還是這個社會,無外乎就是這種所謂的新黃金。
為什么最近黃金的價值會跌得很厲害?因為老黃金不值錢了,沒有新黃金有價值。
童士豪:我的觀點有點類似,第一個是云,第二個是關(guān)系,第三個是未來。像剛才維克托先生提到的,因為云時代到了,儲存的大量數(shù)據(jù)的成本非常低,所以能讓大家去利用大數(shù)據(jù)做工作分析,最近由于很多事情的關(guān)系,有更多的關(guān)系被理解,所以能去預(yù)測未來狀況。用自己的話說,就是在聆聽上花很多時間,看了很多朋友,大家尋找工作機會也好或者是認識對工作有幫助的合作伙伴也好,在這么大的信息里,這么多人把他自己的信息放在上面,就是做了一件事,就是分析。如果你40歲想當創(chuàng)意公司的CEO,你現(xiàn)在20歲,未來20年該怎么規(guī)劃?這就是非常有意思的一件事。
最后可能有不同的可能性,最后會不會給你找到一個最好的方法,那是自己決定的。可能性放在面前,是機會率最高的,怎么選還是個人決定,所以大數(shù)據(jù)并沒有抹殺個人的意識。
石述思:大數(shù)據(jù)首先改變的是我們看待世界的方法,它會對這個時代的很多的價值觀產(chǎn)生劇烈沖擊。舉例來說,因為過去我們東方人特別喜歡一個詞叫因果,我們認為善有善報、惡有惡報,其實根據(jù)交管部門調(diào)查的數(shù)據(jù),在街頭遭遇橫禍的人其實跟道德無關(guān),秦檜的壽命是岳飛的兩倍半,很多貪官在發(fā)現(xiàn)之前,那過的確實是令人無限羨慕的生活。因此,通過大數(shù)據(jù)我們能用一種全新的觀念來看待這個世界,這個世界是有關(guān)聯(lián)來建構(gòu)的一個新型的關(guān)系,只有科技發(fā)展到一定水平,才能達到這樣的高度。
與此同時,在大數(shù)據(jù)時代,我們該恪守的底線還是要恪守,但它的確在告訴我們真相,因為科學就是在告訴我們真相。我有一個愿望,就是剛才講的大數(shù)據(jù)是新的黃金,我希望它更多地用于社會公益事業(yè),比如,去挽救地震局。這樣能避免很多人道主義的災(zāi)難和財產(chǎn)的損失,結(jié)論是我們過去認為上帝是哲學家或者叫哲人,現(xiàn)在發(fā)現(xiàn)他老人家是個老頑童。
2 大數(shù)據(jù)究竟有沒有對各領(lǐng)域的工作和生活產(chǎn)生影響?
王曉陽:大數(shù)據(jù)影響了智慧。怎么理解呢?大數(shù)據(jù)本身的概念是數(shù)據(jù)采集和處理,到了一定的程度使我們的社會也好,管理者也好,都能獲益——從城市來講,一個管理者可以聚集這些數(shù)據(jù)和處理方式,使得我們能用智慧來管理城市,可以從交通管理、公共衛(wèi)生,還有其他各個方面來管理,這管理是需要數(shù)據(jù),數(shù)據(jù)產(chǎn)生了智慧,然后反過頭來能管理我們的模式。
比如,在公共衛(wèi)生方面,采集數(shù)據(jù)到了目前為止其實已經(jīng)進行了好多年,它的數(shù)據(jù)采集原來并不是為了大數(shù)據(jù)來做的,其實是為了一個方便——方便大家去看病。而且你的電子病例等,讓你看病更人性化,或者對醫(yī)生來講能更快、更方便地去熟悉病情,但在這種情況下,這個數(shù)據(jù)一旦采集起來使得我們對整個城市的健康狀況就能進一步了解,所以,剛才講的看病的數(shù)據(jù)其實是原本的用意,大數(shù)據(jù)一來其實我們就能看見原來看不見的問題。比如一些比較大趨勢方面的問題,流行病在哪個地方比較多,或者它怎樣流傳的,等等。這些事情我們原來是看不到的,這種情況就是大數(shù)據(jù)對我們的幫助。
徐明強:先舉個例子,有一個球和一只螞蟻,球跟螞蟻說,做三維世界的事物太好了,你看這條線上有多少個螞蟻我一眼就看見了,螞蟻說我真的不信,我得按照這條線爬,爬到頭計數(shù)器沒有出故障我才知道有多少螞蟻。這能看到三維和二維差了一維,就差了這么大,所以大數(shù)據(jù)首先它不是數(shù)據(jù)大,不是同樣的數(shù)據(jù)多了就變成大數(shù)據(jù),而是在原有的二維、原有的數(shù)據(jù)庫基礎(chǔ)上,再建立一維,給它一個全新的看點。舉例說明,你如果在美國,你是欠了債的,除了債主對你感興趣,還有人會對你感興趣——如果你欠了債,突然你可以還債了,那么銀行會對你感興趣。在11年前,美國資本一號就發(fā)明了一種大數(shù)據(jù)的應(yīng)用,它可以找到哪些人是欠了銀行的錢、欠了信用卡的錢,然后它就會觀察你的消費數(shù)據(jù),當它發(fā)現(xiàn)你可以開始還的時候,他立刻把你再買過來,從此以后他就吃上了你的利息。資本一號這個公司在2001年時,每個季度的增長率是20%,就是因為它大數(shù)據(jù)的程序,它可以高命中率地發(fā)現(xiàn)這個,它是從哪里找來的數(shù)據(jù)呢?從沃爾瑪、從各種各樣的消費數(shù)據(jù)中找到的。從這個實例我們可以看出,大數(shù)據(jù)這個原有的數(shù)據(jù)分析商務(wù)智能上加了一層,商務(wù)智能不能告訴我們別人將要并且能做什么。
關(guān)于我們公司對奧斯卡頒獎的預(yù)測,除了對李安的預(yù)測沒對,其他都對了。其實,我們的預(yù)測是把所有人員都做了一個概率,所以做了19個預(yù)測對的,是我們放在第一概率的獲獎人,下面還有4個是第二概率,所以李安導演我們放在第二概率,我們把他放在后面。
這個預(yù)測跟大數(shù)據(jù)很有關(guān)系,首先做大數(shù)據(jù)需要有IQ,智商,就是說,這個模型要非常好。我們公司做IQ的人叫加戴維·羅斯查爾德,是我們研究部門的一個人。還有其他人,我要講講,他這個人的IQ有什么差別?他這個人的IQ用了一個非常簡單聚合的模式,除了IQ還有什么呢?智商以后還要有勤商,勤奮的勤。勤商就是說,他非常勤奮地去找數(shù)據(jù),要找多種數(shù)據(jù),還要找非常實際的數(shù)據(jù),所以他在網(wǎng)上、社交網(wǎng)上都有找。有一些找不到的數(shù)據(jù),怎么辦?他找人做調(diào)查,然后找人來做,所以他又有智商,又有勤商,夠不夠呢?還不夠,五年前這種事情做不到,為什么?五年前他要做這樣大量的數(shù)據(jù)的話,自己作為一個研究生的小預(yù)算是做不到的,但云計算的出現(xiàn),他就可以做到了??梢匝由爝@些數(shù)據(jù),用很多處理器來處理,現(xiàn)在他就是用了云做這樣一個計算,最后成功了。
孫?。何覍懙氖菣C會加危險,就是危機。我同意維克托的結(jié)論,說這是一個新的金礦,或者有說法叫新的機會,但不要忘記那同時會帶來很多危險。如果我們不能很好地去處理大數(shù)據(jù)的話,特別是像在我們?nèi)粘9ぷ髦薪佑|到的很多中國企業(yè),它們大多數(shù)甚至在最基礎(chǔ)的數(shù)據(jù)分析方面還比較落后,這就意味著,我們該怎樣很快地過渡到大數(shù)據(jù)時代去,去面對大數(shù)據(jù)挑戰(zhàn),如果準備不好,那我很擔心,這會像以往很多新技術(shù)來了以后的情況,很容易造成很多企業(yè)邯鄲學步——連走路都還沒學會,就要學跳,一下子邁到大數(shù)據(jù)時代,企業(yè)不知道怎樣真正地讓大數(shù)據(jù)發(fā)揮作用。
在我們的行業(yè)里,因為大數(shù)據(jù)而做了很多產(chǎn)品創(chuàng)新。談到大數(shù)據(jù)時代的破壞型創(chuàng)新,實際上也是談了同樣的問題,因為在創(chuàng)新的同時,事實上要推導、顛覆原來的很多東西,包括我們咨詢行業(yè)的很多服務(wù)和產(chǎn)品都要做更新,也要跟上時代。比如,我們有一家很大的全球性零售企業(yè),它每天要處理海量數(shù)據(jù),那么在海量數(shù)據(jù)之前,雖然有了技術(shù)手段,它仍需找到一個很好的切入點,去解決大數(shù)據(jù)該怎樣應(yīng)用到業(yè)務(wù)中,改變業(yè)務(wù)模式,給業(yè)務(wù)創(chuàng)新帶來價值。因為要把這個大數(shù)據(jù)加以更好地利用,再便宜還是投資,還是要改變,硬件、軟件各方面要做配置,甚至對應(yīng)的組織要做調(diào)整,一個企業(yè)要做進一步調(diào)整才能適應(yīng)大數(shù)據(jù)時代的需求,才能讓大數(shù)據(jù)發(fā)揮作用。所以我們做的工作就是幫助企業(yè)找到它的價值創(chuàng)造,建立業(yè)務(wù)模式,來證明在這方面做這樣的投資,讓大數(shù)據(jù)發(fā)揮作用是值得的。
俞吾金:我想提出不同看法,就是因為人類的思維有一個特點,他把覺悟的東西夸大為全球的。比如你看到三只天鵝是白的,但其實有一千只天鵝都是白的,可在澳大利亞發(fā)現(xiàn)了一只黑天鵝,就把一切天鵝都是白的這個原理給推翻了,我覺得大數(shù)據(jù)這個問題是重要的,但如何正確看待它,不能走極端。大數(shù)據(jù)反映了人們從數(shù)量關(guān)系去理解生活的一種思維方法,從古代開始就非常重視,當然古代沒有使用大數(shù)據(jù)這個概念。
數(shù)字本身對生活的重要性越來越大。從哲學上看,它有實踐性,比如數(shù)學中的π,圓周率,它等于3.1415926……它就把所有大數(shù)據(jù)都囊括進去了,更容易理解的是三分之一,三分之一的另一種寫法就是0.333333無限被延伸,所以黑客在邏輯學里就強調(diào),這個無限包容在三分之一這個有限中,有限中包含著無限的一個展開,包含所有數(shù)據(jù)的展開,這就體現(xiàn)了實踐精神。從這個實踐角度看這個數(shù)據(jù),我認為大數(shù)據(jù)在當代的變動中有重要地位,但看它要有眼光,不要夸大也不要縮小。
3 怎么理解三分之一就把一生所有數(shù)據(jù)都概括了?
維克托:我不同意俞老師的觀點。數(shù)字的歷史很悠久,但是,以前我們對這些數(shù)字的處理方式非常有限,光有技術(shù)是不夠的,能對數(shù)據(jù)進行分析,比如像數(shù)字,它對你只是一個數(shù)字,這個意義不重要,你也可以用一個漢字或一個字母來表示,那從這個角度來看,大數(shù)據(jù)不過是一個很長很長的數(shù)字,你可以用心記住就可以。
但其實,大數(shù)據(jù)的價值在于,在整個數(shù)據(jù)的收集過程中,需要運用分析才可以了解。比如,如何進行預(yù)防性的維修,如何能夠防止爆發(fā)等,我們不是把這個數(shù)字簡單地記下來或背下來,而是要通過分析,通過數(shù)據(jù)統(tǒng)計的分析,通過把它進行整理了解之后分析,這不是你背下來一個數(shù)字就可以了,這是非常大的區(qū)別。
4 大數(shù)據(jù)時代究竟會給生活帶來什么樣的顛覆?
維克托:首先從商業(yè)來講,我覺得有三個元素要記?。阂粋€是在商業(yè)世界中決策將發(fā)生變化,會越來越清楚地證明,要靠數(shù)據(jù)說話。
在美國,最大的互聯(lián)網(wǎng)公司大概是谷歌,每天都有30億搜索請求。有一天他們屏幕上準備用藍色,然后他們就選了一個特別的藍色,但他是要測試41種不同的藍色,來看到底哪一種最受歡迎。他本來想自己來決定:我是首席設(shè)計師啊,我就選了一種藍色。但他的老板說:不行,我需要實證來告訴我們哪一種藍色最受歡迎。但這個谷歌的首席設(shè)計師就辭職了,他說我是首席設(shè)計師啊,我是最清楚的。通過很多測試發(fā)現(xiàn),有一種藍色的藍是裸眼看到和設(shè)計師選的藍色不太區(qū)別得開,但另一種通過測試所產(chǎn)生的藍色,更受歡迎,有更多點擊量。通過實證做出來的決策更有效。類似例子有很多,都說我做這行已經(jīng)幾十年了,我說的肯定沒錯。這種傳統(tǒng)的社會觀念和思維方式會受到挑戰(zhàn),我們的決策必須要靠數(shù)據(jù)說話,這是第一點。
第二,就是在我們出去說話時,我們要注意不能誤讀數(shù)據(jù),錯誤的數(shù)據(jù)是不行的。也就是如果原來的材料不對,原料是垃圾,出來的東西肯定也是垃圾,這個公司出這些數(shù)據(jù)的話都是比較容易理解的,但可能不是你應(yīng)該熟悉的數(shù)據(jù)。
第三個是挑戰(zhàn)。就是普通產(chǎn)業(yè),尤其是計算機產(chǎn)業(yè),數(shù)據(jù)會超越它們,這個可能是有一種挑戰(zhàn)式的說法。如果沒有足夠的數(shù)據(jù),你也趕不上一個大量數(shù)據(jù)的比較平庸的模型,也就是為什么說數(shù)據(jù)會超越那些產(chǎn)業(yè)。比如機器翻譯這件事,在六七十年代,IBM花了很多錢想用機器翻譯,它要弄一些語言的規(guī)則輸入到機器中,但效果不太好,它就有了一個新想法,它不是把一種語言的語法規(guī)則輸入機器,而是把加拿大議會中的英法雙語的互譯輸進去,把成千上萬的翻譯資料輸入進去,它就有了大量的累計組織上的數(shù)據(jù)庫,這個效果就好得多。而谷歌又在這個領(lǐng)域有更多數(shù)據(jù),一下子這個翻譯就更成熟、效果更好。可以說,是這個數(shù)據(jù)使它超越了這個軟件。因為今天這個大數(shù)據(jù)的力量,可以很容易地獲得想要的資訊,但大概在十年前,需要五十萬個服務(wù)器,大量的儲存以及處理數(shù)據(jù)的模式,你才能開始一個新業(yè)務(wù)。今天如果要輸入業(yè)務(wù),用云計算來測試就可以了。比如有一個叫蒂塞德的公司,它有很多產(chǎn)品及價格,它收購一些數(shù)據(jù)來預(yù)測到底一個產(chǎn)品是上架還是下架,雖然他們擁有大量客戶,可這個公司的員工只有13個人,因此它的服務(wù)器有很多,他們擁有大量的數(shù)據(jù)。可見,這個舞臺不僅可以讓大公司來做,而且創(chuàng)新的小公司也能以平等的地位來競爭。
王曉陽:其實講到改變了我們整個思維方式,所謂的就是實驗這個思維,比理論思維更重要,這一點我不是太懂。其實維克托先生剛才舉的例子,是在很多情況下,是我們用數(shù)據(jù)去驗證以前想要能夠有的東西,有一些智慧確實是在數(shù)字里挖掘出來的,這個可能是一個語言來自不同的地方,怎么講呢?基于在大數(shù)據(jù)的情況下,其實有一個所謂的循環(huán)概念,等于說你有了智慧以后去驗證,驗證數(shù)據(jù)里又產(chǎn)生了各種各樣的智慧來做這樣的理解,所以從這個角度來講,我覺得是大數(shù)據(jù)的情況下面,沒有顛覆,而是說一個改進,對我們認知世界的改進。就公共衛(wèi)生這個話題來說,我們舉的最多的一個例子就是在谷歌,有一個所謂的趨勢預(yù)測,它就是用了網(wǎng)民們搜索的詞來預(yù)測。
所謂的預(yù)測流感,怎么做?很簡單,就是它去分析了以往的數(shù)據(jù),說在流感發(fā)生的地域,地域的那個時間大家是用什么詞去搜索,這樣就可以做統(tǒng)計。做了統(tǒng)計以后,反過頭來用這些搜索詞來預(yù)測這個流感,這種情況下是什么意思?并不見得是說這種數(shù)據(jù)或大數(shù)據(jù)的情況就能使我們對這個流感突然有一個新的認識,其實不然,其實是谷歌的那些工程師們有一個想法,認為我們好像流行流感,這和大家有關(guān),而每個人都會用搜索來獲取一些跟流感有關(guān)的信息,就有了這樣的關(guān)聯(lián)。這個關(guān)聯(lián)怎么去發(fā)現(xiàn)?這就要用數(shù)據(jù)去發(fā)現(xiàn),用所謂的大數(shù)據(jù)的做法,去實現(xiàn)我們已有的一些概念的東西,把它實現(xiàn)了之后,就能做預(yù)測。所以從這樣的角度講,并不見得是有了大數(shù)據(jù),我們就可以把所有的智慧都丟掉,我們不用IQ了,只要數(shù)據(jù)就好了,這肯定是不行的。一定是IQ加上數(shù)據(jù),然后能讓它有個正反的概念,這是大數(shù)據(jù)所應(yīng)該干的事情。
童士豪:我有不同想法,我覺得剛才維克托先生講的一點很有意思,就是對智慧的要求,大數(shù)據(jù)時代是不一樣的。在大數(shù)據(jù)時代,對智慧的要求可以低一點,都能產(chǎn)生更好的結(jié)果,這是一個有意思的事情。他剛才提了一個例子,之前要做翻譯是很難的,你的規(guī)則必須特別強、精簡、完整,才能有60%、70%的準確率。但在大數(shù)據(jù)時代,我們不用想那些,不用花智慧講那么復雜的規(guī)則和套路,干脆把幾億個已翻譯好的文章交給電腦,用統(tǒng)計學的方式找到哪種情況下,翻譯的字的另外一個意思是比較對的。這對于智慧的要求其實是降低了,但效果可能會更好。
孫健:可能我們對智慧的理解有歧義。我覺得維克托先生講的我理解,因為他有另一本書叫《Delete》,里面專門講了這個三重智慧,談了取舍問題。因為隨著存儲技術(shù)、因特網(wǎng)的發(fā)展,他講的更多的是知識,知識的要求可以低,但對智慧,我覺得理解不一樣。我理解的智慧是,你判斷一個事物的根本的、真正的洞察能力。就是,你對一個事物的洞察能力還是需要有,不會因為大數(shù)據(jù)的存在而削弱或不需要了,而恰恰因為大數(shù)據(jù)的存在才更需要洞察力。
5 大數(shù)據(jù)時代到底真正來臨了嗎?
王曉陽:大數(shù)據(jù)時代來不來臨要看你怎么度量、衡量?,F(xiàn)在這個數(shù)據(jù)的量和種類,以及采集的方式、手段,處理的手段,絕對已經(jīng)達到了“前無古人,后無來者”的感覺。這個情況下,我們從這個數(shù)據(jù)采集以及數(shù)據(jù)處理這個能力方面來講,我們的大數(shù)據(jù)時代來臨了,但我們使用數(shù)據(jù)利用數(shù)據(jù)這個才是剛剛開始,只是剛起步。
而大數(shù)據(jù)改變我們生活的時代,還沒有完全到來,但為這個我們已經(jīng)做了很多準備,這是城市的管理問題。我們?yōu)榇髷?shù)據(jù)時代做了很多準備,比如在數(shù)據(jù)采集方面已經(jīng)做了很多準備,怎么樣利用這個數(shù)據(jù)來做我們這個智慧城市,這是一個最大的問題。
徐明強:從商業(yè)角度來看,我從運用上說,個人認為是來臨了。舉個例子,墨客這樣一個藥材公司,他可以根據(jù)天氣性質(zhì),比如如果今天冬天特別冷,很多過敏性動物就會冬眠,四五月份突然轉(zhuǎn)熱時,花粉也開始多了,今年有很多人會過敏,等等,它就通過市場進行營銷,把比如克敏能這種藥材發(fā)布出去。
維克托·邁爾·舍恩伯格:美國總統(tǒng)奧巴馬曾說,盡管政府也嘗試,但他總是落后于企業(yè),落后于社會的其他一些群體。所以說搞這種活動能充分激發(fā)數(shù)據(jù),提供給大眾,而且公司也可以拿這些數(shù)據(jù),讓公司能利用這些數(shù)據(jù)有更多創(chuàng)新。這是一個想法,也許有一些做法,比如商業(yè)方法,我認為能通過發(fā)揮企業(yè)的智慧,發(fā)揮像微軟這樣的一些聰明企業(yè)的智慧,還是有幫助的,包括和政府的合作來管好社會。
石述思:我有一個感受,當商業(yè)巨頭面對屌絲談大數(shù)據(jù)時,我們都有一種不寒而栗的感覺,因為盡管大數(shù)據(jù)時代我們每個人都是公平的,我們可以說小公司可以獲得公平競爭待遇,但其實掌握大數(shù)據(jù)的都是一些巨頭,他們有得天獨厚的優(yōu)勢來搶我們錢包里的錢,我們很難,因為公司的定義就是在法律允許的范疇中唯利是圖。但我們倒是渴望政府部門能利用大數(shù)據(jù)為我們提供普惠性的服務(wù),可就像一些智慧城市沒法真正做到智慧管理的案例一樣,所以我對大數(shù)據(jù)來到中國的前途深表憂慮。還有,即使優(yōu)秀的公司利用大數(shù)據(jù),它也要面對一個現(xiàn)實,比如我們像電視臺做廣告的一樣,為什么現(xiàn)在人依然很多,因為中國貧富差距特別大,如果你掌握了所有消費者的數(shù)據(jù),而大多數(shù)在今天是無效數(shù)據(jù),所以你還是有一個有選擇的大數(shù)據(jù)的過程,叫有購買力的大數(shù)據(jù),所以各種各樣的問題就會出現(xiàn)在我們面前,就是社會本來是我們需要,但它存在很多幕后看不清楚的東西。我們擔心被商業(yè)巨頭利用,來完成對消費者進一步的盤剝。
孫健:我覺得從企業(yè)角度來看也是同樣的問題。我前面想表達的意思就是,第一我們今天中國很多企業(yè)實際上并沒有準備好迎接這個大數(shù)據(jù),因為我們現(xiàn)在還停留在比較初級的基礎(chǔ)數(shù)據(jù)分析時代,我們很多的基礎(chǔ)數(shù)據(jù)今天都沒有被運用,不要說大數(shù)據(jù),就是小數(shù)據(jù)今天也沒有很好的利用。還有很多假的數(shù)據(jù),是因為對這些數(shù)據(jù)的輸入管理非常不成熟,我自己在工作中接觸很多企業(yè),企業(yè)今天做的幾件事大家都在做,有ERP系統(tǒng),有數(shù)據(jù)庫,有了數(shù)據(jù)就往里面存,但我發(fā)覺,有很多中國企業(yè)兌現(xiàn)的數(shù)據(jù)管理沒有規(guī)范化的感覺,更沒有很好的利用。這就存在這樣的擔心:最后大數(shù)據(jù)時代來了以后,我們本來中國企業(yè)在這個數(shù)據(jù)分析的利用上就不擅長,今天有了大數(shù)據(jù)以后差距會變得更大,以后國際巨頭有一個成熟的數(shù)據(jù)分析方法,很多健全的商業(yè)模式,它會把這個差距變得越來越大。
6 在大數(shù)據(jù)時代,下一個預(yù)言會是什么,下一個判斷會是什么?
維克托:接下來怎么能讓生活比現(xiàn)在更高效,就是要讓城市變得更加智能,這是可行的,為什么?我強調(diào)的是,我們有可能改善我們的公共衛(wèi)生,改善教育,我們有能力收集數(shù)據(jù),公共交通的通化能真正滿足市民的需求,而不只是政客,而且能源消耗也會得到更好的檢測、預(yù)測和管理,這樣我們的城市就會更加智能,讓城市的生活更加好。在150年前,曾有預(yù)測如果是在城市生活,壽命會更短;在農(nóng)村生活則壽命長。而150年之后的今天,壽命更加長了,有了大數(shù)據(jù)我們會更加美好,可是有一個條件,就是那些決策者,他們一定要使用這些數(shù)字才可以。
下一步是專家怎么來做。其實這涉及到在數(shù)據(jù)時代,數(shù)據(jù)點是有限的,那么我們收集的數(shù)據(jù),只要我們收集足夠的數(shù)據(jù)來解決問題就可以了。因為非常復雜、數(shù)據(jù)點非常少,所以我們的數(shù)據(jù)點收集起來必須是要高質(zhì)量的,現(xiàn)在不是這樣的,現(xiàn)在的是更加的多、更加的亂。解釋一下什么叫更多更亂,更多就是有數(shù)據(jù)點,關(guān)于我們想要研究的一個現(xiàn)象,我們可以更多的進行數(shù)據(jù)統(tǒng)計,比如在美國,你有DNA基因圖譜,那么只要2000美金就可以知道你的整個基因圖譜當中的30億這個東西是怎么組成的,這樣你就可以知道那些30億個精對,現(xiàn)在如果說有一個基因組成可能會導致什么樣的癌癥,就可以查基因圖譜,說我是不容易生這個病的,這是為什么可以預(yù)測是否患癌癥的原因。那么有更多的數(shù)據(jù)便會存在一定的不準確性,所以,我說更多且更亂,所以這里允許一點點的不準確,或者可以亂一點,這個所謂的亂就是指,不是說每一個數(shù)據(jù)點都要達到最高的準確度,這個結(jié)果就是,不是百分之一百完美,但在大數(shù)據(jù)這樣一種方向,或者說,我們在正確的數(shù)據(jù)點上要知道一個方向。知道方向比晚一點知道完美的數(shù)據(jù)更有效。比如交通預(yù)測,也許當下看到的交通預(yù)測比實際運用中要晚了20分鐘,可能看起來太晚了,但如果這是預(yù)測一個星期的信息,就夠了。
王曉陽:大數(shù)據(jù)時代對我們這個城市更加理解,所謂的理解就是你知道這個城市里發(fā)生了什么,這非常重要。在以前,這個城市的管理都是一拍腦袋,有的時候拍腦袋拍出很好的來,拍腦袋也能拍出非常棒的一個城市來,但是有的時候呢?拍腦袋可能太離譜,這種情況下在大數(shù)據(jù)時代我們怎么樣利用好,就是我們所講的。而為了政績也可以用大數(shù)據(jù)來考慮,說這個數(shù)字到底對它的政績有沒有好處?就是名義是一個很大的方面,大數(shù)據(jù)方面不光是理解我們這個城市發(fā)生了什么,而且還能了解我們城市里的民眾在想什么?這點對城市管理來說非常重要,城市不光是一個硬件設(shè)施,不光是地鐵和高樓,人在里面非常重要。