日報:在數(shù)據(jù)的分析和使用中出現(xiàn)了哪些新興的工具?
涂子沛:主要是數(shù)據(jù)挖掘和機器學(xué)習(xí),它們之間也存在很大差別。
數(shù)據(jù)挖掘就是建一個固定的模型去分析數(shù)據(jù),但機器學(xué)習(xí)的模型卻是靈活可變的。也就是說,數(shù)據(jù)越多,機器學(xué)習(xí)的模型就能自我調(diào)適讓它更加精確。
舉個例子,現(xiàn)在圖形挖掘中的一大難點就是人臉識別。如果按照數(shù)據(jù)挖掘的方式來做,可以通過人臉的特點把模型建立起來。但如果是機器學(xué)習(xí),一開始只是建一個初步的模型,建好之后再拿成千上萬的臉部圖給這個機器,它就會自己去判別每一張臉的特點,然后改善模型。原來在數(shù)據(jù)挖掘的固定模型之下,判別的失誤率很高,而機器見的臉越多,它的識別率就越高,判斷就越準(zhǔn)確。
數(shù)據(jù)挖掘是一個固定的模式,不會輕易改變。但機器卻可以在識別和處理人臉越來越多的基礎(chǔ)之上調(diào)整各種參數(shù),讓自己的模型越來越準(zhǔn)確,所以稱之為“機器學(xué)習(xí)”。在這種情況下,機器和人一樣獲得了智能,甚至能產(chǎn)生判別。
大數(shù)據(jù)最重要的意義一個是整合,另一個是自動化。通過大量數(shù)據(jù)的整合,人們能發(fā)現(xiàn)以前所不能發(fā)現(xiàn)的知識,于是產(chǎn)生了價值。第二,可以通過大數(shù)據(jù)讓機器獲得智能,實現(xiàn)自動化,這也是人類使用數(shù)據(jù)的巔峰狀態(tài)。
新模式
日報:大數(shù)據(jù)怎樣改變了傳統(tǒng)行業(yè)的商業(yè)模式?
涂子沛:這次回國我參觀了通聯(lián)數(shù)據(jù)這家公司,這是一家新興的創(chuàng)業(yè)公司,他們要用大數(shù)據(jù)開發(fā)新一代的基金管理和交易的平臺,具體做法是收集大量的、多源的、實時的數(shù)據(jù),為基金經(jīng)理和投資者提供數(shù)據(jù)分析、查詢和判斷。通聯(lián)數(shù)據(jù)也在思考探討如何用大數(shù)據(jù)去衡量小微企業(yè)的信用,或許這能開創(chuàng)一個新的商業(yè)模式。
另外,浙江的銀江電子股份公司也在思考如何利用大數(shù)據(jù)技術(shù)來幫助浙江省政府解決醫(yī)療保險中的欺詐行為。這樣的創(chuàng)新依賴于醫(yī)療領(lǐng)域豐富的數(shù)據(jù)。教育領(lǐng)域也有非常多的數(shù)據(jù)可以用,比如高考數(shù)據(jù)要是開放出來讓民間去挖掘,一定能得出大量有助于考生填報志愿、優(yōu)化錄取過程的結(jié)論。
除此之外,公共領(lǐng)域也有一些新的應(yīng)用,政府也在嘗試破冰。例如,廣東省正在用大數(shù)據(jù)來抓假車牌,我從廣東省的經(jīng)信委得知,僅2013年就抓了50多輛套牌車。
這種基于大數(shù)據(jù)的競爭是一種精細(xì)化競爭的要求和表現(xiàn)。但總體而言,國內(nèi)的商業(yè)競爭還是比較粗放,很多決策也都是拍腦袋。所以在《數(shù)據(jù)之巔》里面我提出,數(shù)據(jù)是從“中國制造”到“中國創(chuàng)造”的抓手,也決定著商業(yè)形態(tài)從粗放向精細(xì)化轉(zhuǎn)型。
日報:數(shù)據(jù)使用方面出現(xiàn)了哪些新的商業(yè)模式?
涂子沛:數(shù)據(jù)的使用要兼顧個人的隱私保護,目前已經(jīng)出現(xiàn)了一種全新的商業(yè)模式:用戶授權(quán)使用。
毋庸置疑的是,未來消費者隱私的保護就是要把權(quán)利交回到用戶手中,要用戶授權(quán)才能查詢個體產(chǎn)生的數(shù)據(jù)。
美國有一家經(jīng)營小微企業(yè)貸款的公司叫做Kabbage,它會收集企業(yè)的很多數(shù)據(jù)來作為是否發(fā)放貸款的依據(jù),其中一項是用UPS發(fā)了多少快遞。但這里存在一個問題:Kabbage要去UPS查詢企業(yè)的快遞記錄,但UPS需要該小微企業(yè)的授權(quán)同意才能這么做,即使該企業(yè)同意,UPS公司也可以拒絕Kabbage的要求。最終的結(jié)果只能是,即便用戶授權(quán)了,Kabbage需要查數(shù)據(jù)時也要付錢給UPS。對UPS來說,數(shù)據(jù)就是資產(chǎn),這就是新的商業(yè)模式。
另一方面,小微企業(yè)也可以直接找到UPS,希望拿到自己的數(shù)據(jù)。但數(shù)據(jù)經(jīng)過它自己的手,Kabbage就可以質(zhì)疑數(shù)據(jù)的真實性從而拒絕接受。因此這些企業(yè)可以尋求UPS的數(shù)據(jù)認(rèn)證,然后再將其交給Kabbage。這樣一來,UPS就可以向小微企業(yè)和Kabbage兩方都收取費用。
從這個例子中可以看到用戶授權(quán)、隱私保護、數(shù)據(jù)資產(chǎn)、第三方框架怎樣使用數(shù)據(jù)等內(nèi)容,這就是未來數(shù)據(jù)商業(yè)的模式。