其實(shí),政府的策略不僅在于簡(jiǎn)單的數(shù)據(jù)開放,我們也可以看到政府在大數(shù)據(jù)技術(shù)發(fā)展方面所起到的作用。這里面舉個(gè)例子,從2012年開始,美國(guó)投了2億美元發(fā)展大數(shù)據(jù)戰(zhàn)略,主要投入到了基礎(chǔ)研究領(lǐng)域,大家可能對(duì)于Hadoop這種類型計(jì)算的模式都比較清楚,現(xiàn)在UC伯克利已經(jīng)開發(fā)了一整套的解決方案,包括上層的內(nèi)存處理計(jì)算模型,都是由UC伯克利提出來的,但NSSA有個(gè)要求要把它變成開源的平臺(tái),使得這個(gè)技術(shù)能夠向產(chǎn)業(yè)間擴(kuò)散?,F(xiàn)在,大家都認(rèn)為這個(gè)模式將來會(huì)替代Hadoop傳統(tǒng)的計(jì)算模型,實(shí)際現(xiàn)在已經(jīng)有很多企業(yè)支持這樣的做法,包括國(guó)內(nèi)的華為。
大數(shù)據(jù)的開放包括著一個(gè)很大的問題就是隱私保護(hù),傳統(tǒng)模式下有6個(gè)對(duì)隱私保護(hù)的基礎(chǔ)原本,現(xiàn)在在安裝應(yīng)用的時(shí)候我就會(huì)告訴你我會(huì)收集什么信息,你是不是同意,但大數(shù)據(jù)的世界里原來的原則不再適用了,包括你怎么描繪一個(gè)人,怎么認(rèn)定這是他的隱私數(shù)據(jù),這是非常難的。包括描述你個(gè)人的信息,實(shí)際上現(xiàn)在騰訊給每個(gè)用戶有5-6個(gè)標(biāo)簽去描述他,我們可以想像,對(duì)于自己的親朋好友,我們說用20個(gè)詞去形容他,這對(duì)大部分人來說都很困難。但是,騰訊用了幾千個(gè)緯度描述一個(gè)人。就等于說,互聯(lián)網(wǎng)比我們自己還了解我們自己。所以,2013年的時(shí)候世界經(jīng)濟(jì)論壇也發(fā)布了一個(gè)報(bào)告,要把個(gè)人數(shù)據(jù)里的價(jià)值釋放出來,怎么釋放?就是在于對(duì)隱私保護(hù)模式的改變,從收集環(huán)節(jié)的限制到使用環(huán)節(jié)進(jìn)行限制。
可以在用戶不知情的情況下收集數(shù)據(jù),這可能是在大數(shù)據(jù)時(shí)代不可避免的。但問題是,在使用環(huán)節(jié)怎么限制數(shù)據(jù)的使用,怎么不去泄露用戶的隱私,怎么不進(jìn)行隱私數(shù)據(jù)的濫用,等等。
對(duì)我們國(guó)家來說,其實(shí)政府非常重視大數(shù)據(jù)的發(fā)展,在今年的政府工作報(bào)告里也多次提到大數(shù)據(jù)這樣的關(guān)健詞,把大數(shù)據(jù)跟集成電路、新能源等等,并列為引領(lǐng)未來發(fā)展的關(guān)鍵領(lǐng)域。
我們也對(duì)政府對(duì)大數(shù)據(jù)的定位總結(jié)了這三點(diǎn):第一,大數(shù)據(jù)對(duì)環(huán)境的重大作用,包括隱私保護(hù)的法律環(huán)境,數(shù)據(jù)挖掘的制度設(shè)計(jì)。第二是大數(shù)據(jù)分析能力的建設(shè)。第三,政府在大數(shù)據(jù)里面,通過政府的數(shù)據(jù)開放和數(shù)據(jù)應(yīng)用,這會(huì)使社會(huì)其它領(lǐng)域起到表率作用。
以上就是我演講的主要內(nèi)容,也非常希望跟大家分享我們的研究成果,謝謝大家!
以上內(nèi)容根據(jù)現(xiàn)場(chǎng)速記整理。