作者:亞信數(shù)據(jù) 方亮
題圖:“This is for Everyone”,互聯(lián)網(wǎng)之父 Tim Berners-Lee 爵士,在2012年倫敦奧運(yùn)會(huì)期間所發(fā)的twitter,來(lái)源:Martin Rickett/PA Wire
本文介紹了ODI(The Open Data Institute,開(kāi)放數(shù)據(jù)研究所)提出的“數(shù)據(jù)頻譜”(Data Spectrum)概念,對(duì)不同邊界范圍的數(shù)據(jù)權(quán)利進(jìn)行了界定,希望能幫助大家在談?wù)摂?shù)據(jù)流通時(shí)可以進(jìn)行更加有效地溝通。
一 概念易混淆
不少人會(huì)擔(dān)心個(gè)人的健康數(shù)據(jù)被“公開(kāi)”,也區(qū)分不開(kāi)商業(yè)數(shù)據(jù)和個(gè)人數(shù)據(jù),甚至?xí)?ldquo;大數(shù)據(jù)”和“開(kāi)放數(shù)據(jù)”相混淆。
在大數(shù)據(jù)時(shí)代,若想應(yīng)對(duì)數(shù)據(jù)帶來(lái)的挑戰(zhàn),充分釋放數(shù)據(jù)的價(jià)值,就需要精確地掌握這些概念究竟代表著什么。只有準(zhǔn)確而清晰的理解這些,才能進(jìn)一步討論應(yīng)該如何使用數(shù)據(jù)、數(shù)據(jù)對(duì)未來(lái)有何影響,以及如何規(guī)劃未來(lái)。
無(wú)論是大、中、小數(shù)據(jù),抑或是政府、企業(yè)、個(gè)人數(shù)據(jù),關(guān)鍵問(wèn)題在于——數(shù)據(jù)是如何被許可授權(quán)的!
二 數(shù)據(jù)有其譜
數(shù)據(jù)有各種使用場(chǎng)景,可以用“數(shù)據(jù)頻譜”描述不同類(lèi)型的數(shù)據(jù)可用性:關(guān)于誰(shuí)有權(quán)訪(fǎng)問(wèn)數(shù)據(jù),以及他們能如何使用數(shù)據(jù)的決策。
數(shù)據(jù)的頻譜范圍從封閉到共享再到開(kāi)放:
1.封閉數(shù)據(jù)(Closed Data):選擇保持封閉的數(shù)據(jù)并不一定個(gè)人。處于數(shù)據(jù)頻譜的這個(gè)區(qū)域的數(shù)據(jù)可以是由個(gè)人或是組織產(chǎn)生的。這些數(shù)據(jù)只允許其所有者或持有者來(lái)訪(fǎng)問(wèn)和使用。
圖片來(lái)源:ODI,遵循CC-BY許可協(xié)議,下同
2.共享數(shù)據(jù)(Shared Data):共享數(shù)據(jù)是指與一個(gè)特定的人或組織進(jìn)行了共享的數(shù)據(jù)。數(shù)據(jù)如何被共享,誰(shuí)有權(quán)訪(fǎng)問(wèn)數(shù)據(jù),以及他們能如何使用數(shù)據(jù),通常都會(huì)被列入一個(gè)明確的許可協(xié)議中。共享形式包括:
具名訪(fǎng)問(wèn)(Named access):數(shù)據(jù)僅被共享給具體的個(gè)人或組織。
條件訪(fǎng)問(wèn)(Attribute-based access):數(shù)據(jù)對(duì)滿(mǎn)足特定標(biāo)準(zhǔn)的群體可用。
公開(kāi)訪(fǎng)問(wèn)(Public access):數(shù)據(jù)非“開(kāi)放”,但在滿(mǎn)足條款約束的情況下對(duì)任何人可用。
有時(shí)候,數(shù)據(jù)可能因特定目的而被共享給特定的人群。比如,健康數(shù)據(jù)被共享給申請(qǐng)授權(quán)的某些研究人員,用于醫(yī)學(xué)研究。這些數(shù)據(jù)來(lái)源的個(gè)人和組織會(huì)基于數(shù)據(jù)如何被使用,以及他們能從中獲得什么回報(bào)來(lái)決定是否要共享數(shù)據(jù)。
3.開(kāi)放數(shù)據(jù)(Open Data):指的是可以被任何人訪(fǎng)問(wèn)、使用和共享的數(shù)據(jù)。
數(shù)據(jù)若想被認(rèn)作是“開(kāi)放”的,其必須滿(mǎn)足:(1)可訪(fǎng)問(wèn),這通常意味著在網(wǎng)上公開(kāi)發(fā)布;(2)以機(jī)器可讀的格式提供;(3)具有允許任何人訪(fǎng)問(wèn)、使用和分享的許可證——可以是商業(yè)的,也可以是非商業(yè)的。
數(shù)據(jù)頻譜在橫軸方向顯然有封閉、共享和開(kāi)放的區(qū)別,但在縱軸方向其實(shí)也有差異。簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)頻譜中的縱軸代表了數(shù)據(jù)量的大小。從未來(lái)可能的場(chǎng)景來(lái)考慮,可以認(rèn)為縱軸代表了特定類(lèi)型的數(shù)據(jù)所占的比例。
三 頻譜非線(xiàn)性
需要說(shuō)明的是,數(shù)據(jù)頻譜并不是線(xiàn)性的——數(shù)據(jù)的訪(fǎng)問(wèn)和使用可以在整個(gè)頻譜中以各種不同的方式被約束。
既存在僅供組織內(nèi)部查看的封閉數(shù)據(jù),同樣也存在集成于一系列內(nèi)部產(chǎn)品和服務(wù)中的封閉數(shù)據(jù);數(shù)據(jù)可能被共享給了特定的人群,但他們可能只有訪(fǎng)問(wèn)權(quán)限,而無(wú)使用權(quán)限;公開(kāi)數(shù)據(jù)也可能存在限制,例如需要遵守?cái)?shù)據(jù)發(fā)布者或持有者的署名許可。
所以,不管是個(gè)人數(shù)據(jù)、商業(yè)數(shù)據(jù)、還是所謂的大數(shù)據(jù),在不同環(huán)境下,既有可能是封閉的,又有可能是與特定個(gè)人或組織共享的,還有可能是在某種許可下開(kāi)放的。
數(shù)據(jù)將如何被訪(fǎng)問(wèn)和使用,是所有數(shù)據(jù)持有者或數(shù)據(jù)所有者未來(lái)必須面對(duì)的一個(gè)決策。在數(shù)據(jù)被置為封閉、共享或開(kāi)放之前,它僅僅是“數(shù)據(jù)”本身。“你”的意圖和方式?jīng)Q定了其將被置于數(shù)據(jù)頻譜的哪個(gè)位置。