印度實(shí)施的唯一身份識(shí)別(Unique Identification)項(xiàng)目(也被稱作 Aadhar 計(jì)劃),本周早些時(shí)候完成了人口統(tǒng)計(jì)和生物識(shí)別數(shù)據(jù)的收集,總量超過(guò) 5 億印度居民——是目前全球同類生物識(shí)別項(xiàng)目規(guī)模最大的一個(gè)。
該項(xiàng)目實(shí)施的幾年來(lái)一直伴隨著來(lái)自隱私和安全以及其他方面的爭(zhēng)議聲音。Aadhar 項(xiàng)目最新的進(jìn)展又引來(lái)了有關(guān)其捕獲、存儲(chǔ)以及管理數(shù)據(jù)方法的擔(dān)憂,特別是一家美國(guó)創(chuàng)業(yè)公司 MongoDB 在其中所扮演的角色。
MongoDB 是一家非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL database)創(chuàng)業(yè)公司,去年從美國(guó)中情局資助的 In-Q-Tel 機(jī)構(gòu)中募集了資金。In-Q-Tel 是一家獨(dú)立的非盈利資本機(jī)構(gòu),由 CIA 和一些美國(guó)其他的情報(bào)機(jī)構(gòu)在背后支持。
過(guò)去幾天,幾家印度媒體的報(bào)道引述了該國(guó)政黨和活動(dòng)人士們的意見(jiàn),懷疑 Aadhar 項(xiàng)目的隱私數(shù)據(jù)被盜用,直指該項(xiàng)目的負(fù)責(zé)人 Infosys 的聯(lián)合創(chuàng)始人 Nandan Nilekani。
也有一些報(bào)道文章將 MongoDB 列入批評(píng)對(duì)象當(dāng)中。
全球各國(guó)政府都在日益警惕美國(guó)國(guó)家安全局(NSA)的竊聽(tīng)行動(dòng),任何與美國(guó)政府情報(bào)機(jī)構(gòu)有絲毫聯(lián)系的事情都會(huì)鬧得沸沸揚(yáng)揚(yáng)。不僅如此,因?yàn)橛《让髂昶者x在即,該國(guó)政治意見(jiàn)的發(fā)聲更是達(dá)到前所未有的程度。
諸如此類指控的時(shí)機(jī)不能來(lái)得再糟糕了,至少對(duì)于這個(gè)野心龐大的身份識(shí)別項(xiàng)目來(lái)說(shuō)是如此,Aadhar 正在等待國(guó)會(huì)法案的通過(guò),要在今年完全成為憲法承認(rèn)的機(jī)構(gòu)。
筆者訪問(wèn)了位于班加羅爾(Bangalore)的 Aadhar 項(xiàng)目辦公地點(diǎn),說(shuō)實(shí)話,按照向我介紹信息的工作人員的說(shuō)法,雖然有人指摘大額合同中包含與 MongoDB 分享數(shù)據(jù)的內(nèi)容,其實(shí) Aadhar 使用的是 MongoDB 的開(kāi)源代碼,并不會(huì)觸及敏感數(shù)據(jù)。這次會(huì)面同樣有機(jī)會(huì)了解到目前地球上最大的生物識(shí)別數(shù)據(jù)庫(kù)如何運(yùn)作,如何處理安全和隱私方面的隱患。
不僅如此,印度唯一身份識(shí)別局(the Unique Identification Authority of India)反駁了與任何美方機(jī)構(gòu)分享印度國(guó)民數(shù)據(jù)信息的指控。
Aadhar 對(duì)于印度來(lái)說(shuō),意味著什么?
首先要理清談?wù)?Aadhar 的語(yǔ)境,這個(gè)項(xiàng)目對(duì)于印度這樣的國(guó)家來(lái)說(shuō)意味著什么?該國(guó)有超過(guò) 5 億人口沒(méi)有任何正式的身份證明(ID)或諸如此類的憑證,這就導(dǎo)致了許多其他問(wèn)題,比如沒(méi)辦法領(lǐng)取政府補(bǔ)貼、注冊(cè)銀行賬戶、申請(qǐng)貸款、考取駕照等等。Aadhar 數(shù)據(jù)庫(kù)項(xiàng)目,目前以每天新增 100 萬(wàn)印度國(guó)民的速度在記錄,預(yù)計(jì)于明年底注冊(cè)完成大約 12 億人口,介時(shí)將成為地球上最大的生物識(shí)別數(shù)據(jù)庫(kù)。
獲得 12 位數(shù)字長(zhǎng)度 Aadhar 編碼的最大優(yōu)勢(shì)是該國(guó)政府能夠?qū)y行賬戶與貧困人口聯(lián)系起來(lái),直接現(xiàn)金權(quán)益和其他補(bǔ)貼做銀行轉(zhuǎn)賬。目前,印度已經(jīng)有將近 4000 萬(wàn)個(gè)銀行賬戶與 Aadhar 數(shù)據(jù)建立了匹配。
市場(chǎng)研究機(jī)構(gòu) CLSA 的報(bào)告顯示,印度政府總值 2500 億美元的補(bǔ)貼和其他國(guó)民待遇中有超過(guò) 40% 是針對(duì)該國(guó)貧困人口的,但是卻將在未來(lái)幾年浪費(fèi)在政府腐敗當(dāng)中。Aadhar 計(jì)劃能夠把過(guò)程的中間環(huán)節(jié)去掉,向需要政府補(bǔ)貼的人直接現(xiàn)金轉(zhuǎn)賬,用這種方式抑制腐敗。
但也有包括位于班加羅爾的互聯(lián)網(wǎng)和社會(huì)中心(Centre for Internet & Society)在內(nèi)的智庫(kù)和活動(dòng)家對(duì)于隱私方面的問(wèn)題始終持懷疑態(tài)度,甚至質(zhì)疑整個(gè)項(xiàng)目能夠發(fā)揮多大的效果。
深入全球最大的生物識(shí)別數(shù)據(jù)庫(kù)
筆者多方嘗試與 Aadhar 項(xiàng)目官員進(jìn)行會(huì)面,了解安全方面的問(wèn)題,目前的進(jìn)展,以及他們對(duì)于批評(píng)使用 MongoDB 技術(shù)的反應(yīng)。
周五 Aadhar 終于同意在班加羅爾南部郊區(qū)的總部與我見(jiàn)面,英特爾和思科在印度的總部也位于該地區(qū)。從外表來(lái)看,存儲(chǔ)了全體印度國(guó)民數(shù)據(jù)(目前數(shù)據(jù)總量 5 Petabytes)的 Aadhar 技術(shù)中心一點(diǎn)也不像是個(gè)政府建筑——很容易讓人以為是附近的英特爾或者思科公司辦公樓中的一個(gè)。
走進(jìn)內(nèi)部,我來(lái)到了一間中央位置有十幾個(gè)電視屏幕的房間,幾位二十多歲的年輕工程師興奮地坐在前面,在各自的電腦鍵盤上敲擊,查詢數(shù)據(jù)包裹傳輸?shù)拇鎯?chǔ)信息,整個(gè)場(chǎng)面很像一個(gè)先進(jìn)的控制中心。他們盯著的電視屏幕顯示了這些數(shù)據(jù)包裹(每個(gè) 5MB 左右)的記錄,從全國(guó) 30000 個(gè)錄入中心進(jìn)入開(kāi)始,經(jīng)過(guò)至少三次信息核實(shí)過(guò)程。核實(shí)過(guò)程包裹為每一份檔案進(jìn)行重復(fù)性檢驗(yàn),確保同一個(gè)人不會(huì)被生成兩次 Aadhar 號(hào)碼。