印度實(shí)施的唯一身份識別(Unique Identification)項(xiàng)目(也被稱作 Aadhar 計(jì)劃),本周早些時候完成了人口統(tǒng)計(jì)和生物識別數(shù)據(jù)的收集,總量超過 5 億印度居民——是目前全球同類生物識別項(xiàng)目規(guī)模最大的一個。
該項(xiàng)目實(shí)施的幾年來一直伴隨著來自隱私和安全以及其他方面的爭議聲音。Aadhar 項(xiàng)目最新的進(jìn)展又引來了有關(guān)其捕獲、存儲以及管理數(shù)據(jù)方法的擔(dān)憂,特別是一家美國創(chuàng)業(yè)公司 MongoDB 在其中所扮演的角色。
MongoDB 是一家非關(guān)系型數(shù)據(jù)庫(NoSQL database)創(chuàng)業(yè)公司,去年從美國中情局資助的 In-Q-Tel 機(jī)構(gòu)中募集了資金。In-Q-Tel 是一家獨(dú)立的非盈利資本機(jī)構(gòu),由 CIA 和一些美國其他的情報機(jī)構(gòu)在背后支持。
過去幾天,幾家印度媒體的報道引述了該國政黨和活動人士們的意見,懷疑 Aadhar 項(xiàng)目的隱私數(shù)據(jù)被盜用,直指該項(xiàng)目的負(fù)責(zé)人 Infosys 的聯(lián)合創(chuàng)始人 Nandan Nilekani。
也有一些報道文章將 MongoDB 列入批評對象當(dāng)中。
全球各國政府都在日益警惕美國國家安全局(NSA)的竊聽行動,任何與美國政府情報機(jī)構(gòu)有絲毫聯(lián)系的事情都會鬧得沸沸揚(yáng)揚(yáng)。不僅如此,因?yàn)橛《让髂昶者x在即,該國政治意見的發(fā)聲更是達(dá)到前所未有的程度。
諸如此類指控的時機(jī)不能來得再糟糕了,至少對于這個野心龐大的身份識別項(xiàng)目來說是如此,Aadhar 正在等待國會法案的通過,要在今年完全成為憲法承認(rèn)的機(jī)構(gòu)。
筆者訪問了位于班加羅爾(Bangalore)的 Aadhar 項(xiàng)目辦公地點(diǎn),說實(shí)話,按照向我介紹信息的工作人員的說法,雖然有人指摘大額合同中包含與 MongoDB 分享數(shù)據(jù)的內(nèi)容,其實(shí) Aadhar 使用的是 MongoDB 的開源代碼,并不會觸及敏感數(shù)據(jù)。這次會面同樣有機(jī)會了解到目前地球上最大的生物識別數(shù)據(jù)庫如何運(yùn)作,如何處理安全和隱私方面的隱患。
不僅如此,印度唯一身份識別局(the Unique Identification Authority of India)反駁了與任何美方機(jī)構(gòu)分享印度國民數(shù)據(jù)信息的指控。
Aadhar 對于印度來說,意味著什么?
首先要理清談?wù)?Aadhar 的語境,這個項(xiàng)目對于印度這樣的國家來說意味著什么?該國有超過 5 億人口沒有任何正式的身份證明(ID)或諸如此類的憑證,這就導(dǎo)致了許多其他問題,比如沒辦法領(lǐng)取政府補(bǔ)貼、注冊銀行賬戶、申請貸款、考取駕照等等。Aadhar 數(shù)據(jù)庫項(xiàng)目,目前以每天新增 100 萬印度國民的速度在記錄,預(yù)計(jì)于明年底注冊完成大約 12 億人口,介時將成為地球上最大的生物識別數(shù)據(jù)庫。
獲得 12 位數(shù)字長度 Aadhar 編碼的最大優(yōu)勢是該國政府能夠?qū)y行賬戶與貧困人口聯(lián)系起來,直接現(xiàn)金權(quán)益和其他補(bǔ)貼做銀行轉(zhuǎn)賬。目前,印度已經(jīng)有將近 4000 萬個銀行賬戶與 Aadhar 數(shù)據(jù)建立了匹配。
市場研究機(jī)構(gòu) CLSA 的報告顯示,印度政府總值 2500 億美元的補(bǔ)貼和其他國民待遇中有超過 40% 是針對該國貧困人口的,但是卻將在未來幾年浪費(fèi)在政府腐敗當(dāng)中。Aadhar 計(jì)劃能夠把過程的中間環(huán)節(jié)去掉,向需要政府補(bǔ)貼的人直接現(xiàn)金轉(zhuǎn)賬,用這種方式抑制腐敗。
但也有包括位于班加羅爾的互聯(lián)網(wǎng)和社會中心(Centre for Internet & Society)在內(nèi)的智庫和活動家對于隱私方面的問題始終持懷疑態(tài)度,甚至質(zhì)疑整個項(xiàng)目能夠發(fā)揮多大的效果。
深入全球最大的生物識別數(shù)據(jù)庫
筆者多方嘗試與 Aadhar 項(xiàng)目官員進(jìn)行會面,了解安全方面的問題,目前的進(jìn)展,以及他們對于批評使用 MongoDB 技術(shù)的反應(yīng)。
周五 Aadhar 終于同意在班加羅爾南部郊區(qū)的總部與我見面,英特爾和思科在印度的總部也位于該地區(qū)。從外表來看,存儲了全體印度國民數(shù)據(jù)(目前數(shù)據(jù)總量 5 Petabytes)的 Aadhar 技術(shù)中心一點(diǎn)也不像是個政府建筑——很容易讓人以為是附近的英特爾或者思科公司辦公樓中的一個。
走進(jìn)內(nèi)部,我來到了一間中央位置有十幾個電視屏幕的房間,幾位二十多歲的年輕工程師興奮地坐在前面,在各自的電腦鍵盤上敲擊,查詢數(shù)據(jù)包裹傳輸?shù)拇鎯π畔ⅲ麄€場面很像一個先進(jìn)的控制中心。他們盯著的電視屏幕顯示了這些數(shù)據(jù)包裹(每個 5MB 左右)的記錄,從全國 30000 個錄入中心進(jìn)入開始,經(jīng)過至少三次信息核實(shí)過程。核實(shí)過程包裹為每一份檔案進(jìn)行重復(fù)性檢驗(yàn),確保同一個人不會被生成兩次 Aadhar 號碼。