研究員們還強調(diào)稱,預(yù)計到2020年存儲于計算機中的全部數(shù)據(jù)——包括歸檔、視頻、圖片、企業(yè)系統(tǒng)數(shù)據(jù)以及移動設(shè)備信息——將達到44萬億GB,這一數(shù)字來自IDC與EMC的研究報告。
“這相當于2013年全部數(shù)據(jù)總量的十倍。雖然并非全部信息都需要進行長期保存,但可以肯定的是數(shù)據(jù)存儲設(shè)備的增長速度完全跟不上數(shù)據(jù)的產(chǎn)生速度。”
不過在投入商業(yè)使用之前,DNA存儲系統(tǒng)還需要克服一系列難題。首先,DNA合成與測序的效果還遠稱不上完美,每核苷酸中仍存在1%的排序錯誤率。因此,DNA存儲需要設(shè)計出合適的編碼方案,從而帶來額外的容錯能力。
再有,DNA存儲不擅長實現(xiàn)隨機數(shù)據(jù)存取,這意味著整體而言讀取延遲遠高于寫入延遲。目前的進展只能夠?qū)崿F(xiàn)大型數(shù)據(jù)塊存取;即使僅讀取單個字節(jié),也必須對整套DNA庫進行測序與解碼。
科學家們已經(jīng)提出了對應(yīng)的解決方案,即利用聚合酶鏈式反應(yīng)(簡稱PCR)對需要的數(shù)據(jù)進行定向放大,從而通過針對性測序改善隨機接入能力。如此一來,我們將不再需要對整套DNA庫進行測序。
“這是我們借用大自然產(chǎn)物的絕對實例,”Ceze解釋稱。“但我們也在使用現(xiàn)有計算機技術(shù)對其加以完善,例如如何糾正內(nèi)存錯誤,并讓最終成果回歸自然。”