ITBear旗下自媒體矩陣:

微軟黑科技:DNA存儲技術(shù)催生方糖大小的數(shù)據(jù)中心

   時間:2016-04-12 11:18:07 來源:鳳凰科技編輯:星輝 發(fā)表評論無障礙通道

DNA存儲密度驚人

北京時間4月12日消息,據(jù)科技網(wǎng)站Computerworld報道,微軟和華盛頓大學(xué)研究人員已經(jīng)展示了利用人工合成DNA作為數(shù)據(jù)存儲介質(zhì)的技術(shù)。

研究人員表示,如果這一技術(shù)成熟到適合主流應(yīng)用,裝備當(dāng)今存儲密度最高的存儲設(shè)備、沃爾瑪超市般大小的數(shù)據(jù)中心,就可能“瘦身”到一塊方糖大小,“我們認(rèn)為,考慮把DNA作為存儲介質(zhì),探索相關(guān)系統(tǒng)設(shè)計(jì)問題的時機(jī)已經(jīng)成熟”。

研究團(tuán)隊(duì)成功地將4個圖片文件的數(shù)據(jù)編碼為人工合成DNA片段的核苷酸序列。更重要的是,他們能實(shí)現(xiàn)逆過程——從更大的DNA池中取回正確的核苷酸序列,重建圖像,而且沒有丟失1個字節(jié)的信息。另一項(xiàng)試驗(yàn)涉及對視頻文件的編碼和讀取。

DNA存儲技術(shù)

華盛頓大學(xué)計(jì)算機(jī)科學(xué)和技術(shù)副教授、論文共同作者路易斯·塞茲(Luis Ceze)在一份聲明中說,“生命產(chǎn)生了神奇的DNA,它能高效地存儲與基因和生命活動有關(guān)的所有信息,而且非常緊湊,非常‘耐用’。我們將把DNA用于數(shù)據(jù)存儲——圖像、視頻、文檔,保存時間可以長達(dá)數(shù)百或數(shù)千年。”

DNA存儲技術(shù)研究進(jìn)展神速

對 DNA數(shù)據(jù)存儲技術(shù)的研究進(jìn)展神速。1999年,研究人員利用DNA存儲技術(shù)編碼和恢復(fù)了一條長23個字母的信息。到2013年,歐洲分子生物學(xué)實(shí)驗(yàn)室- 歐洲生物信息學(xué)研究所的科學(xué)家,把美國黑人運(yùn)動領(lǐng)袖馬丁·路德·金(Martin Luther King)《我有一個夢想》演講的mp3文件編碼在DNA中。

研究人員在發(fā)表在《自然》上的論文中稱,這種編碼方法使得約一杯DNA能存儲至少1億小時的高清視頻。

據(jù)英國研究人員稱,存儲在DNA鏈中的數(shù)據(jù)能保存數(shù)萬年。

在DNA存儲技術(shù)中,讀取DNA相對簡單,主要障礙在于寫DNA。DNA存儲技術(shù)存在兩個難點(diǎn):其一,目前的方法只能合成短鏈DNA;其二,寫和讀DNA都容易出錯。

微軟和華盛頓大學(xué)研究人員稱,他們已經(jīng)開發(fā)了“一種新穎的方法”,把數(shù)據(jù)中的“1”和“0”字符串轉(zhuǎn)換成DNA序列中的4種堿基——腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。

為了訪問存儲的數(shù)據(jù),研究人員在DNA序列中編碼了相當(dāng)于郵政編碼和街道地址的尋址信息。聚合酶鏈反應(yīng)(以下簡稱“PCR”)技術(shù)幫助研究人員更輕松地識別他們需要查找的“郵政編碼”。

研究人員然后利用DNA測序技術(shù),“讀取”數(shù)據(jù),并通過利用“街道地址”對數(shù)據(jù)進(jìn)行整理,將數(shù)據(jù)恢復(fù)成原來的視頻、圖像或文檔。

研究人員表示,“DNA是一種有吸引力的潛在數(shù)據(jù)存儲介質(zhì)”,理論上其存儲密度比磁帶高出8個量級,一個可以拿在手里的磁帶盒存儲容量高達(dá)185TB。

微軟和華盛頓大學(xué)研究人員也證實(shí)了人工合成DNA的“長壽”,稱即使在惡劣環(huán)境中其半衰期也超過500年,磁帶保存時間為10-30年,硬盤為3-5年。

還不夠完美

美國研究人員強(qiáng)調(diào)了提高存儲密度的緊迫性。市場研究公司IDC和存儲設(shè)備廠商EMC在《The Digital Universe》研究論文中稱,到2020年,包含在全球計(jì)算機(jī)、歷史檔案、電影、照片、企業(yè)系統(tǒng)和移動設(shè)備中的數(shù)據(jù)量將達(dá)到44萬億GB,“是 2013年的10倍。盡管并非所有信息都需要保存,但世界生成數(shù)據(jù)的速度快于存儲容量的增長”。

要進(jìn)入商用階段,DNA存儲系統(tǒng)還有一些問題需要解決。首先是DNA合成和測序還遠(yuǎn)不夠完美,DNA存儲系統(tǒng)的一個關(guān)鍵部分是開發(fā)一種適當(dāng)?shù)木幋a技術(shù),通過增加冗余度提高容錯能力。

其次,DNA存儲系統(tǒng)中隨機(jī)存取數(shù)據(jù)還是個問題,讀取延遲遠(yuǎn)長于寫入延遲。目前的技術(shù)只能批量讀取數(shù)據(jù),即使只從存儲系統(tǒng)中訪問一個字節(jié)的信息,系統(tǒng)也必須對整個DNA池進(jìn)行測序和解碼。

把數(shù)據(jù)編碼為DNA序列

研究人員已經(jīng)提出了改進(jìn)隨機(jī)數(shù)據(jù)存取的方法,即利用PCR只擴(kuò)增希望讀取的數(shù)據(jù),并對相應(yīng)的DNA序列測序。這種方法既能提高數(shù)據(jù)讀取速度,也無需對整個DNA池進(jìn)行測序。

塞茲稱,“這是我們在數(shù)據(jù)存儲方面向大自然學(xué)習(xí)的一個范例。”

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version