
DNA存儲(chǔ)密度驚人
北京時(shí)間4月12日消息,據(jù)科技網(wǎng)站Computerworld報(bào)道,微軟和華盛頓大學(xué)研究人員已經(jīng)展示了利用人工合成DNA作為數(shù)據(jù)存儲(chǔ)介質(zhì)的技術(shù)。
研究人員表示,如果這一技術(shù)成熟到適合主流應(yīng)用,裝備當(dāng)今存儲(chǔ)密度最高的存儲(chǔ)設(shè)備、沃爾瑪超市般大小的數(shù)據(jù)中心,就可能“瘦身”到一塊方糖大小,“我們認(rèn)為,考慮把DNA作為存儲(chǔ)介質(zhì),探索相關(guān)系統(tǒng)設(shè)計(jì)問(wèn)題的時(shí)機(jī)已經(jīng)成熟”。
研究團(tuán)隊(duì)成功地將4個(gè)圖片文件的數(shù)據(jù)編碼為人工合成DNA片段的核苷酸序列。更重要的是,他們能實(shí)現(xiàn)逆過(guò)程——從更大的DNA池中取回正確的核苷酸序列,重建圖像,而且沒(méi)有丟失1個(gè)字節(jié)的信息。另一項(xiàng)試驗(yàn)涉及對(duì)視頻文件的編碼和讀取。

DNA存儲(chǔ)技術(shù)
華盛頓大學(xué)計(jì)算機(jī)科學(xué)和技術(shù)副教授、論文共同作者路易斯·塞茲(Luis Ceze)在一份聲明中說(shuō),“生命產(chǎn)生了神奇的DNA,它能高效地存儲(chǔ)與基因和生命活動(dòng)有關(guān)的所有信息,而且非常緊湊,非常‘耐用’。我們將把DNA用于數(shù)據(jù)存儲(chǔ)——圖像、視頻、文檔,保存時(shí)間可以長(zhǎng)達(dá)數(shù)百或數(shù)千年。”
DNA存儲(chǔ)技術(shù)研究進(jìn)展神速
對(duì) DNA數(shù)據(jù)存儲(chǔ)技術(shù)的研究進(jìn)展神速。1999年,研究人員利用DNA存儲(chǔ)技術(shù)編碼和恢復(fù)了一條長(zhǎng)23個(gè)字母的信息。到2013年,歐洲分子生物學(xué)實(shí)驗(yàn)室- 歐洲生物信息學(xué)研究所的科學(xué)家,把美國(guó)黑人運(yùn)動(dòng)領(lǐng)袖馬丁·路德·金(Martin Luther King)《我有一個(gè)夢(mèng)想》演講的mp3文件編碼在DNA中。
研究人員在發(fā)表在《自然》上的論文中稱(chēng),這種編碼方法使得約一杯DNA能存儲(chǔ)至少1億小時(shí)的高清視頻。
據(jù)英國(guó)研究人員稱(chēng),存儲(chǔ)在DNA鏈中的數(shù)據(jù)能保存數(shù)萬(wàn)年。
在DNA存儲(chǔ)技術(shù)中,讀取DNA相對(duì)簡(jiǎn)單,主要障礙在于寫(xiě)DNA。DNA存儲(chǔ)技術(shù)存在兩個(gè)難點(diǎn):其一,目前的方法只能合成短鏈DNA;其二,寫(xiě)和讀DNA都容易出錯(cuò)。
微軟和華盛頓大學(xué)研究人員稱(chēng),他們已經(jīng)開(kāi)發(fā)了“一種新穎的方法”,把數(shù)據(jù)中的“1”和“0”字符串轉(zhuǎn)換成DNA序列中的4種堿基——腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。
為了訪(fǎng)問(wèn)存儲(chǔ)的數(shù)據(jù),研究人員在DNA序列中編碼了相當(dāng)于郵政編碼和街道地址的尋址信息。聚合酶鏈反應(yīng)(以下簡(jiǎn)稱(chēng)“PCR”)技術(shù)幫助研究人員更輕松地識(shí)別他們需要查找的“郵政編碼”。
研究人員然后利用DNA測(cè)序技術(shù),“讀取”數(shù)據(jù),并通過(guò)利用“街道地址”對(duì)數(shù)據(jù)進(jìn)行整理,將數(shù)據(jù)恢復(fù)成原來(lái)的視頻、圖像或文檔。
研究人員表示,“DNA是一種有吸引力的潛在數(shù)據(jù)存儲(chǔ)介質(zhì)”,理論上其存儲(chǔ)密度比磁帶高出8個(gè)量級(jí),一個(gè)可以拿在手里的磁帶盒存儲(chǔ)容量高達(dá)185TB。
微軟和華盛頓大學(xué)研究人員也證實(shí)了人工合成DNA的“長(zhǎng)壽”,稱(chēng)即使在惡劣環(huán)境中其半衰期也超過(guò)500年,磁帶保存時(shí)間為10-30年,硬盤(pán)為3-5年。
還不夠完美
美國(guó)研究人員強(qiáng)調(diào)了提高存儲(chǔ)密度的緊迫性。市場(chǎng)研究公司IDC和存儲(chǔ)設(shè)備廠(chǎng)商EMC在《The Digital Universe》研究論文中稱(chēng),到2020年,包含在全球計(jì)算機(jī)、歷史檔案、電影、照片、企業(yè)系統(tǒng)和移動(dòng)設(shè)備中的數(shù)據(jù)量將達(dá)到44萬(wàn)億GB,“是 2013年的10倍。盡管并非所有信息都需要保存,但世界生成數(shù)據(jù)的速度快于存儲(chǔ)容量的增長(zhǎng)”。
要進(jìn)入商用階段,DNA存儲(chǔ)系統(tǒng)還有一些問(wèn)題需要解決。首先是DNA合成和測(cè)序還遠(yuǎn)不夠完美,DNA存儲(chǔ)系統(tǒng)的一個(gè)關(guān)鍵部分是開(kāi)發(fā)一種適當(dāng)?shù)木幋a技術(shù),通過(guò)增加冗余度提高容錯(cuò)能力。
其次,DNA存儲(chǔ)系統(tǒng)中隨機(jī)存取數(shù)據(jù)還是個(gè)問(wèn)題,讀取延遲遠(yuǎn)長(zhǎng)于寫(xiě)入延遲。目前的技術(shù)只能批量讀取數(shù)據(jù),即使只從存儲(chǔ)系統(tǒng)中訪(fǎng)問(wèn)一個(gè)字節(jié)的信息,系統(tǒng)也必須對(duì)整個(gè)DNA池進(jìn)行測(cè)序和解碼。

把數(shù)據(jù)編碼為DNA序列
研究人員已經(jīng)提出了改進(jìn)隨機(jī)數(shù)據(jù)存取的方法,即利用PCR只擴(kuò)增希望讀取的數(shù)據(jù),并對(duì)相應(yīng)的DNA序列測(cè)序。這種方法既能提高數(shù)據(jù)讀取速度,也無(wú)需對(duì)整個(gè)DNA池進(jìn)行測(cè)序。
塞茲稱(chēng),“這是我們?cè)跀?shù)據(jù)存儲(chǔ)方面向大自然學(xué)習(xí)的一個(gè)范例。”
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷(xiāo),低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 個(gè)人站長(zhǎng)消亡論?從“消失”到“重生”的三大破局路徑
- raksmart法蘭克福云服務(wù)器延遲高嗎?
- 常見(jiàn)的海外站群服務(wù)器有哪些?地區(qū)選擇與核心優(yōu)勢(shì)解析
- 如何監(jiān)控RAKsmart CDN的性能?
- 華納云高防服務(wù)器3.6折起低至1188元/月,企業(yè)級(jí)真實(shí)防御20G`T級(jí),自營(yíng)機(jī)房一手服務(wù)器資源
- 選擇站群VPS時(shí)必須關(guān)注的六大核心需求
- RakSmart法蘭克福數(shù)據(jù)中心優(yōu)勢(shì)與適用場(chǎng)景