成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DNA存儲,拯救人類數據危機的良方?

新聞 數據庫運維
DNA 絕對是這個星球上最古老的生命信息存儲工具,同樣也可以作為數據信息的存儲介質,且存儲密度和使用壽命要遠遠超出現有的磁盤式的存儲方案。因此,DNA 存儲,正在被人類視為數據存儲的未來,成為拯救人類數據存儲危機的最好的替代方案。

[[323172]]

  開一個腦洞:如果地球正在面臨一場馬上到來的毀滅性星際災害,人類又想盡可能地保存地球的生命和文明,在現有條件下,該怎么辦?

  像大劉一樣讓地球停止自轉然后逃離太陽系,這恐怕來不及了。而如果像諾亞方舟一樣,一股腦把人類、動植物和人類的知識搬運到飛船上,現有的火箭運載能力,恐怕也裝不下這些物質的億萬分之一。

  如果想盡可能多、盡可能長久地保存地球的生物,我們只需要把所有物種的 DNA 序列信息收集打包,在飛船的低溫環境下便可以保存長達數十萬年;而人類文明的信息呢?我們知道這些信息最高效的形式就是數據,而這些數據主要存儲在硬盤和光盤當中的。

  想想這些硬盤儲存器的重量和數據密度,我們不得不再一次氣餒。更何況,可能飛船還沒逃出太陽系,這些數據就會因為硬盤或光盤的壽終正寢而丟失。

  那么 DNA 能不能當做硬盤來存儲數據信息呢?答案是,可以的。

  DNA 絕對是這個星球上最古老的生命信息存儲工具,同樣也可以作為數據信息的存儲介質,且存儲密度和使用壽命要遠遠超出現有的磁盤式的存儲方案。因此,DNA 存儲,正在被人類視為數據存儲的未來,成為拯救人類數據存儲危機的最好的替代方案。

  DNA 存儲具體是怎么做到的呢?現在發展到那一階段?商用的話還有哪些阻礙?這需要我們一一解答。

  DNA 存儲是如何工作的? 

  在了解 DNA 存儲是如何工作的之前,我們簡單了解下磁存儲和光存儲這兩種現有的解決方案的原理。

  磁存儲的原理就是在金屬材料上涂上磁性介質,在通電的情況下形成電磁效應,可以進行存儲和表達 0101 的二進制信息。磁存儲的硬盤的優點是錄入和讀取的速度快,缺點是與體積重量相比,數據密度較低。經過 60 年發展,大概可以在 3.5 英寸大小的硬盤驅動上存儲 3TB 數據。

  光存儲的原理是將數字編碼的視頻和音頻儲刻錄在光盤表面的凹槽中,再通過激光將這些凹槽中的數據讀取出來,進行轉存或播放。當前,光存儲也正在經歷存儲的極限。因為想要存下更多的數據,凹槽就必須越小、越緊湊,要求激光的精度也越高。目前,單層藍光光盤能夠保存 25GB 以上的信息,另一種紫外線激光如果研制成功,其光盤容量可以達到 500GB 的容量。

[[323173]]

  相對于磁存儲和光存儲而言,DNA 存儲有哪些優勢?

  首先,就是節約空間。但這些單層平鋪式的存儲方式,比起 DNA 的雙螺旋立體結構來說,其存儲量就有了多個數量級的差距。DAN 本身的物理體積極小且又是立體結構,單位空間的數據密度非常高。舉個簡單的例子,1 克 DNA 不到指尖上一滴露珠大小,卻能夠儲存 700TB 的數據,相當于 1.4 萬張 50GB 容量的藍光光盤,或 233 個 3TB 的硬盤(差不多 151KG 重)。

  再則,非常節能。現有存儲方式,比如說一個數據中心,要消耗大量的單晶硅,還要消耗大量的電。而 DNA 物質只需保存在陰涼、干燥的地方就可以,基本不需要額外的人工維護。就算需要把 DNA 冷凍起來,消耗的資源和能源也幾乎可以忽略不計。

  此外,最重要的一點就是,保存時間非常久。現在高密度的存儲器都會隨著時間推移而衰減,能存儲時間最長的工具是磁帶,其壽命也就 50 年,其他的存儲器壽命更短。比較而言,DNA 則保質期就以百年計算了,如果將其冷凍起來,能保存幾千甚至上萬年。

  看來人類文明的拯救方案有了,但 DNA 存儲到底是如何做到的呢?

  眾所周知,DNA 由四種含氮堿基——A、T、C和G互補配對構成,科學家將腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)分別賦予二進制值(A和C=0 ,G和T=1),隨后通過微流體芯片對基因序列進行合成,從而使該序列的位置與相關數據集相匹配。這樣就把這些堿基對編碼成 1 和 0 的組合,就可以用 DNA 的序列信息來表達二進制的語言了。

  當每次將二進制語言寫進 DNA 序列當中,就可以把“DNA 硬盤”放到低溫環境中進行保存。而需要讀取數據的時候,只用對目標 DNA 進行測序,將堿基對還原成二進制編碼,再完成解碼,就可以還原為我們常見的數據了。

  原理是非常簡單,但科學家是如何做到的呢?這就要簡單回顧下 DNA 存儲技術的發展史了。

  DNA 存儲是如何一步步發展到現在的?

  最先想到這一方法的是一位藝術家 Joe Davis,他在 1988 年與哈佛研究人員合作,把一個取名為 Microvenus(小維納斯)的7*5 像素矩陣的照片,轉化成 35 個堿基的 DNA 序列,插入到大腸桿菌里,第一次把不屬于自然演化的信息寫進了在 DNA 當中。

(Microvenus 代表女性和地球)

  2010 年,美國合成生物學家克雷格·文特爾((Craig Venter)帶領研究團隊化學合成了整個支原體基因組 DNA,取名為“辛西婭(Synthia)”,并以“自娛自樂”的方式將課題研究者的名字、研究所網址和愛爾蘭詩人詹姆斯的詩句等信息編碼進新合成的 DNA 中。

  2011 年,哈佛大學的合成生物學家喬治·丘奇(George Church)和加州大學的瑟里·庫蘇里(Sriram Kosuri)領導的團隊以及約翰·霍普金斯大學的基因組專家高原(Yuan Gao)首次進行了概念證明性實驗。團隊使用短 DNA 片段編碼了一本丘奇的 659KB 數據的書。

  2013 年,歐洲生物信息研究所(EBI)的尼克·高德曼(Nick Goldman)和他的研究團隊也成功地將包括莎士比亞十四行詩和馬丁·路德·金“我有一個夢想”的演講片段、一篇沃森和克里克 DNA 雙螺旋論文副本等 5 個文件編寫進了 DNA 片段里當中。739KB 數據成為當時最大的 DNA 存儲文件。

  2016 年,微軟和華盛頓大學又利用 DNA 存儲技術完成了約 200MB 數據的存儲,成為 DNA 信息存儲技術的一個飛躍。

  2017 年 7 月,《自然》雜志發表了哈佛大學醫學院的賽斯·希普曼(Seth Shipman)和喬治·丘奇合作的一項活體 DNA 存儲的研究。他們把一部 130 年前的黑白電影《奔跑中的馬》存在了大腸桿菌的 DNA 上。雖然大腸桿菌體內有一段“奇怪的 DNA”,不僅能夠正常生存,還可以正常遺傳,每次繁衍都是一次數據復制。而且存儲在基因組中的電影,在每一代大腸桿菌中也都完整無缺地保存下來了。

  但因為細胞的復制、分裂以及死亡,會造成信息出錯的風險,未來數據安全,大多數情況下存儲信息的 DNA 都是以 DNA 干粉的形式存在,活體細胞存儲的研究轉向合成 DNA 存儲。

  同一年,哥倫比亞大學和紐約基因組中心在《科學》雜志發表了一項稱為“DNA 噴泉”算法高效的 DNA 存儲策略。這項技術展示了最大化利用 DNA 的存儲潛力,成功將海量信息壓縮至 DNA 的四個堿基,即為每個 DNA 編碼 1.6 比特(bits)的數據,比之前多存儲了 60% 的信息,逼近理論極限(1.8 比特)。該方法能夠將 215PB 數據存儲在一克 DNA 中,相當于 2.2 億部電影。

  2018 年,愛爾蘭沃特福德理工學院(WIT)研究人員開發出一種新型 DNA 存儲方法,可在 1 克大腸桿菌 DNA 中存儲 1ZB 的數據。

  2019 年,丘奇團隊又在《科學》期刊上發表了一項實驗結果。他們將丘奇的一本大約 5.34 萬個單詞《再生:合成生物學將如何改變未來的自然和自己》的書,以及 11 張圖片和一段 Java 程序,編碼進不到億萬分之一克的 DNA 微芯片,再成功利用 DNA 測序來閱讀這本書。

  這些科研的快速發展也意味著 DNA 合成技術(數據寫入)和 DNA 測序技術(數據讀取)正走向成熟。但同時,DNA 編碼過程仍然存在著存儲/讀取速度和成本等問題,DNA 存儲離商業化還在路上。

  DNA 存儲商業化的問題與進展

  在實驗室里,看起來 DNA 存儲并不復雜,但是在商業化上面,仍然還面臨著一些問題。 

  首先,存儲和讀取的速度都很慢。DNA 存儲設備的訪問速度很慢,存取也很費時間。相比較磁盤存儲的電磁信號,DNA 合成卻要依賴于一系列化學反應。用磁盤寫入 200MB 數據,不用 1 秒,用 DNA 合成差不多得需要 3 周的時間。

  其次,DNA 介質不能覆蓋和重寫。在 DNA 里,一旦把信息存進去,一般來說不能修改。想讀取這個文檔,需要把全部信息完全測序出來再轉碼。

  第三,數據存儲的準確性有待提高。目前 DNA 測序時的重復讀取導致讀錯概率較大。

  第四,隨機讀寫困難。目前 DNA 合成技術無法一次性產生較長的 DNA 分子,只能合成眾多的短片段。這使得在眾多 DNA 小片段組成的混合物當中,快速調取特定數據存在困難。

  最后,也是最重要的,DNA 存儲成本太高了。比如目前 DNA 存儲 200MB 數據,需要耗資 80 萬美元,而用電子設備,成本連 1 美元都不到。

  但正如上面所說,如果放到更長的時間尺度上和數據存儲空間壓力下,DNA 具有的大存儲密度、高節能環保、超長穩定性的獨特優勢就顯現出來了。只要隨著存儲和讀取技術的發展,DNA 編碼和測序的效率提升,成本大幅下降,DNA 存儲離商業化應用也就不遠了。

  那么,現在在商業化上有哪些進展呢?

  在 2015 年,微軟公司和華盛頓大學合作發表了一個成果,采用定點讀取信息,也就是給一個長長的 DNA 鏈里加入一些追蹤標記。這些類似索引機制的標記,可以不用每次等測序完整 DNA 長鏈,就能選取合適的標記進行讀取。

  2018 年,讀取技術又實現突破,微軟研發了“納米孔”讀取技術,讓 DNA 介質列能擠過一個很小的納米孔而讀取其中每個 DNA 堿基。這一技術讓大大縮小了讀取設備的空間開支,一個手掌大小的 USB 設備就能進行讀取,但讀取速度在每秒幾 KB 左右,可以說仍然相當慢。

  2019 年 3 月,微軟團隊在《自然》雜志發表一項新的進展,他們開發了世界上第一個自動 DNA 存儲介質。相比較于手動操作進行 DNA 的合成和測序,能夠自動化方式進行 DNA 編解碼才是未來商業化的出路。

  另外,關于 DNA 存儲和讀取時長以及成本的問題,一家 2016 年成立的美國初創公司 Catalog 也正試圖嘗試解決。

  去年,Catalog 將一共 16G 的維基百科英文版文本存儲在了一個 DNA 分子上。他們使用了一臺 DNA 書寫器設備,以 4Mbps 的速度在 DNA 中記錄這些數據。這意味著在一天內可以記錄 125GB,大約相當于高端手機可以存儲的容量。這一速度已經是之前研究所存儲速度的三倍。

[[323176]]

  目前,Catalog 使用了由 20 到 30 個堿基對長預制合成 DNA 鏈,通過酶嵌套在一起,可以存儲更多的數據。這些片段的排列就像英語使用 26 個字母一樣,理論上可以創造出無數的組合。據 Catalog 估計,未來進行 1MB 數據 DNA 存儲成本將不到 0.001 美分。

  當然,如果未來這家創業公司真的能夠將成本大幅降下來,那么確實有可能為 DNA 數據存儲的商業化鋪平道路。

  在 2019 年,《科學美國人》與世界經濟論壇聯合發布的當年全球十大新興技術中, DNA 數據儲存技術名列其中。

  可以預見,磁存儲和光存儲方式在未來一段時間仍將占據數據存儲方式的主流。不過,即使我們不會出現地球末日這種極端情況,因為近幾年數據激增,人類也正面臨數據存儲空間不足的嚴峻問題。同時,數據存儲需求激增,帶來的是硅晶片使用量的激增,以及由此引發的環境污染問題、水資源和能源消耗等問題。

  DNA 存儲技術的實現,一定程度將緩解傳統存儲的容量問題,并大幅減少電子元件和能源的消耗。

  當然,在存取技術上和成本控制上,DNA 存儲為代表的碳基存儲方式還有很長的道路要走,但隨著商業化的進展,其規模普及速度也會加快。從數據存儲的歷史來看,存儲媒介的變化是一個不斷變化且加速的過程,DNA 存儲也應該成為我國關注和研究的技術方向。

 

責任編輯:張燕妮 來源: 博客園
相關推薦

2022-03-30 14:00:49

人工智能災害機器

2018-10-11 10:50:02

存儲數據安全

2018-11-16 10:06:57

數據對象存儲

2023-12-26 14:56:59

模型訓練

2017-08-31 16:17:23

2013-05-10 09:39:11

大數據

2020-10-09 11:18:57

戴爾

2023-07-06 13:53:46

智能AI

2021-02-03 13:20:26

人工智能機器人科學

2020-05-07 12:09:48

新冠疫情物聯網IOT

2020-06-23 07:00:00

DNA數據存儲

2018-09-11 11:03:45

存儲新方式DNA存儲

2015-07-09 09:53:14

程序員女生

2021-06-16 15:03:41

技術研發DNA

2015-06-08 10:22:40

基因亞馬遜谷歌

2011-10-19 16:41:44

云計算國藥ERP

2021-05-12 14:44:28

大數據數據鏈博睿數據

2021-04-14 15:59:50

博睿數據金融科技APM

2009-05-08 13:46:38

JavaScriptHTML5離線存儲

2009-03-24 19:01:00

存儲虛擬化經濟危機
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品久久国产高清情趣图文 | 欧美日韩中文字幕在线 | 欧美日韩网站 | av在线免费观看网站 | 欧美特级黄色 | 日韩高清中文字幕 | 95国产精品 | 久久69精品久久久久久久电影好 | 高清视频一区 | 久久另类| 精品三区| 亚洲天堂中文字幕 | 中文字幕一级 | 国产亚洲日本精品 | 成人在线视频免费观看 | 久久国产精品免费一区二区三区 | 国产99视频精品免费视频7 | 在线看片福利 | 国产精品久久久久无码av | 黄色一级免费观看 | 在线不卡av | 日本精品一区二区三区在线观看 | 国产精品成人一区二区三区 | 高清av在线 | 久久人人网 | 精品国产乱码久久久久久丨区2区 | 国产成人精品a视频一区www | 色影视| www.亚洲一区二区 | 中文字幕综合 | 久久av一区 | 午夜资源 | 亚洲综合色婷婷 | 中文在线一区 | 中文字幕视频一区 | 欧美成人a | 日韩视频1 | 亚洲综合色视频在线观看 | 一级毛片视频免费观看 | 日韩国产一区二区三区 | 欧美精品一区二区三区在线播放 |