Перевести на Переведено сервисом «Яндекс.Перевод»

ДНК-НАКОПИТЕЛЬ

Ученые уже давно говорят о том, что ДНК может стать идеальным хранилищем информации: она плотная, стабильная, и ее легко скопировать.

Как будет развиваться индустрия хранения данных на ДНК


Знаменитое стихотворение американского поэта Роберта Фроста «Другая дорога» состоит из 144 слов и умещается на одной странице. Оно может также поместиться в файле размером 1 килобайт. Или даже в нескольких каплях воды внутри пробирки, если за дело возьмутся ученые. Точнее, не совсем в самой воде, а в том, что находится внутри нее – невидимых плавающих цепочках ДНК.

Ученые уже давно говорят о том, что ДНК может стать идеальным хранилищем информации: она плотная, стабильная, и ее легко скопировать. За последние несколько лет исследователи записали на ДНК множество разных данных, например, «Войну и мир» Льва Толстого, песню Smoke on the Water группы Deep Purple, гифку с бегущей лошадью. Но чтобы ДНК смогла заменить существующие кремниевые и магнитные накопители, ей нужно стать дешевле и понятнее для записи, считывания и хранения.

Именно этим вопросом и занимается Хьенджун Парк и его коллеги из стартапа Catalog, которому впервые удалось записать стихотворение на ДНК полтора года назад. Сейчас они разрабатывают машину, которая сможет записывать терабайт данных в день с помощью 500 триллионов молекул ДНК. (Так написано и в этом в тексте, и в оригинале статьи. Скорее всего, следует читать не «молекул ДНК», а «нуклеотидов» – ВМ.) Через несколько лет исследователи планируют запустить корпоративные услуги записи данных на ДНК для IT-компаний, индустрии развлечений и правительства. Этот проект Массачусетского технологического института – не единственный, кто работает в этой сфере. Такие крупные компании, как Microsoft, Intel и Micron, финансируют собственные проекты по хранению данных в ДНК.

Если все получится, то такой вид хранения сможет решить уникальную проблему XXI века, связанную с переизбытком информации. Пять лет назад человечество произвело 4,4 зеттабайта данных, к 2025 году это количество увеличится до 160 зеттабайт. Современная инфраструктура способна справиться лишь с малой частью будущего объема данных, который к 2040 году может занять все микросхемы в мире.

Большинство цифровых архивов, где есть все – от музыки до снимков из космоса и данных об исследованиях, – хранятся на магнитной ленте. Это дешевый накопитель, который приходится менять примерно каждые 10 лет.

«Современные технологии уже приблизились к физическим границам масштабирования, – считает Виктор Жирнов, ведущий исследователь компании Semiconductor Research Corporation. – Плотность хранения данных в ДНК в несколько раз выше, чем у любой другой известной технологии хранения».

Представьте, что вы хотите сохранить все существующие в мире фильмы в ДНК. Получится хранилище размером с кубик сахара. И такое хранилище может существовать 10 тысяч лет.

Главное опасение вызывает цена. За последние несколько лет стоимость секвенирования (то есть считывания ДНК) снизилась, но запись по-прежнему обходится дорого. Запись одной минуты качественного стереозвука стоит около $100 тысяч.

Исследователи Catalog считают, что они смогут снизить эти цены. Традиционный метод разбивает секвенцию на биты – единицы и нули, – которые накладывают на четыре базовых соединения ДНК. В 2016 году, когда Microsoft смогла записать 200 мегабайт данных в цепочке ДНК, компания использовала 13448372 уникальных кусочка ДНК. Catalog же хочет сгенерировать огромное количество одинаковых молекул ДНК, не длиннее 30 пар оснований. Затем ученые используют миллиарды энзимных реакций, чтобы зашифровать информацию в образцы рекомбинаций заготовленных кусочков ДНК. Вместо того чтобы накладывать один бит на одну пару оснований, биты будут распределяться по многомерным матрицам, и каждый набор молекул будет представлять свое положение в каждой матрице.

«Если представить данные в виде книги, то вы можете записать информацию, скопировав ее от руки, – сказал Парк. Вместо того чтобы переводить каждую букву в нужный формат, Catalog сделает печатный пресс, где каждая литера будет представлена молекулой ДНК. – Переставляя эти заготовленные молекулы разным образом, мы можем сложить все слова в том же порядке, что и было в книге».

В случае успеха эта технология позволит сохранять данные, чья сохранность необходима по юридическим причинам, например, редкие записи с камеры наблюдения, медицинские данные и исторические правительственные документы. В начале следующего года Catalog планирует провести тестовый коммерческий запуск своего проекта – в первую очередь стартап ориентируется на разведслужбы, управления космических исследований, а также IT-сектор и Голливуд.

Молекулярным хранением данных занимается и Управление перспективных исследовательских проектов Министерства обороны США (DARPA). В прошлом году оно выделило $15,3 миллиона на исследования биохимических способов хранения двоичного кода. Крупные технологические компании тоже начали разрабатывать проекты в этой области. К 2020 году Microsoft планирует запустить рабочий прототип ДНК-хранилища в одном из своих дата-центров.

По словам Дага Кармина из отдела исследований Microsoft, подобное хранилище сначала будет доступно «элитным» клиентам, которым нужно хранить не менее нескольких гигабайт и петабайт данных. Долгосрочные планы еще более амбициозны. «Мы собираемся полностью заменить магнитные накопители, – сказал он. Кармин верит, что этот переход случится довольно скоро благодаря растущему интересу в потребительской генетике и синтетической биологии. – Людям становится проще получить доступ к своей ДНК, так почему бы не дать им возможность считывать любые данные, записанные в ней?».

Вероника Елкина, Rusbase, по материалам WIRED:  The Rise of DNA Data Storage

Портал «Вечная молодость» http://vechnayamolodost.ru

Войдите или зарегистрируйтесь на сайте, чтобы добавить комментарий к интересующей вас научной проблеме!
Комментарии (0)