Какие данные будут хранить в Национальной базе генетической информации
До 1 сентября 2025 года в России заработает Национальная база генетической информации. Данные для нее на первом этапе должны будут предоставить более 60 организаций, которые ведут научно-исследовательскую деятельность в области генетических технологий. Из года в год база данных будет расширяться: в 2025-м объем данных должен составить 1 петабайт (это 1 тыс. терабайтов), в 2027-м — 10 петабайтов, а в 2030-м — 35 петабайтов. Оператором системы выступает Национальный исследовательский центр «Курчатовский институт».
Это не просто какой-то склад информации. Биология в целом, как и генетика в частности, — это наука о данных. Поэтому нам важно как консолидировать в одном месте информацию, так и создавать, развивать алгоритмы, которые эту информацию обрабатывают.
Максим Патрушев
руководитель Курчатовского геномного центра НИЦ «Курчатовский институт»
Президент России Владимир Путин предложил разработать единую базу генетической информации еще в 2020 году, а в конце декабря 2022-го — подписал закон о ее создании. В документах говорится, что цель такой системы — обеспечить национальную безопасность, охрану жизни и здоровья граждан, а также суверенитета в сфере хранения и использования генетических данных.
Сейчас во всем мире генетические, биотехнологии идут вперед очень быстрыми темпами, и основу для нашей конкурентоспособности в этих областях нужно формировать на десятилетия вперед. Успех генетических исследований во многом определяют цифровые технологии, доступ к массивам данных. Чем больше их объем, тем достовернее, надежнее результаты. Речь о том, чтобы на основе единых стандартов обеспечить защиту данных, их хранение и передачу, разработку программных средств поиска, анализа и моделирования информации.
Владимир Путин
В базе будут хранить генетическую информацию по всему многообразию биообразцов, включая:
- растения;
- животных;
- сельскохозяйственные растения и сельскохозяйственных животных;
- микроорганизмы дикой природы и промышленные микроорганизмы;
- вирусы и особо опасные патогенные микроорганизмы;
- генетические данные человека (исключая персонифицированные).
Предлагая разработать базу генетической информации, Путин подчеркнул, что необходимо «надежно защитить персональные данные граждан». И эксперты объясняют, что генетические данные в системе будут неперсонифицированы, то есть зашифрованы — на их основе нельзя будет идентифицировать человека, которому они принадлежат.
Зачем нужна единая база генетической информации
До сих пор в России не было единой цифровой системы с генетической информацией: уникальные коллекции данных есть в научных институтах по всей стране, но централизованный доступ к ним не обеспечен, все источники функционируют независимо друг от друга. Общедоступная система же призвана облегчить обмен информацией и ускорить генетические исследования, говорят в Минобрнауки. РБК уточняет, что исследователи смогут не делать лишнюю работу и использовать те образцы, которые уже были секвенированы коллегами. Секвенирование — это расшифровка и запись генетического кода в текстовом виде.
Человеческий геном изучают для оценки предрасположенности организма к заболеваниям и анализа их происхождения, а исследования в сфере сельского хозяйства, например, помогают повышать качество и безопасность продукции.
Современные технологии, такие как геномная селекция, позволяют достигать ранее недоступных результатов в выведении новых сортов культур. С этой точки зрения Национальная база генетической информации может стать ценным ресурсом, систематизирующим данные о генофондах растений, животных и микроорганизмов.
Александр Ракитько
директор по науке Genotek
У кого будет доступ к генетическим данным
Национальная база генетической информации для всех будет бесплатной. Но в зависимости от уровня доступа она поделена на три уровня:
- открытый — доступ к нему смогут получить все желающие;
- конфиденциальный — доступ получат пользователи, которые прошли авторизацию через Единую систему идентификации и аутентификации;
- специальный — для тех, кто имеет право доступа к ограниченной информации или информации, содержащей гостайну.
Приоритет для доступа в базу будет отдаваться генетикам, отмечают власти. Предполагается, что она не будет массовой, поскольку в стране не так много специалистов в этой сфере. Но система может заинтересовать также врачей, занимающихся генетическими заболеваниями, химиков, фармацевтов и представителей бизнеса, которые инвестируют в генетику.
Какие базы генетических данных уже есть в России
В 2009 году в России создали Федеральную базу данных геномной информации, ее разработчик и главный оператор — МВД России. По данным на 2020-й, в ней содержатся порядка 965 тыс. ДНК-профилей правонарушителей — для них геномная регистрация обязательна. В 2019 году заработала первая в стране Национальная ассоциация биобанков и специалистов по биобанкированию (НАСБио) — ее создали для того, чтобы наладить взаимодействие между биобанками и изучать более эффективные методы лечения заболеваний.

А в январе 2024 года «Роснефть» заявила, что создала крупнейшую в России базу геномов человека «100 000+Я». Задача проекта — расшифровать геном 100 тыс. россиян для развития диагностики генетических заболеваний, разработки новых подходов к их лечению и создания соответствующих препаратов. С 2022-го специалистам удалось взять 34 тыс. генетических образцов, и к началу 2024-го свои генетические портреты получили 14 тыс. человек.
Фото обложки: Антон Новодережкин / ТАСС