Rambler's Top100
Реклама
 
Все новости Новости отрасли

В России разработана программа для поиска патогенных изменений в малоизученных областях генов

20 февраля 2023

Российские исследователи разработали компьютерную программу, которая повысит эффективность диагностики редких генетических заболеваний. Алгоритм на основе искусственного интеллекта позволяет выявлять патогенные варианты нуклеотидной последовательности в 5`-нетранслируемых областях генов. 

Программа, созданная специалистами лаборатории функциональной геномики подведомственного Минобрнауки России Медико-генетического научного центра имени академика Н. П. Бочкова (МГНЦ), может применяться в случаях, когда стандартные методы не приносят результата.

В первую очередь при ДНК-диагностике наследственных заболеваний исследователи ищут патогенные варианты в той части гена, с которой непосредственно происходит трансляция основного белка, кодируемого этим геном. Однако в генах человека также есть последовательности, не участвующие в кодировании белка. Одна из таких — 5`-нетранслируемая область. Она играет важную роль в регуляции активности работы генов, это происходит за счет различных механизмов, среди них — малые открытые рамки считывания (upstream ORFs, uORFs). Это последовательности нуклеотидов, с которых может происходить трансляция, но они находятся перед основной кодирующей частью гена.

По оценкам научного сообщества, более половины генов человека могут иметь такие рамки считывания, но патогенные варианты в них описаны лишь в единичных случаях. Ученые связывают это, с одной стороны, с отсутствием качественного перечня малых открытых рамок считывания в генах человека, а с другой, с отсутствием доступных инструментов для поиска и интерпретации вариантов в них.

Решение таких задач находится в области биоинформатики. Ее методы нацелены на анализ больших объемов данных. Специалисты МГНЦ, Дальневосточного Федерального Университета (ДВФУ), Научно-исследовательского института искусственного интеллекта (AIRI), Института биоинформатики и их иностранные коллеги детально проанализировали около 3600 генов, связанных с наследственными заболеваниями, которые упоминаются в базе данных OMIM. В результате было описано примерно 4,7 тыс. сайтов инициации трансляции — участков, с которых начинается трансляция малых открытых рамок считывания в 1782 генах, ассоциированных с развитием наследственных заболеваний.

«Одним из важнейших результатов работы стало подтверждение того, что у половины генов, связанных с наследственными заболеваниями, существуют малые открытые рамки считывания, — рассказала научный сотрудник лаборатории функциональной геномики МГНЦ Александра Филатова, — до настоящего момента не было создано достаточно качественного списка с координатами uORF в генах человека, что затрудняло поиск патогенных вариантов в них. Наше исследование важно для повышения качества ДНК-диагностики пациентов с наследственными заболеваниями».

Ученые создали собственную модель машинного обучения, которая позволяет находить патогенные варианты в малых открытых рамках считывания. С ее помощью были проанализированы варианты, находящиеся в открытых базах данных HGMD и ClinVar , и найдены те из них, которые приводят к развитию заболевания именно за счет нарушения малых открытых рамок считывания.

Опираясь на проведенный детальный анализ в небольшой части генов, ассоциированных с развитием наследственных заболеваний, компьютерная программа может предсказывать наличие малых открытых рамок считывания во всех остальных генах человека.

Источник: Минобрнауки РФ

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Оставить свой комментарий:

Для комментирования необходимо авторизоваться!

Комментарии по материалу

Данный материал еще не комментировался.