В России разработана программа для поиска патогенных изменений в малоизученных областях генов
Российские исследователи разработали компьютерную программу, которая повысит эффективность диагностики редких генетических заболеваний. Алгоритм на основе искусственного интеллекта позволяет выявлять патогенные варианты нуклеотидной последовательности в 5`-нетранслируемых областях генов.
Программа, созданная специалистами лаборатории функциональной
геномики подведомственного Минобрнауки России Медико-генетического
научного центра имени академика Н. П. Бочкова (МГНЦ), может применяться в
случаях, когда стандартные методы не приносят результата.
В первую очередь при ДНК-диагностике наследственных заболеваний исследователи ищут патогенные варианты в той части гена, с которой непосредственно происходит трансляция основного белка, кодируемого этим геном. Однако в генах человека также есть последовательности, не участвующие в кодировании белка. Одна из таких — 5`-нетранслируемая область. Она играет важную роль в регуляции активности работы генов, это происходит за счет различных механизмов, среди них — малые открытые рамки считывания (upstream ORFs, uORFs). Это последовательности нуклеотидов, с которых может происходить трансляция, но они находятся перед основной кодирующей частью гена.
По оценкам научного сообщества, более половины генов человека могут иметь такие рамки считывания, но патогенные варианты в них описаны лишь в единичных случаях. Ученые связывают это, с одной стороны, с отсутствием качественного перечня малых открытых рамок считывания в генах человека, а с другой, с отсутствием доступных инструментов для поиска и интерпретации вариантов в них.
Решение таких задач находится в области биоинформатики. Ее методы нацелены на анализ больших объемов данных. Специалисты МГНЦ, Дальневосточного Федерального Университета (ДВФУ), Научно-исследовательского института искусственного интеллекта (AIRI), Института биоинформатики и их иностранные коллеги детально проанализировали около 3600 генов, связанных с наследственными заболеваниями, которые упоминаются в базе данных OMIM. В результате было описано примерно 4,7 тыс. сайтов инициации трансляции — участков, с которых начинается трансляция малых открытых рамок считывания в 1782 генах, ассоциированных с развитием наследственных заболеваний.
«Одним из важнейших результатов работы стало подтверждение того, что у половины генов, связанных с наследственными заболеваниями, существуют малые открытые рамки считывания, — рассказала научный сотрудник лаборатории функциональной геномики МГНЦ Александра Филатова, — до настоящего момента не было создано достаточно качественного списка с координатами uORF в генах человека, что затрудняло поиск патогенных вариантов в них. Наше исследование важно для повышения качества ДНК-диагностики пациентов с наследственными заболеваниями».
Ученые создали собственную модель машинного обучения, которая позволяет находить патогенные варианты в малых открытых рамках считывания. С ее помощью были проанализированы варианты, находящиеся в открытых базах данных HGMD и ClinVar , и найдены те из них, которые приводят к развитию заболевания именно за счет нарушения малых открытых рамок считывания.
Опираясь на проведенный детальный анализ в небольшой части генов, ассоциированных с развитием наследственных заболеваний, компьютерная программа может предсказывать наличие малых открытых рамок считывания во всех остальных генах человека.
Источник: Минобрнауки РФ
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!
Оставить свой комментарий:
Комментарии по материалу
Данный материал еще не комментировался.