Лучший доктор: как ИИ помогает побеждать генетические заболевания

ДНК как носитель информации эффективен только при её чтении, копировании и передаче. Основным посредником в передаче генетической информации из ядра клетки является РНК, которая транскрибируется из ДНК. Учёные из Северо-Западного университета в Эванстоне, штат Иллинойс, используя методы глубокого обучения, смогли разгадать одну из ключевых загадок процесса транскрипции РНК: как клетки определяют, когда следует прекратить копирование.

Точное завершение процесса транскрипции критически важно. Информация, закодированная в РНК, используется клеткой для синтеза белков и регулирования множества метаболических процессов. Передача правильного сообщения требует, чтобы РНК содержала именно столько информации, сколько необходимо – ни больше, ни меньше. Ошибки в этом процессе могут привести к различным заболеваниям, включая эпилепсию и мышечную дистрофию.

Профессор Эмили Кунс Страуп из Северо-Западного университета отмечает: “Это очень полезный инструмент для предварительного скрининга генетических вариантов в условиях высокой пропускной способности”.

Процесс завершения копирования РНК, известный как полиаденилирование (polyA), включает в себя множество белков, взаимодействие между которыми до сих пор не было полностью понято. Для изучения polyA команда исследователей под руководством Жэ Цзи и Эмили Кунс Страуп разработала модель машинного обучения, способную определять места polyA в геноме. Модель сочетает свёрточные нейронные сети, обученные распознавать важные последовательности в генетическом коде, и рекуррентные нейронные сети для анализа выходных данных первых.

В отличие от предыдущих моделей, которые также использовали свёрточные и рекуррентные нейронные сети, исследователи направили выходные данные своей модели в две другие модели глубокого обучения, обученные определять места polyA в геноме. Страуп подчеркивает уникальность этого подхода: “Наша модель выделяет два отдельных выходных потока, которые затем комбинируются для высокоточного определения мест polyA, что отличает нас от других исследований”.

Исследователи выявили важные аспекты, влияющие на успешность или неудачу polyA. Свёрточная часть модели выявила генетические паттерны, привлекающие белки, контролирующие polyA, а рекуррентная часть показала, что для надёжного завершения транскрипции требуется точное расположение этих паттернов. Цзи отмечает: “Удивительно, что наша модель может так точно фиксировать эти процессы”.

В будущем команда планирует применить свою модель и подобные техники для идентификации ключевых генетических мутаций, потенциально вызывающих заболевания, и разработки более целенаправленных лекарственных препаратов. Страуп добавляет: “Это, надеемся, поможет сократить количество потенциальных мутаций, делая процесс более эффективным”.

Команда также планирует воспроизвести свои исследования на других организмах, чтобы увидеть, как меняется транскрипция РНК у разных животных, и использовать эти знания для контроля или предотвращения нарушений в процессах polyA, как в случаях с эпилепсией и мышечной дистрофией.

Результаты исследования опубликованы в журнале Nature .

Public Release.