Учёные из EvolutionaryScale, компании, созданной бывшими исследователями Meta, представилиновую искусственную интеллект-модель ESM3, которая способна создавать белки с нуля. Модель работает по принципу предсказания последовательностей, аналогично тому, как ChatGPT генерирует текст. Исследование опубликовано 2 июля в базе данных bioRxiv .
Новые возможности синтетической биологии
Модель ESM3 позволяет разрабатывать белки, не встречающиеся в природе, что открывает широкие перспективы для синтетической биологии. В частности, учёные смогли создать новый флуоресцентный белок, который на 58% отличается от естественных аналогов. Этот белок светится в новом оттенке зелёного и был назван “esmGPF”.
Сравнение с ChatGPT
ESM3 является крупной языковой моделью, аналогичной GPT-4 от OpenAI, и была обучена на 2,78 миллиарда белков. Модель извлекает информацию о последовательности, структуре и функции белков, а затем предсказывает недостающие фрагменты. Таким образом, ESM3 не только прогнозирует существующие белки, но и генерирует новые с заданными функциями.
Прорыв в исследовании белков
В 2022 году команда из Meta представила предшественника ESM3 – EMSFold , который предсказывал структуры микробных белков. В том же году компания DeepMind анонсировала свою модель AlphaFold3, способную предсказывать структуры 200 миллионов белков. Однако все эти модели имели ограничения , и их предсказания нуждались в подтверждении.
Преимущества ESM3
Модель ESM3 используетинформацию о 771 миллиарде уникальных белков и способна генерировать белки с особыми функциями. Это позволяет значительно ускорить процесс поиска и создания белковых структур, который в противном случае был бы медленным и дорогостоящим.
Пример создания нового белка
В ходе исследования учёные запросили модель на создание нового флуоресцентного белка. ESM3 сгенерировала 96 вариантов белков, из которых был выбран наиболее отличающийся от естественных. Этот белок оказался в 50 раз менее ярким, чем естественные аналоги, но последующие итерации модели привели к созданию более яркого белка “esmGPF”.
Потенциал для различных отраслей
Технология ESM3 может найти применение в различных областях, от разработки новых лекарств до создания химических веществ для разрушения пластика. Малая версия модели уже доступна по некоммерческой лицензии, а большая будет предоставлена коммерческим исследователям.
Заключение
Разработка ESM3 представляет собой значительный шаг вперёд в области синтетической биологии и демонстрирует возможности искусственного интеллекта в создании новых биологических структур. Этот прорыв может привести к важным открытиям и инновациям в различных научных и промышленных сферах.