С момента своего запуска в 2020 году, более 2 миллионов исследователей использовали модель AlphaFold 2 от Google DeepMind для предсказания структуры белков в разработке вакцин, лечении рака и других научных задачах. Это позволило решить проблему, над которой учёные трудились более 50 лет. После этого команда могла бы почить на лаврах, но вместо этого началась работа над AlphaFold 3.
Новая модель , представленная в мае, способна предсказывать не только структуры белков, но и взаимодействия всех молекул жизни, включая ДНК, РНК и лиганды – малые молекулы, которые связываются с белками.
Старшая модель AlphaFold 2 помогала исследователям делать важные открытия, но для современного уровня биологии и химии требовалось больше. Новая версия охватывает все биомолекулы, что особенно важно для разработки лекарств, ведь лиганды составляют около половины всех медикаментов. AlphaFold 3 используется для исследования связывания новых малых молекул с новыми мишенями, анализа взаимодействий белков с ДНК и РНК, а также воздействия химических модификаций на структуру белков.
AlphaFold 3 также предлагает доступ к онлайн-сервису AlphaFold Server, позволяющему учёным загружать свои последовательности для генерации молекулярных комплексов. Этот бесплатный инструмент с момента запуска в мае уже использован для генерации более 1 миллиона структур.
В новой модели значительно расширен набор данных для обучения, включающий ДНК, РНК, малые молекулы и другие биомолекулы. Это позволило добиться значительных успехов в точности предсказаний. Также изменена архитектура модели: теперь используется генеративная модель на основе диффузии, что упростило обработку различных типов молекул.
Однако возникла новая проблема: так как в обучающих данных не было “неупорядоченных областей” белков, модель могла создавать неправильные “упорядоченные” структуры. Для решения этой задачи использовались предсказания AlphaFold 2, что помогло AlphaFold 3 научиться правильно предсказывать неупорядоченные взаимодействия.
Команда надеется, что AlphaFold 3 будет способствовать новым достижениям в таких областях, как геномные исследования и разработка лекарств. С каждым шагом модель делает невозможное возможным, помогая решать всё более сложные научные задачи.