В борьбе за лидерство в области искусственного интеллекта компания Google совершила большой прорыв, представив очередное обновление своей системы AlphaFold для предсказания 3D-структуры белков. Новая версия получила расширенные возможности и теперь способна моделировать не только белки, но и другие важнейшие биологические молекулы, включая ДНК.
По словам генерального директора подразделения DeepMind Демиса Хассабиса, AlphaFold 3 – это именно тот инструмент, который крайне необходим для открытия новых лекарственных препаратов. “Нужно увидеть, как малая молекула связывается с препаратом, насколько крепко она к нему присоединяется и с какими еще молекулами взаимодействует”, – пояснил он в интервью WIREDнакануне публикации научной статьи о AlphaFold 3 в журнале Nature .
Обновленная система способна работать с крупными структурами, такими как ДНК и РНК, несущими генетический код, а также с гораздо более мелкими частицами – ионами металлов.
Разработкой AlphaFold 3 занимались специалисты DeepMind и Isomorphic Labs – “сестринской” компании Alphabet, работающей над ИИ-инструментами для биотехнологий под руководством того же Хассабиса. В январе Isomorphic Labs объявила о партнерстве с фармацевтическими гигантами Eli Lilly и Novartis для совместной разработки лекарственных препаратов с применением нейросетей.
В отличие от предыдущих открытых версий, исходный код AlphaFold 3 не будет опубликован в общем доступе. Однако DeepMind предоставит бесплатный доступ к облачной системе для внешних исследователей. Как отметил Джон Джампер, возглавляющий команду разработчиков, это также позволит выяснить, как белки взаимодействуют с ДНК внутри организма. “Как белки реагируют на повреждения ДНК, как они обнаруживают и восстанавливают эти повреждения? Теперь мы сможем ответить на подобные вопросы”, – сказал он.
Ранее для определения структуры белков требовалась кропотливая работа с использованием электронных микроскопов и метода рентгеноструктурного анализа. Несколько лет назад группы исследователей стали выяснять, способно ли глубокое обучение, лежащее в основе многих недавних прорывов в ИИ, точно предсказывать форму белков исключительно по составляющим их аминокислотам, обучаясь на структурах, верифицированных экспериментально.
В 2018 году Google DeepMind заявила, что работает над AlphaFold. В 2020 году AlphaFold 2 продемонстрировала результаты настолько точные, что они вызвали огромную волну энтузиазма в области молекулярной биологии. Годом позже компания выпустила открытую версию AlphaFold вместе с описанием 350 000 предсказанных биологических структур, включая практически все известные белки человеческого организма. В 2022 году были опубликованы данные о более чем 2 миллионах белков.
Способность AlphaFold 3 моделировать различные белки была усовершенствована благодаря алгоритму диффузионной модели, который помогает генеративным нейросетям, таким как DALL-E и Midjourney, создавать фотореалистичные картинки. Диффузионная модель, встроенная в AlphaFold 3, повышает четкость генерируемых молекулярных структур.