Ученые из Гарвардского университета под руководством аспиранта Юнха Хванга разработали систему искусственного интеллекта, способную расшифровывать сложный язык геномики. Эта система, представленная в журнале Nature Communications , открывает новые горизонты для биологов в понимании функций и регуляции генов.
Геномика – это как бы “исходный код” биологии, описывающий, как работают и взаимодействуют различные биологические системы. Команда исследователей ввела в искусственный интеллект данные о микробных метагеномах, самом большом и разнообразном наборе геномных данных, что позволило создать Модель Геномного Языка (gLM). Эта модель способна учиться на основе этих данных, понимая функциональную “семантику” и регуляторную “синтаксис” каждого гена.
Важность исследования подчеркивается тем, что большинство генов даже хорошо изученных организмов остаются плохо охарактеризованными. gLM предоставляет уникальную возможность понять, как различные гены работают вместе, выявляя новые биологические механизмы и функции.
Группа исследователей из разных дисциплин, включая микробиологию, геномику, биоинформатику, науку о белках и машинное обучение, смогла преодолеть ограничения традиционных методов аннотации белков, которые рассматривают белки по отдельности, не учитывая их взаимодействие. gLM, напротив, интегрирует концепцию “соседства генов” с моделями языка, предоставляя комплексный взгляд на взаимодействие белков.
Модель gLM открывает двери для новых открытий в геномике, позволяя ученым открывать новые геномные узоры и изучать ранее неаннотированные функции генов. Это может ускорить открытие новых биотехнологических решений для проблем изменения климата и биоэкономики.
Работа gLM является значительным достижением в междисциплинарном сотрудничестве, продвигая науку о жизни вперед и предоставляя ученым мощный инструмент для исследования биологических механизмов на генетическом уровне.