Группа исследователей из Пекинского университета и Восточного технологического института ( EIT ) разработала инновационную систему, которая может стать ключом к обучению ИИ-моделей, способных самостоятельно проводить научные исследования и решать сложные задачи. Работа, опубликованная в журнале Nexus, может привести нас к созданию “реальных ИИ-ученых”.
В целом модели глубокого обучения хорошо справляются с исследовательской работой, так как способны выявлять закономерности и взаимосвязи в колоссальных объемах данных. Однако у этих систем все еще нет фундаментального понимания физических законов, математической логики и прочих знаний, лежащих в основе природных и технических процессов.
Чтобы преодолеть ограничения, команда ученых под руководством профессора Чэнь Юньтяня из EIT разработала новаторскую концепцию “информированного машинного обучения” (informed machine learning). Суть заключается в интеграции специализированных знаний, таких как законы физики, химические уравнения и логические правила, непосредственно в обучающую выборку наряду с исходными данными.
Такой подход может вывести точность и эффективность нейросетей на принципиально новый уровень.
Первой проблемой, с которой столкнулась исследовательская группа, стал вопрос отбора и сочетания предварительных знаний и правил. Использование избыточного количества несогласованных элементов способно привести систему к коллапсу и потере работоспособности.
Чтобы решить эту задачу, ученые разработали алгоритм, оценивающий “значимость” информации и вычисляющий оптимальные комбинации, которые повысят предсказательную способность машины и точность результатов. По словам Чэнь Юньтяня, внедрение человеческих знаний в модели ИИ повысит их эффективность и улучшит логические выводы. А это крайне важно в научной и инженерной сферах.
Исследователи применили новую систему для решения алгебраических уравнений и прогнозирования результатов химического эксперимента. Результаты показали значительный прирост точности и стабильности работы “информированных” моделей ИИ.
Конечная цель проекта – построение полностью автономной системы, способной самостоятельно выводить соответствующие правила и принципы без вмешательства человека. “Мы хотим замкнуть цикл и превратить модель в настоящего ИИ-ученого”, – заявил Чэнь Юньтянь.
На данный момент специалисты уже работают над созданием открытого плагина для разработчиков ИИ, который позволит реализовать этот амбициозный замысел. Впрочем, есть и сложности – если повышается объем исходных данных, общие правила начинают доминировать над локальными закономерностями. Это осложняет их применение в областях вроде биологии и химии, которым присущи уникальные правила, не описываемые компактными математическими уравнениями.