Ученые из Техасского университета предложили новый подход в области искусственного интеллекта, позволяющий алгоритмам объяснять логику своих решений. Эта разработка призвана решить одну из главных проблем современных нейронных сетей – их непрозрачность и “черноящичность”.
Системы глубокого обучения на основе искусственных нейронных сетей демонстрируют впечатляющие результаты в распознавании образов, прогнозировании погоды и многих других задачах. Однако их работа напоминает “черный ящик” – эти алгоритмы не способны объяснить, как именно пришли к тому или иному выводу. По этой причине их трудно использовать в медицине и других областях повышенного риска, где важно понимать логику решений.
В 2021 году эти исследователи разработали ИИ на основе “символьных” принципов. Такая модель кодирует явные правила и опыт путем анализа данных. В отличие от глубокого обучения, символьные модели проще объяснить людям. Но они сильно зависят от предыдущих знаний и плохо справляются с новыми задачами.
Вдохновленные исследованиями мозга, ученые решили дополнить символьный подход принципами работы нейронных сетей. Так появилась “нейрокогнитивная” модель, опирающаяся на понятные основы, но способная гибко решать новые задачи.
Эту модель усовершенствовали, наделив способностью формулировать решения на языке программирования. Получившийся алгоритм “глубокой дистилляции” группирует схожие понятия в “центры”, а затем преобразует их в правила на естественном языке.
В отличие от традиционного глубокого обучения, здесь тренировка происходит пошагово, напоминая обучение ребенка. Это позволяет отслеживать ход рассуждений ИИ.
Алгоритм протестировали на классической компьютерной игре “Жизнь Конвея”, где нужно выращивать цифровые клетки по определенным правилам. Проанализировав данные об игре, ИИ сумел предсказывать развитие клеток и объяснять свои выводы.
Кроме того, алгоритм успешно справился с задачами распознавания изображений и сложными математическими задачами. В некоторых случаях он сгенерировал нестандартный программный код, превосходящий человеческие методы, и обосновал свои решения.
По мнению авторов, глубокая дистилляция могла бы ускорить научные открытия в физике и биологии. Она помогла бы находить закономерности в шумных данных, что часто занимает годы кропотливой работы ученых.
Этот подход также может быть полезен для выявления редких генетических мутаций, вызывающих тяжелые наследственные заболевания. Дистиллируя огромные массивы генетических данных, алгоритм способен обнаруживать важные взаимосвязи.
Кроме научных исследований, авторы видят потенциал в улучшении взаимодействия людей и ИИ. Понятность решений могла бы гарантировать безопасность применения технологий в медицине. А для научных задач объяснимость позволит алгоритмам лучше соотноситься с человеческими ценностями.
Пока глубокая дистилляция лучше всего работает с дискретными данными, которые можно разбить на отдельные концепции. Следующая задача – адаптировать ее для анализа непрерывных потоков данных, таких как видео. Это откроет новые горизонты в научных вычислениях и теоретических исследованиях.