Искусственный интеллект DeepMind превзошел людей в решении математических задач

Искусственный интеллект (ИИ), созданный на основе крупных языковых моделей (LLMs), продемонстрировалспособность генерировать новые решения математических задач, вдохновленных карточной игрой Set. Система, получившая название FunSearch, продвинула исследования в области комбинаторики – области математики, изучающей способы подсчета возможных расположений множеств с конечным количеством объектов.

Как заявил Пушмит Кохли, руководитель команды “ИИ для науки” в Google DeepMind в Лондоне: “Это первый случай, когда система, основанная на LLM, смогла превзойти то, что было известно математикам и компьютерным ученым. Это не просто новинка, это эффективнее всего, что существует сегодня.”

В отличие от предыдущих экспериментов, где исследователи использовали крупные языковые модели для решения математических задач с известными решениями, FunSearch автоматически создает запросы к специально обученной LLM, просит ее написать короткие компьютерные программы для генерации решений определенной математической задачи. Затем система быстро проверяет, превосходят ли эти решения известные. Если нет, она предоставляет обратную связь LLM, чтобы та могла улучшиться в следующем раунде.

“Мы используем LLM как двигатель творчества”, – говорит Бернардино Ромера-Паредес, компьютерный ученый из DeepMind. Не все программы, созданные LLM, полезны, и некоторые из них настолько плохи, что даже не могут быть запущены. Но другая программа может быстро отбросить некорректные и проверить правильные результаты.

Команда испытала FunSearch на “проблеме кеп-сета”, проистекающей из игры Set, изобретенной в 1970-х годах генетиком Маршей Фалко. Колода Set содержит 81 карту, каждая из которых отображает один, два или три символа, идентичные по цвету, форме и оттенку – и для каждой из этих характеристик существует три возможных варианта.

Математики показали, что игроки гарантированно найдут набор, если количество перевернутых карт составляет не менее 21. Они также нашли решения для более сложных версий игры, в которых абстрактные версии карт имеют пять или более свойств. Однако некоторые тайны остаются. Например, если есть n свойств, где n – любое целое число, то существует 3n возможных карт – но минимальное количество карт, которые должны быть раскрыты для гарантии решения, неизвестно.

Эта проблема может быть выражена в терминах дискретной геометрии. Там это эквивалентно нахождению определенных расположений трех точек в n-мерном пространстве. Математики смогли установить границы возможного общего решения – учитывая n, они нашли, что необходимое количество “карт на столе” должно быть больше, чем дано по определенной формуле, но меньше, чем по другой.

FunSearch смогла улучшить нижнюю границу для n = 8, сгенерировав наборы карт, удовлетворяющие всем требованиям. “Мы не доказываем, что не можем улучшить это, но мы получаем конструкцию, которая выходит за рамки того, что было известно ранее”, – говорит Алхуссейн Фавзи, компьютерный ученый из DeepMind.

Одной из важных особенностей FunSearch является то, что люди могут видеть успешные программы, созданные LLM, и учиться на них, говорит соавтор исследования Джордан Элленберг, математик из Университета Висконсин-Мэдисон. Это отличает технику от других приложений, где ИИ является “черным ящиком”.

“Самое захватывающее для меня – моделирование новых режимов сотрудничества человека и машины”, – добавляет Элленберг. “Я не рассматриваю их как замену математикам-людям, а скорее, как умножающую силу.”

Public Release.