LeMa от Microsoft: теперь ИИ самообучается, решая математические задачи

Группа китайских учёных из Microsoft Research Asia, Пекинского университета и Университета Сиань Цзяотун представила инновационную методику обучения языковых моделей (Large Language Model, LLM). Основываясь на принципах обучения человека, специалисты разработали стратегию под названием “Обучение на ошибках” (Learning from Mistakes, LeMa), которая позволяет искусственному интеллекту самостоятельно учиться на собственных ошибках и таким образом существенно улучшить качество решения математических задач.

Исследование опирается на уникальную идею: если человек, столкнувшись с ошибкой в математической задаче, анализирует и исправляет ее, то и машина, обучаясь по такому же принципу, сможет повысить свою эффективность. Применяя свой подход, команда использовала неверные рассуждения моделей, таких как LLaMA-2, затем GPT-4 анализировала эти ошибки, обучая модель предоставлять правильные решения.

Такой подход оказался чрезвычайно результативным. На двух математических задачах и с использованием пяти различных LLM, метод LeMa показал стабильное улучшение производительности по сравнению с предыдущими техниками, базирующимися только на данных о стандартных путях решения. Более того, специализированные LLM, включая WizardMath и MetaMath, также продемонстрировали улучшение, достигнув точности в 85,4% на наборе данных GSM8K и 27,1% на MATH, что является рекордом для моделей с открытым исходным кодом.

Открытие несет в себе важные перспективы для развития искусственного интеллекта. Исходный код, данные и модели, использованные в исследовании, теперь доступны на GitHub , что позволяет исследовательскому сообществу по всему миру продолжать работу в данном направлении, углубляя и расширяя знания в области машинного обучения.

Сложные области применения ИИ, такие как здравоохранение, финансы и разработка автономных транспортных средств, потенциально могут извлечь огромную выгоду из внедрения таких систем, способных на непрерывное самосовершенствование через анализ и исправление собственных ошибок.

В исследовании открываются новые горизонты: мы приближаемся к эре, в которой искусственный интеллект не просто выполняет задания, но и способен эффективно учиться, повышая свои способности решения все более сложных проблем, что ранее считалось прерогативой человека.

Public Release.