OpenAI представила новую языковую модель ChatGPT o1, способную рассуждать и логически решать задачи, имитируя человеческий процесс мышления, разбивая сложные задачи на более простые шаги, анализируя различные подходы и исправляя ошибки. Об этом сообщает 3DNews.
Модель o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов. В области программирования o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89% участников на платформе Codeforces. В математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME).
В естественных науках модель превзошла результаты докторов и кандидатов наук в тесте GPQA diamond, оценивающем знания в химии, физике и биологии. Разработчики отмечают, что это не означает превосходство модели над любым кандидатом наук, но демонстрирует ее способность решать задачи на уровне высококвалифицированных специалистов.
Модель o1 также превзошла предыдущие модели в тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, o1 значительно превосходит GPT-4o в задачах, связанных с логическим мышлением. В тестах AIME o1 решила в среднем 83% задач, тогда как GPT-4o — 13%.
Кроме того, o1 значительно меньше подвержена галлюцинациям по сравнению с GPT-4o, но работает медленнее и ее обслуживание обходится дороже. Она уступает GPT-4o в энциклопедических знаниях и не может обрабатывать веб-страницы, файлы и изображения. Также модель может манипулировать данными, подгоняя решение под результат.
Успех модели объясняется новым алгоритмом обучения — “цепочкой мыслей”, который позволяет модели улучшать свои результаты, распознавая и исправляя ошибки, разбивая сложные шаги на более простые и пробуя разные подходы.
OpenAI выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Стоимость использования o1-preview составляет $15 за 1 млн входных токенов и $60 за 1 млн выходных токенов, тогда как GPT-4o стоит $5 и $15 соответственно.
Ранее ИИ-систему Apple Intelligence назвали сильно отстающей от рынка.