20 декабря новая ИИ-система OpenAI под названием o3 преодолела важный рубеж. При прохождении теста ARC-AGI на определение уровня мышления модель набрала 85% – столько же, сколько в среднем набирают люди. В дополнение к этому она блестяще справилась со сложными математическими задачами.
До сих пор лучший результат среди подобных разработок не превышал 55%. Многие исследователи считают, что o3 совершила серьезный прорыв на пути к созданию искусственного общего интеллекта (AGI), хотя скептики по-прежнему сомневаются в значимости достижения.
Здесь важно разобраться в особенностях теста ARC-AGI. Главный показатель в нем – “эффективность выборки”, то есть умение приспосабливаться к новым условиям, располагая минимумом примеров. Проще говоря, тест определяет, сколько образцов новой ситуации нужно, чтобы уловить принцип ее работы.
Современные языковые модели вроде ChatGPT на базе
Модели GPT активно применяются для автоматического написания текстов, диалоговых систем, решения разнообразных задач, требующих обработки естественного языка. Они открывают огромные перспективы во многих сферах, включая маркетинг, образование, медицину и т.д.