Раскрой глаза, ChatGPT: чат-бот научился анализировать мир через камеру смартфона

Компания OpenAI представила новую версию ” data-html=”true” data-original-title=”ChatGPT” >ChatGPT, которая умеет воспринимать и анализировать видео в режиме реального времени. С момента первой демонстрации этой функции прошло семь месяцев, и теперь она наконец доступна пользователям.

В обновленной версии Advanced Voice Mode разработчики добавили компьютерное зрение. Теперь пользователи с подписками ChatGPT Plus, Team и Pro могут навести камеру смартфона на любой предмет, и искусственный интеллект мгновенно проанализирует его, а затем прокомментирует увиденное и ответит на вопросы.

Модель также “осознаёт” всё происходящее на экране устройства. Пользователи могут показать ChatGPT любое меню настроек или математическую задачу, а ИИ поможет разобраться в них, наблюдая за действиями человека.

Чтобы включить визуальный режим, нужно сначала нажать на значок микрофона возле строки чата, а затем выбрать иконку видео в нижнем левом углу. Если вы хотите показать боту содержимое экрана, достаточно открыть меню с тремя точками и выбрать функцию демонстрации.

Президент OpenAI Грег Брокман недавно продемонстрировал новые возможности ChatGPT в эфире программы “60 минут” на CNN. Ведущий Андерсон Купер рисовал на доске части тела человека, а чат-бот в реальном времени комментировал их расположение и анатомическую точность, попутно давая советы, как улучшить рисунки.

Впрочем, система пока работает не идеально. Во время той же демонстрации ChatGPT не смог решить несложную задачу по геометрии. Очевидно, доверять его ответом на 100% пока не стоит, и алгоритмы явно нуждаются в улучшении.

Компании и так пришлось потратить немало времени на доведение технологии до рабочего состояния. В апреле OpenAI пообещала выпустить обновление “через несколько недель”, однако добиться нужного уровня качества оказалось гораздо сложнее.

Осенью компания запустила голосовой режим без визуальной составляющей. До декабрьского обновления команда OpenAI сконцентрировалась на том, чтобы сделать голосовые функции доступными для пользователей из стран Европейского Союза.

Новая функция пока работает не везде. Корпоративным клиентам ChatGPT Enterprise и образовательным учреждениям придется подождать до января. Для пользователей из ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейна сроки запуска еще неизвестны – компания пока не определилась с датой релиза в этих странах.

Другие технологические гиганты тоже не стоят на месте. Google уже начала тестировать Project Astra – свою систему видеоанализа для устройств на Android. Meta* также разрабатывает похожие технологии для своих продуктов.

К праздничному сезону разработчики ChatGPT подготовили еще один сюрприз – режим “Santa Mode” (режим Санты). Любой пользователь может заставить бота говорить голосом Санты, просто нажав на значок снежинки рядом с полем для сообщений.

* Компания Meta и продукты компании (Instagram и Facebook) признаны экстремистскими организациями; их деятельность запрещена на территории РФ.

Public Release.