ИИ становится доступнее и мощнее: неделя, которая изменила ландшафт искусственного интеллекта

На этой неделе мир искусственного интеллекта (ИИ) оказался в центре внимания благодаря нескольким громким событиям от OpenAI, включая от CEO Сэма Альтмана, запуск функции Advanced Voice Mode, слухи о новом центре обработки данных 5GW, а также кадровые перестановки и реорганизации в компании. Однако, помимо этого, другие технологические гиганты продолжили развивать свои ИИ-проекты, представляя новые модели и исследования. Ниже представлены ключевые новости в сфере ИИ за последние дни.

Обновления Google Gemini

Google анонсировала новые версии своей модели Gemini, выпустив обновленные модели Gemini-1.5-Pro-002 и Gemini-1.5-Flash-002. Эти версии получили улучшения в производительности, включая успехи в обработке математических задач, длинных контекстов и визуальных заданий. Google заявила об увеличении на 7% производительности на тесте MMLU-Pro и улучшении на 20% в математических задачах. Важным дополнением к обновлениям стало существенное снижение стоимости использования модели: стоимость входных токенов снизилась на 64%, а выходных – на 52% для запросов до 128,000 токенов.

Кроме того, Google увеличила лимиты на запросы, предоставив для Gemini 1.5 Flash возможность обрабатывать 2,000 запросов в минуту, а для Gemini 1.5 Pro – 1,000 запросов. Модели стали в два раза быстрее и показывают на 300% меньшую задержку по сравнению с предыдущими версиями. Это делает использование этих моделей более доступным и эффективным для разработчиков.

Запуск Meta* Llama 3.2

Meta также порадовала новостями , выпустив обновление своей модели Llama до версии 3.2. Среди новинок – модели с поддержкой обработки изображений и визуальных данных, с размерами 11 и 90 миллиардов параметров, а также текстовые модели меньшего объема (1 и 3 миллиарда параметров), предназначенные для мобильных и периферийных устройств. Meta утверждает, что новые модели для работы с изображениями успешно конкурируют с ведущими закрытыми моделями в задачах распознавания и понимания визуальной информации. Более легкие текстовые модели показывают высокие результаты в сравнении с аналогичными решениями.

Одной из главных новинок стал выпуск официальных дистрибутивов “Llama Stack”, которые упрощают процесс разработки и разворачивания моделей на различных платформах. Модели Llama 3.2, как и ранее, доступны для бесплатного скачивания с лицензией, ограничивающей коммерческое использование.

Google DeepMind и AlphaChip для ускорения разработки чипов

Google DeepMind анонсировала значительное достижение в области ИИ для проектирования электронных чипов – технологию AlphaChip. Эта система использует методы обучения с подкреплением для создания планов чипов, которые, по заявлению Google, превосходят результаты, достигаемые человеческими инженерами. Компания уже применила AlphaChip для разработки чипов в последних трех поколениях своих TPU (тензорных процессоров), которые используются для ускорения ИИ-вычислений.

По словам Google, AlphaChip способен генерировать высококачественные схемы за несколько часов, что значительно сокращает время разработки, которое обычно занимает недели или месяцы. Кроме того, компания открыла доступ к предварительно обученной версии AlphaChip на GitHub. Этот инструмент уже привлек внимание других производителей чипов, таких как MediaTek, которые начали использовать AlphaChip для собственных разработок.

На этом ИИ-новости не заканчиваются, и в ближайшие недели, вероятно, появится еще больше интересных обновлений в этой стремительно развивающейся индустрии.

* компании Meta, её деятельность признана экстремистской и запрещена в России.

Public Release.