С июля исследователи и разработчики смогут использовать новую открытую серию легковесных моделей Gemma 2 от Google через Vertex AI. Изначально планировалось, что в состав серии войдет модель с 27 миллиардами параметров, однако компания также включила в нее модель с 9 миллиардами параметров.
Gemma 2 была представлена в мае на конференции Google I/O и стала преемником моделей Gemma с 2 миллиардами и 7 миллиардами параметров, выпущенных в феврале. Новое поколение моделей предназначено для работы на последних GPU от Nvidia или на одном хосте TPU в Vertex AI. Основная целевая аудитория – разработчики, стремящиеся интегрировать искусственный интеллект в свои приложения или устройства, такие как смартфоны, устройства Интернета вещей и персональные компьютеры.
Модели Gemma 2 сравниваются с аналогами от других компаний, включая Llama 3 от Meta и Grok-1. Технологические инновации позволяют создавать более компактные и легкие модели, которые могут обрабатывать разнообразные пользовательские запросы. Благодаря двум вариантам моделей – с 9 миллиардами и 27 миллиардами параметров – Google предоставляет разработчикам выбор: использовать модели на устройствах или через облако. Открытый исходный код позволяет легко настраивать и интегрировать модели в различные проекты, что делает их универсальными для применения в неожиданных областях.
Также ожидается, что существующие варианты Gemma – CodeGemma, RecurrentGemma и PaliGemma – смогут извлечь выгоду из новых моделей Gemma 2.
Google планирует выпустить еще одну модель с 2.6 миллиардами параметров, которая будет “мостом между легковесной доступностью и мощной производительностью”.
Gemma 2 доступна в Google AI Studio . Разработчики могут скачать весовые коэффициенты модели с платформ Kaggle и Hugging Face . Исследователи могут использовать Gemma 2 бесплатно через Kaggle или бесплатный тариф для Colab notebooks.