Google объявляето запуске новой серии открытых ИИ-моделей под общим названием Gemma, предназначенных для поддержки разработчиков и исследователей в ответственном создании искусственного интеллекта.
Модели Gemma 2B и Gemma 7B объёмом в 2 и 7 миллиардов параметров соответственно доступны в предварительно обученных и настроенных вариантах. Модели, по заявлениям Google, строго текстовые и превосходят по эффективности аналогичные модели, при этом их можно запускать на ноутбуках, настольных ПК или в облачных сервисах Google. Модели Gemma также оптимизированы для работы со множеством аппаратных платформ ИИ, включая GPU от NVIDIA и TPU от Google Cloud.
До начала тестирования моделей из наборов обучающих данных была удалена чувствительная информация (личные данные). Кроме того, перед выпуском модели были тщательно протестированы для минимизации нежелательного поведения.
Тест MMLU – это тест, который измеряет широту знаний и способность решать задачи, приобретенные моделями во время предварительного обучения
В отличие от предыдущих релизов, Gemma распространяется под открытой лицензией, что не означает полную открытость исходного кода, но позволяет разработчикам настраивать и дополнять модели, а также использовать разработанные инструменты для обеспечения безопасности приложений и их совместимости с основными платформами и фреймворками ИИ. Google указывает, что модели Gemma могут использоваться для ответственного коммерческого применения и распространения в организациях любого размера.
Google также предлагает инструменты и ресурсы для настройки моделей Gemma под конкретные потребности приложений, поддержку широкого спектра инструментов и систем, совместимость с различными устройствами и оптимизацию для Google Cloud, включая Vertex AI и Google Kubernetes Engine.
Google предоставляет разработчикам и исследователям бесплатный доступ к Gemma через Kaggle, доступ к Google Colab и кредиты на использование Google Cloud на сумму до $500 000 для ускорения проектов. Google приглашает сообщество разработчиков и исследователей к сотрудничеству и с нетерпением ожидает увидеть, какие инновации и приложения будут созданы с использованием новых моделей.