Llama 3.1 от NVIDIA: ИИ, способный понимать и адаптироваться

18 Oct 2024 2:09 pm GMT+0000 Date Time

Компания NVIDIA объявила о выпуске усовершенствованной версии крупной языковой модели Llama 3.1-Nemotron-70B-Instruct. Новая разработка призвана значительно повысить качество и эффективность взаимодействия искусственного интеллекта с пользователями.

Главной особенностью обновленной модели стала её способность генерировать более полезные и релевантные ответы на запросы пользователей. Модель построена на базе архитектуры Transformer и поддерживает обработку впечатляющего объема данных – до 128 тысяч токенов на входе и 4 тысяч токенов на выходе.

В процессе разработки специалисты NVIDIA использовали комбинированный подход к обучению модели, включающий как человеческие данные, так и синтетические материалы. Для тренировки было задействовано более 20 тысяч пар запросов и ответов, а еще тысяча использовалась для валидации. Такой масштабный датасет позволил создать модель, которая не только выдает точные ответы, но и способна адаптировать их сложность и подробность под потребности пользователя.

Важным преимуществом новой версии стала её совместимость с широким спектром аппаратного обеспечения NVIDIA, включая архитектуры Ampere, Hopper и Turing. Модель оптимизирована для работы на различных GPU, от мощных H100 до более доступных A100.

Разработчики уделили особое внимание этическим аспектам использования технологии. NVIDIA подчеркивает важность ответственного подхода к развитию искусственного интеллекта и призывает разработчиков тщательно оценивать соответствие модели требованиям конкретной отрасли и предусматривать возможные риски неправильного использования.

Модель доступна для коммерческого использования при условии согласия с лицензионным соглашением Llama 3 и политикой конфиденциальности Meta. Компания также запустила платформу для сообщения о потенциальных уязвимостях и проблемах безопасности, связанных с использованием модели.

Public Release.