Компания NVIDIA объявила о выпуске усовершенствованной версии крупной языковой модели Llama 3.1-Nemotron-70B-Instruct. Новая разработка призвана значительно повысить качество и эффективность взаимодействия искусственного интеллекта с пользователями.
Главной особенностью обновленной модели стала её способность генерировать более полезные и релевантные ответы на запросы пользователей. Модель построена на базе архитектуры Transformer и поддерживает обработку впечатляющего объема данных – до 128 тысяч токенов на входе и 4 тысяч токенов на выходе.
В процессе разработки специалисты NVIDIA использовали комбинированный подход к обучению модели, включающий как человеческие данные, так и синтетические материалы. Для тренировки было задействовано более 20 тысяч пар запросов и ответов, а еще тысяча использовалась для валидации. Такой масштабный датасет позволил создать модель, которая не только выдает точные ответы, но и способна адаптировать их сложность и подробность под потребности пользователя.
Важным преимуществом новой версии стала её совместимость с широким спектром аппаратного обеспечения NVIDIA, включая архитектуры Ampere, Hopper и Turing. Модель оптимизирована для работы на различных GPU, от мощных H100 до более доступных A100.
Разработчики уделили особое внимание этическим аспектам использования технологии. NVIDIA подчеркивает важность ответственного подхода к развитию искусственного интеллекта и призывает разработчиков тщательно оценивать соответствие модели требованиям конкретной отрасли и предусматривать возможные риски неправильного использования.
Модель доступна для коммерческого использования при условии согласия с лицензионным соглашением Llama 3 и политикой конфиденциальности Meta. Компания также запустила платформу для сообщения о потенциальных уязвимостях и проблемах безопасности, связанных с использованием модели.