LLM от Alibaba получила наивысший балл в мировом рейтинге Hugging Face

28 Jun 2024 10:48 am GMT+0000 Date Time

Платформа разработчиков ИИ и машинного обучения Hugging Face представила обновлённый рейтинг лучших открытых языковых моделей в мире. Согласно этому рейтингу, китайские модели сейчас доминируют в общем зачёте, активно применяясь в различных отраслях, включая потребительскую электронику, автомобили и онлайн-игры.

Первое место в Топ-10 заняла модель Qwen-72B-Instruct от Alibaba Group Holding со средним баллом 43,02 по шести показателям. Эта модель, обученная на 72 миллиардах параметров, на текущий момент является лидером среди открытых моделей, как заявил сооснователь и генеральный директор Hugging Face Клемент Деланг.

Второе место досталось ИИ-модели Llama-3-70B-Instruct от компании Meta*. Третье место также заняла модель от Alibaba – Qwen-72B. Модель Copilot от Microsoft, основного партнёра OpenAI, расположилась на шестом месте.

Седьмое место в рейтинге заняла модель Yi-1.5-34B-Chat от пекинского стартапа 01.AI, основанного в 2023 году известным венчурным капиталистом Ли Кайфу, ранее занимавшим пост президента Google China. Замыкает десятку лучших еще одна модель от Alibaba – Qwen1.5-110B.

Таким образом, три из четырёх китайских LLM, попавших в Топ-10, были из серии Tongyi Qianwen (также известной как Qwen), разработанной Alibaba. Это демонстрирует быстрый прогресс компании в области ИИ, во многом благодаря её приверженности к открытой разработке. Открытый исходный код предоставляет публичный доступ к коду программы, что даёт разработчикам возможность изменять или делиться её дизайном, устранять неполадки или расширять функциональность.

Технический директор Alibaba Cloud Чжоу Цзинжэнь сообщил в мае, что семейство больших языковых моделей Tongyi Qianwen сейчас используются уже более чем 90 тысячами корпоративных клиентов.

Стоит отметить, что методология ранжирования моделей ИИ от Hugging Face теперь учитывает больше метрик, включая решение сложных задач объёмом около 1000 слов. Однако, поскольку рейтинг сосредоточен на моделях с открытым исходным кодом, он исключает продвинутые LLM, разработанные в закрытой среде, такие как GPT от OpenAI.

Для сравнения с закрытыми ИИ-моделями можно обратиться к сторонним тир-листам. Так, в рейтинге LMSYS Chatbot Arena лидирует GPT-4o, последняя LLM от OpenAI, представленная в мае. В этом же рейтинге модель Qwen2-72B-Instruct от Alibaba заняла лишь 19-е место.

Public Release.