Microsoft представила новый ИИ-ускоритель Maia 100, который станет важным шагом в развитии облачных технологий. В рамках конференции Hot Chips 2024, компания раскрыла подробности своего первого поколения кастомных ИИ-ускорителей, специально разработанных для обработки масштабных задач искусственного интеллекта в облачной среде Azure.
Maia 100 представляет собой уникальную систему, интегрированную для достижения максимальной производительности при минимизации затрат. Она включает в себя архитектуру платформы с кастомными серверными платами и специализированные стойки, а также программное обеспечение, оптимизированное для повышения эффективности работы сервисов, таких как Azure OpenAI.
Основной элемент системы – чип размером около 820 квадратных миллиметров, который был создан с использованием передовой технологии TSMC и оснащён четырьмя HBM2E чипами, обеспечивающими пропускную способность в 1,8 терабайта в секунду и ёмкость в 64 гигабайта. Такая архитектура позволяет справляться с высокими нагрузками, связанными с обработкой больших объёмов данных.
Maia 100 поддерживает разнообразные форматы данных и обеспечивает высокую производительность при энергопотреблении до 700 Вт, что делает его эффективным решением для задач, требующих значительных вычислительных ресурсов. Особое внимание уделено поддержке современных алгоритмов машинного обучения, что отражается в архитектуре процессоров и блоков тензорных операций.
Система также оснащена программными инструментами, позволяющими эффективно управлять ресурсами и снижать энергопотребление. Для этого используются технологии сжатия данных и оптимизированные хранилища, которые обеспечивают высокую скорость обработки данных и их перемещение между компонентами системы.
Maia 100 поддерживает высокоскоростные Ethernet-соединения, которые позволяют обрабатывать модели искусственного интеллекта в масштабах, недостижимых для традиционных решений. Эта технология обеспечивает надежную и сбалансированную работу сети, что особенно важно для задач конфиденциальных вычислений.
Программная платформа Maia SDK позволяет разработчикам быстро переносить свои модели, написанные на PyTorch и Triton, на новую архитектуру, что значительно ускоряет процесс развёртывания и оптимизации моделей в Azure. SDK также включает инструменты для отладки, профилирования и настройки производительности моделей.
Система поддерживает два программных подхода, что обеспечивает гибкость и простоту в разработке. Triton предоставляет удобный интерфейс и автоматизирует управление памятью, тогда как Maia API предлагает более высокий уровень контроля за процессами, что позволяет максимально использовать возможности аппаратного обеспечения.
Таким образом, Microsoft с помощью Maia 100 значительно усиливает свои позиции в области облачных вычислений и искусственного интеллекта. Новая архитектура не только оптимизирует работу ИИ-моделей, но и снижает затраты на их развёртывание и эксплуатацию, предлагая разработчикам инструменты для более гибкой и быстрой работы.