Huawei использовала собственные мощности и оборудование для выхода на рынок ИИ в условиях жестких санкций

Huawei использовала собственные мощности и оборудование для выхода на рынок ИИ в условиях жестких санкций

Изображение: Dmitry Rodionov (unsplash)

В Китае заявлено о запуске новой мультимодальной модели искусственного интеллекта, обучение которой прошло без использования американской электроники. Разработкой занималась компания Zhipu AI, а всё вычислительное обеспечение предоставила Huawei. Как подчёркивает сама компания, в процессе не было задействовано ни одного чипа от Nvidia или AMD.

Разработка получила название GLM-Image. В её основе — архитектурное решение, при котором объединены авторегрессивный механизм и диффузионный модуль. Это позволяет системе создавать не только изображения, но и осмысленные тексты одновременно. Модель входит в линейку General Language Model, где уже существует несколько реализаций, в том числе специализированных.

Аппаратной основой стали серверы Huawei Ascend Atlas 800T A2. Внутри — процессоры Kunpeng 920, выполненные на Arm-архитектуре, и ускорители Ascend 910, которые и обеспечивали обучение. По словам инженеров Huawei, обновлённая версия этих ускорителей, обозначенная как 910C, выдаёт около 800 терафлопс на точности FP16. Для сравнения, показатели Nvidia H100 превышают эту планку лишь на 20%.

Конструкция самой модели построена на двух блоках. Первый — генератор на 9 млрд параметров, второй — декодер с числом параметров около 7 млрд. Эта связка позволяет системе не только генерировать визуальный контент в высоком разрешении, но и качественно встраивать надписи, сохраняя читаемость и стилистическую целостность.

Несмотря на эффектную подачу, компания Zhipu AI не раскрыла некоторые важные детали. Неизвестно, сколько вычислительных машин было задействовано и как долго шло обучение.

Эти параметры могли бы позволить сравнить затраты на создание модели с зарубежными аналогами и понять, насколько экономически оправдано использование полностью китайской аппаратной базы.

Само появление такой модели имеет символическое значение. На фоне ужесточения экспортных правил со стороны США, когда каждый запрос на поставку GPU в КНР рассматривается в индивидуальном порядке, китайские игроки стараются уходить от зависимости. По мнению ряда аналитиков, такие шаги сигнализируют о возможной перестройке глобального рынка.

В экспертной колонке Сюй Хаоцюань, аналитик отрасли кибертехнологий, указывает, что развитие компактных, специализированных моделей с ориентацией на внутренние ресурсы станет важным вектором в ближайшие годы. При этом именно автономность от зарубежных компонентов, по его мнению, может превратиться в конкурентное преимущество для китайских производителей.

Артем
Автор: Артем
Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.
Комментарии: