Экономия бизнеса на ИИ-моделях приводит к затратам на инфраструктуру

Экономия бизнеса на ИИ-моделях приводит к затратам на инфраструктуру

Изображение: recraft

Аналитики компании Nodul сравнили рынок больших языковых моделей и пришли к выводу: решения с открытым исходным кодом в среднем обходятся примерно в 40 раз дешевле закрытых сервисов. При этом по качеству генерации текста разрыв не выглядит критичным. Но окончательный выбор зависит не только от цены за 1 млн токенов. Бизнесу приходится считать полные расходы — от серверов до зарплат специалистов.

В исследовании объясняется, как формируется стоимость open-source-моделей. Их использование строится на аренде серверов и скорости генерации — количестве токенов в секунду. Токен — это часть слова или отдельный символ, из которых собирается текст. Чем выше производительность сервера, тем ниже цена обработки при полной загрузке оборудования.

Закрытые модели принадлежат крупным технологическим компаниям. Доступ к ним предоставляется через API или веб-интерфейс. Пользователь работает с готовым сервисом и не может изменить внутреннее устройство модели. Цена зависит от числа входящих и исходящих токенов, причём тарифы различаются.

По расчётам Nodul, при минимальной конфигурации сервера и полной загрузке 1 млн токенов в open-source-моделях стоит от 23 руб. у GPT OSS до 77 руб. у Qwen. При увеличении скорости генерации цена снижается до 17 и 51 руб. соответственно.

У зарубежных закрытых решений разброс выше. Миллион входящих токенов стоит около 140 руб. у GPT-5.2 и до 400 руб. у Claude Opus 4.5. Среди российских сервисов стоимость заметнее: 1 млн токенов в GigaChat 2 Max обходится примерно в 650 руб., а в Yandex GPT Pro 5 — около 1200 руб.

Руководитель платформы Yandex AI Studio Артур Самигуллин уточнил, что сравнение проводилось на предыдущем поколении модели. По его словам, для актуальной версии Alice AI LLM цена 1 млн входящих токенов составляет около 660 руб. Он также сообщил, что по итогам 2025 года объём потребления токенов через API платформы вырос примерно в 7 раз.

При этом одних тарифов недостаточно для объективной оценки. В компании Just AI поясняют, что необходимо учитывать Total Cost of Ownership — полную стоимость владения. Для запуска мощной open-source-модели потребуются производительные видеокарты или аренда облачных GPU, а также специалисты по машинному обучению. Таких экспертов на рынке немного, их услуги стоят дорого.

В результате выбор между открытой и закрытой моделью становится стратегическим вопросом. Бизнес оценивает требования регуляторов, объём задач, уровень контроля над данными, возможность доработки модели под свои процессы и планы по масштабированию.

Крупные компании чаще инвестируют в open-source-модели и дообучают их под собственные нужды, развивая инфраструктуру и экспертизу внутри организации. Малый и средний бизнес предпочитает готовые сервисы с оплатой по факту использования, где не требуется развертывать серверы и формировать отдельную команду инженеров.

Артем
Автор: Артем
Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.
Комментарии: