AIOps-платформа Artimate встроила собственную языковую модель

AIOps-платформа Artimate встроила собственную языковую модель

Модель работает внутри закрытого контура и на данный момент оптимизирует четыре ключевых сценария работы инженеров по мониторингу ИТ-инфраструктуры.

Почему не внешний API

Подключение к коммерческим LLM — ChatGPT, GigaChat, YandexGPT — даёт быстрый старт, но сопряжено с ограничениями. Данные о событиях ИТ-инфраструктуры покидают периметр компании, модель не обладает контекстом конкретной среды, а качество ответа напрямую зависит от полноты промпта. Для крупного бизнеса и организаций государственного сектора передача операционных данных во внешние сервисы нередко исключена как по юридическим, так и по организационным причинам.

Собственная модель, дообученная на специализированных данных, решает профильные задачи точнее и полностью остаётся внутри инфраструктуры заказчика.

Четыре сценария первого этапа интеграции LLM в платформу

В версии 1.6.0 LLM интегрирована в четыре направления.

Поиск по внутренней базе знаний компании (RAG).

Раньше инженер, которому нужна была инструкция — например, как настроить интеграцию с Zabbix— переключался между вкладками wiki и внутренними хранилищами документации, тратя на поиск несколько минут. Теперь LLM подключена к единому корпоративному хранилищу: пользователь задает вопрос на естественном языке прямо в интерфейсе Artimate и получает точный ответ с пошаговой инструкцией.

В результате сокращается время на поиск по базе знаний, а работа с документацией становится частью одного рабочего окна.

Подбор регулярных выражений

Настройка правил обогащения событий требует умения составлять регулярные выражения — навыка, которым обладают не все специалисты по мониторингу. Теперь в диалоговом окне достаточно описать задачу словами: «Составь регулярное выражение для поиска IP-адресов в событиях». LLM анализирует запрос, сверяет его с существующим справочником Regex и либо предлагает оптимальное готовое решение, либо генерирует новое выражение с пояснением логики, исключая ошибки при ручном копировании сложных конструкций.

В результате настройка обогащения ускоряется, снижается зависимость от узких технических навыков и уменьшается риск ошибок при ручной работе с шаблонами.

Присвоение кластерам имен на основе входящих в них событий в модели кластеризации

Стандартные алгоритмы кластеризации часто формируют технические группы с обезличенными названиями вроде cluster47, которые не помогают быстро понять, что именно произошло в системе. Чтобы упростить работу инженера, LLM анализирует состав каждого кластера и подбирает для него смысловое название, отражающее общий характер входящих событий. Пользователь запускает переименование прямо на странице модели кластеризации после расчета и получает кластеры с понятными названиями, которые проще использовать в анализе и при работе с корреляционным графом.

В результате не нужно вручную просматривать содержимое каждого кластера, а структура инцидентов становится понятнее с первого взгляда

Оптимизация кластеров

Даже после расчета модели кластеризации остается возможность улучшить маски и повысить качество группировки событий. Если делать это вручную, специалисту нужно глубоко погружаться в контекст каждого кластера, сопоставлять события между собой и тратить на анализ много времени. LLM упрощает этот процесс: она получает список событий, видит их распределение по кластерам и на основе взаимосвязей предлагает, какие кластеры стоит объединить, а какие — разделить. Пользователь отправляет запрос на оптимизацию и получает понятное объяснение причин, например: «Рекомендуется объединить cluster1 и cluster2, так как оба лога относятся к ошибкам HDFS при распределении блоков».

В результате повышается точность модели кластеризации, а сама система постепенно становится более “умной”: инженеры получают экспертные подсказки там, где раньше уходили часы на ручное исследование.

Планы по развитию

Релиз 1.6.0 — первый этап встраивания LLM в платформу. В ближайших планах команды — расширить применение модели на создание сущностей через диалоговое окно и автоматическую подготовку отчётов с анализом инцидентов.

Artimate
Автор: Artimate
Artimate — интеллектуальная AIOps-платформа, которая выступает единым интерфейсом для всех данных ИТ-мониторинга. Платформа использует инструменты ML-анализа для корреляции событий событий из систем мониторинга, объединения инцидентов в единую картину, поиска первопричин и предотвращения сбоев до их влияния на бизнес-сервисы.
Комментарии: