ИИ в создании технических документов: автоматизация процесса без ошибок

Изображение: recraft
Сложно представить себе работу любой компании без какого-либо определенного порядка действий, процессов, процедур взаимодействия и т.д. Все это настолько привычно, что мало кто задумывается «а что же такое регламент?», «как он разрабатывается?», «кто его поддерживает в актуальном состоянии?». В сфере информационной безопасности данные документы приобретают отдельную значимость, в первую очередь это связано с особенностями работы: обеспечении сохранности и конфиденциальности информации, бесперебойности бизнес-процессов и так далее. Принято выделять отдельно не просто «регламент», а еще и «политику безопасности» как более высокоуровневый документ. Если посмотреть на формализованные определения этих двух понятий, то можно достаточно четко определить разницу между ними.
Политика безопасности — набор правил и норм, определяющих, каким образом обеспечивается безопасность в организации. В этом документе также описываются основные риски и меры по их предотвращению, выявлению и нейтрализации.
Регламент —официальный документ, который устанавливает порядок и правила выполнения определенных процессов, процедур или деятельности в организации. Регламенты могут включать в себя инструкции, правила, положения, шаблоны, образцы и другую информацию, необходимую для работы сотрудников.
Это обязательные составляющие для документационного обеспечения эффективной системы информационной безопасности. В идеальном случае — именно по ним будет «жить» часть (возможно, большая) бизнес-процессов компании. Однако отслеживание всех изменений, постоянная корректировка документов, написание новых документов на новые процессы требует очень много сил и времени, а документация при этом всё равно постоянно устаревает. И это еще мы не касаемся кадрового вопроса — так как найти хорошего специалиста в этой сфере также весьма непросто. На практике же, при создании или обновлении регламента или политики ИБ, сначала ищут пример, чтобы по нему сделать свой документ с нужными поправками. В свободном информационном поле (на просторах интернета) можно найти большое количество примеров. С одной стороны, это дает массу информации, с другой — иногда серьезно мешает именно своим разнообразием.
Решение этого вопроса прошло достаточно долгий путь — начиная от конструкторов документов, заканчивая сегодняшним применением нейросетевых моделей с обработкой естественного языка (LLM).
Как работает ИИ для написания документов
Основной движущей силой ИИ в этой области является алгоритм обработки естественного языка (NLP). Этот алгоритм позволяет системе понимать контекст, анализировать введенную информацию и генерировать текст автоматически. Процесс включает несколько этапов:
- cбор данных: ИИ использует массивы данных, собранные из различных источников — форумы, документацию и даже опыты пользователей.
- анализ: LLM обрабатывает данные, выявляя ключевые аспекты, которые важно включить в инструкцию. Качество сильно зависит от опыта написания promt-запроса.
— генерация текста: модель формирует текстовые инструкции в структурированном виде. Необходимо обязательно ставить критерии целевой аудитории и уровня сложности документа.
— редактирование: часть современных систем предлагают интеграцию с редакторами, где специалисты могут вносить изменения и оптимизировать итоговый текст.
Необходимо также сказать, что появились системы обратного преобразования: на основе схемы можно генерировать описание, с привлечением обученной модели, которая берет текст из анализа открытой информации. Как правило, это расширение модулей систем бизнес-аналитики (примерами могут служить системы типа ELMA, GREENDATA и другие), либо есть отдельно созданные сервисы.
ИИ и техническая документация: когда это лучшее решение?
Практика показывает, что использование ИИ для создания инструкций становится не только трендом, но и необходимостью, учитывая скорость и динамичность развития технологий. Более того, развитие и следующие поколения языковых моделей достаточно часто «пишут» документы лучше, чем начинающие специалисты. Есть области, в которых применение ИИ, наверное, уже практически обязательно — настолько хороший эффект они дают. Такие, как:
— написание инструкций, правил применения для программных продуктов с высокой сложностью;
— систем, требующих частых обновлений. В случаях, когда не требуется большого изменения контента, только какой-то части;
— необходимостью создания многоязычных инструкций;
— создание образовательных материалов, на основе документов, инструкций компании — для внутреннего обучения персонала.
Применение ИИ может значительно улучшить качество документации и уровень поддержки пользователей и решить проблему задержки в обновлениях документации. Это серьезно снижает трудозатраты.
Сложность применения ИИ для написания технических документов
Казалось бы, языковые модели показали себя весьма эффективными при работе с различными типами документов, включая и технические. Но как обычно, проблема кроется в специфике, которую ИИ пока не в состоянии учесть. Речь идет о контексте той или иной задачи, которую трудно формализовать. На сегодняшний день не существует языковых моделей, которые способны обучаться не на обработке текстов, а на семантике.
Поэтому надо четко понимать, где проходит грань между применением ИИ в задачах создания регламентов и политиками безопасности. Если можно отнести организацию к достаточно типовой, с отсутствием явно выраженной специфики, тогда помощь ИИ инструментов будет весьма эффективной, возможно, даже заменяющей специалиста (не будет необходимости выделять время или отдельного сотрудника для решения задачи).
Анализируя сложности применения ИИ для написания регламентов, технических инструкций или политик безопасности можно кратко выделить основные проблемы:
— чем специфичнее задача, тем меньше для нее данных. Это напрямую ведет к качеству получаемого текста, так как на данных обучается модель. Плохие датасеты ведут к плохим результатам.
— полное отсутствие креативности: ИИ хорошо справляется с рутинными задачами, но может не улавливать нюансы и оригинальные идеи, которые способны улучшить документацию.
— обязательная необходимость редактирования текста: часто требуется дополнительная вычитка и исправление текстов, сгенерированных ИИ, чтобы достичь желаемого уровня качества.
— в сфере ИБ серьезная ограниченность тематики: ИИ может не всегда понимать специфику определенных областей, что приводит к ошибкам в фактах и интерпретациях. Плюс не стоит забывать о рисках «отравления» данных, которые в конечном итоге могут дать совершенно обратный результат.
Практический совет: порядок действий при работе с ИИ для решения задачи написания технических инструкций, регламентов и/или политик безопасности.
Тексты должны быть чёткими и структурированными, поэтому следует уделить внимание подготовке исходной информации, необходимой для работы с ИИ.
1. Четко формулируйте задания
При взаимодействии с нейросетью важно конкретно формулировать запросы. Обязательные указания к тексту запроса: целевая аудитория, уровень сложности текста, стиль и ключевые моменты, которые должны быть освещены.
2. Сгенерируйте для себя шаблоны
Создайте для себя несколько первоначальных шаблонов — это серьезно поможет в формировании исходных документов и сделает текст более однородным. Каждый шаблон может включать предварительно заданные заголовки, списки требований и стандартные формулировки. Вам в будущее мне придется серьезно править текст при проверке.
3. Не ждите итоговый результат вследствие одного запроса. Работайте итеративно
LLM может создать черновик текста. Заходите в текст, проверяйте его на наличие ошибок, уточняйте формулировки и добавляйте нужные детали. Регулярная обратная связь позволит нейросети лучше адаптироваться к вашим требованиям.
4. Пробуйте разные стили текста
LLM могут работать в нескольких стилях — от формального до более разговорного. Проводите тесты и выбирайте тот формат, который наиболее подходит конкретному документу.
5. Дайте LLM исходные данные, не надейтесь на просторы интернета
Используйте возможность учить нейросеть на собственных данных. Предоставляйте ИИ примеры, которые отражают требуемый стиль и содержание. Это намного упростит вам задачу. Плюс Вы сразу обучите LLM на тех данных, которые важны. В случае если исходных данных как раз нет, начните формировать документы под ваш стиль. И в будущем внесите эти тексты уже как исходные для обучения вашей модели.
6. Планируйте структуру документа
Перед началом работы создайте детальный план документации. Схема, включающая основные разделы и пункты, поможет нейросети следовать заданному курсу и избегать пропусков в информации.
7. Оценка релевантности источников информации
Ошибка сегодняшнего дня — «вслепую» доверять источникам. Необходимо проверять информацию, делать сверку из различных источников и только после этого «принимать на веру» данные, предоставленную LLM. Даже по задачам, в которых у вас нет компетенций.
Скорость рабочих процессов на сегодняшний день весьма высока, поэтому все, что позволяет снизить нагрузку и обеспечить генерацию необходимых документов — просто обязательно должно быть внедрено в рабочий процесс. При этом необходимо обеспечивать и вопросы информационной безопасности: не стоит применять облачные модели или open-source решения для генерации внутренних документов, для которых должен быть обеспечен режим конфиденциальности. В таких случаях используйте локальные версии моделей, генерируйте только части документов. Только практика применения покажет наиболее удобный и эффективный вариант применения ИИ- инструментов в каждой конкретной организации, но используя опыт — уже можно выявить некоторые инструкции, которые мы обсудили в статье.
Автор – Жукова Марина, сервисный менеджер УЦСБ SOC.

