Senior ML Engineer [CICADA8]

Требуемый опыт: От 3 до 6 лет
График: Гибрид
Тип занятости: Полная занятость
Адрес: Москва Замоскворецкая линия метро Технопарк

CICADA8 занимается разработкой продуктов и услуг, направленных на выявление и управление уязвимостями в кибер-безопасности.

Мы разрабатываем передовые технологии защиты информации и помогаем нашим клиентам повысить уровень безопасности своего бизнеса.

Сейчас мы ищем Senior ML Engineer, который готов глубоко погрузиться в работу с LLM, дообучение моделей и разработку агентских систем для задач информационной безопасности.

Наш стек: Python, PyTorch, TensorFlow, scikit-learn, XGBoost, CatBoost, Transformers, NLP, SFT, LoRA / QLoRA, PEFT, vLLM, Hugging Face, LangChain, LangGraph, LlamaIndex, Agno, RAG, Qdrant, pgvector, ONNX, TensorRT, FastAPI, NATS, MLflow, MLOps / LLMOps, Elasticsearch, Kafka, ClickHouse, Docker, Linux, Git.

Чем предстоит заниматься:

  • дообучать и адаптировать LLM под задачи информационной безопасности (SFT, LoRA / QLoRA, PEFT), готовить данные для обучения и оценивать качество результата;
  • разворачивать, оптимизировать и сопровождать on-prem модели в закрытом контуре компании;
  • проектировать и разрабатывать агентские системы на архитектурном уровне: создавать мультиагентные пайплайны, организовывать память и оркестрацию, настраивать взаимодействие агентов и обрабатывать сложные сценарии;
  • строить и развивать RAG-пайплайны для внутренних продуктов (чат-боты по продуктам, генерация презентаций и документов);
  • быстро проверять гипотезы: прототипировать, собирать PoC и MVP, оценивать метрики и качество моделей;
  • собирать и обрабатывать датасеты по тематике ИБ (пентест, выявление уязвимостей, детект фишинга);
  • выстраивать масштабируемые MLOps / LLMOps-процессы: выбирать инструменты и обеспечивать стабильную работу моделей в продакшене;
  • вести эксперименты и A/B-тесты, мониторить и постоянно улучшать качество моделей и агентов

Кого мы ищем:

  • Уверенный опыт в NLP и дообучении LLM: SFT, LoRA / QLoRA, PEFT. Важно, чтобы вы понимали, какой подход выбрать под задачу и как готовить данные для обучения;
  • практический опыт разворачивания и оптимизации on-prem моделей;
  • сильный опыт разработки агентских систем с пониманием их архитектуры: проектирование мультиагентных пайплайнов, организация памяти, оркестрации и взаимодействия агентов. Уверенное владение LangChain, LangGraph, LlamaIndex, Agno и аналогами;
  • опыт построения RAG-пайплайнов;
  • опыт построения MLOps / LLMOps-процессов: выбор инструментов, деплой, мониторинг и поддержка моделей в продакшене;
  • уверенное владение ML-фреймворками: PyTorch, TensorFlow, scikit-learn, XGBoost, CatBoost, Transformers;
  • опыт работы с большими объёмами данных: сбор, логирование, нормализация, хранение и парсинг с использованием современных инструментов (Elasticsearch, Kafka, ClickHouse);
  • практический опыт коммерческой разработки: ONNX, TensorRT, FastAPI, NATS, Docker;
  • умение эффективно формировать и обрабатывать датасеты (подготовка, аугментация, балансировка) и анализировать метрики качества моделей (mAP, F1-score и др.);
  • упыт в RnD будет плюсом.

Что мы предлагаем:

  • ДМС с первого месяца работы — 100% покрытие всех медицинских расходов, включая стоматологию;
  • выгодные скидки и специальные предложения от партнеров на фитнес, курсы английского и другие полезные активности;
  • возможность участвовать во внешних конференциях и повышать квалификацию за счёт компании через внешнее обучение;
  • работа в команде профессионалов, готовых делиться знаниями;
  • открытая и дружелюбная корпоративная культура, где каждый чувствует себя частью единой команды, общается на равных и всегда на «ты». Мы ценим вклад каждого, поддерживаем инициативность и создаём комфортные условия для профессионального и личностного роста.
RED Security
Автор: RED Security
Открытая экосистема ИБ-решений и экспертизы для комплексной защиты бизнеса
Комментарии: