Кто заказчик:
Сегмент / отрасль:
B2B / наружная реклама и цифровые медиа-решения.
Краткие бизнес-характеристики:
Российский оператор наружной рекламы с обширной сетью рекламных поверхностей по всей стране, охватывающей классические билборды, цифровые конструкции, transit и аэропортовые форматы.
Зачем заказчик обратился
Компания столкнулась с высокой нагрузкой на внутреннюю службу IT-поддержки. Количество обращений сотрудников существенно превышало пропускную способность специалистов, что приводило к:
Заказчику требовалось решение, которое автоматизирует обработку типовых обращений и позволит масштабировать поддержку без пропорционального увеличения штата.
- увеличению времени реакции на инциденты;
- росту очереди заявок;
- снижению удовлетворённости внутренних пользователей;
- отвлечению IT-специалистов от более сложных задач.
Заказчику требовалось решение, которое автоматизирует обработку типовых обращений и позволит масштабировать поддержку без пропорционального увеличения штата.
Проблема (боль клиента)
Перегруженность службы поддержки: большой поток типовых обращений («не работает компьютер», «не могу подключиться к VPN», проблемы с доступами и др.) обрабатывался вручную.
Перегруженность службы поддержки: большой поток типовых обращений («не работает компьютер», «не могу подключиться к VPN», проблемы с доступами и др.) обрабатывался вручную.
Низкая скорость обработки заявок: специалисты не успевали оперативно реагировать на все обращения, особенно в периоды пиковых нагрузок.
Отсутствие автоматизированного первичного фильтра: не было механизма, который бы:
- классифицировал обращения;
- отсекал некорректные/вредоносные запросы;
- автоматически решал типовые инциденты без участия инженера.
Недостаточная прозрачность метрик: отсутствовала централизованная система мониторинга эффективности работы ИИ-сервиса и сценариев обработки.
Цель проекта
Что заказчик ожидал получить:
- Голосового и текстового ИИ-ассистента для автоматизации внутренней IT-поддержки.
- Возможность взаимодействия через два канала:
- Звонок — голосовой бот отвечает и ведёт диалог.
- Веб-чат — текстовое взаимодействие.
- Набор преднастроенных сценариев, например:
- не работает компьютер;
- не могу подключиться к VPN;
- проблемы с доступами и др.
- Возможность редактирования промптов и логики сценариев без полной переработки системы.
- Интеграцию с LDAP-авторизацией.
- Автоматическое создание тикетов в Jira от имени авторизованного пользователя.
- Масштабируемую архитектуру, готовую к росту нагрузки.
Условия успеха / KPI:
- Время отклика интерфейса — не более 2 секунд при стандартной нагрузке.
- Доля ошибок в детерминированных сценариях — не более 0,5%.
- Отсутствие критических ошибок (обрывов диалога).
- Поддержка многодиалоговости и хранения истории.
- Стабильная работа при пиковых нагрузках (масштабирование до кластера из 8 GPU).
- Полная интеграция с внутренним контуром безопасности компании.
Решение
1) Переработка логики сценариев
- Оптимизированы логические блоки текстового и голосового бота для масштабирования.
- Добавлен классификатор вредоносных запросов.
- Реализован механизм предварительной проверки наличия сценария.
2) Доработка API и авторизации:
- Реализована многосессионность.
- Внедрена LDAP-авторизация с ролевой моделью доступа.
- Обеспечено логирование и маршрутизация запросов.
3) Интеграция с Jira:
- Передача данных авторизованного пользователя в систему Jira.
- Создание тикета с указанием реального пользователя (через LDAP).
- Безопасная передача данных.
4) RAG-модель и администрирование базы знаний:
- Разработан веб-интерфейс администрирования RAG-модели.
- Реализовано ручное добавление и редактирование инцидентов.
- Контроль версий и журналирование изменений.
5) Персонализация бота:
- Использование атрибутов LDAP (ФИО, подразделение, роль).
- Индивидуальные сценарии и приветствия.
- Fallback-режим при недоступности LDAP.
6) Система метрик и мониторинг:
- Интеграция с Grafana.
- Дашборды: время отклика, ошибки, активность пользователей, использование сценариев.
- Обновление данных в реальном времени.
7) Масштабирование голосового сегмента:
- Нагрузочное тестирование на 2–3 GPU.
- Перенос на кластер из 8 GPU.
- Балансировка воркеров и оптимизация распределения нагрузки.
8) Контроль качества логики:
- Полное покрытие сценариев тест-кейсами.
- Логирование всех ошибок.
- Минимизация тупиков и некорректных переходов.
Технологии и инструменты
Архитектура:
Микросервисная архитектура с разделением голосового и текстового сегментов.
Транспорт и очереди:
Внутренние API и механизмы маршрутизации запросов между сервисами.
Веб / API-слой:
REST API, поддержка многосессионности.
Авторизация:
LDAP с ролевой моделью доступа.
Интеграции:
- Jira (создание тикетов);
- Grafana (дашборды);
- Внутренние корпоративные сервисы.
ML‑ядро:
RAG-модель (Retrieval-Augmented Generation) для работы с базой инцидентов.
Инфраструктура:
- Развёртывание во внутреннем контуре;
- Кластер до 8 GPU;
- Оптимизация воркеров;
- Нагрузочное тестирование.
Результаты
Внедрён голосовой и текстовый ИИ-ассистент, который:
- Обрабатывает типовые обращения сотрудников без участия инженера.
- Автоматически классифицирует запросы.
- Создаёт тикеты в Jira от имени пользователя.
- Персонализирует общение на основе LDAP.
- Поддерживает масштабирование при росте нагрузки.
- Предоставляет прозрачную аналитику через систему метрик.
Влияние на бизнес
- Снижение нагрузки на IT-службу за счёт автоматизации типовых инцидентов.
- Сокращение времени реакции на обращения сотрудников.
- Повышение SLA внутренней поддержки.
- Возможность масштабирования без пропорционального роста штата.
- Прозрачность операционных метрик через систему дашбордов.
- Повышение удовлетворённости внутренних пользователей.