Проект «Голосовой и текстовый ИИ-ассистент» для оператора наружной рекламы

Кто заказчик:

Сегмент / отрасль:

B2B / наружная реклама и цифровые медиа-решения.

Краткие бизнес-характеристики:

Российский оператор наружной рекламы с обширной сетью рекламных поверхностей по всей стране, охватывающей классические билборды, цифровые конструкции, transit и аэропортовые форматы.

Зачем заказчик обратился

Компания столкнулась с высокой нагрузкой на внутреннюю службу IT-поддержки. Количество обращений сотрудников существенно превышало пропускную способность специалистов, что приводило к:

увеличению времени реакции на инциденты;
росту очереди заявок;
снижению удовлетворённости внутренних пользователей;
отвлечению IT-специалистов от более сложных задач.

Заказчику требовалось решение, которое автоматизирует обработку типовых обращений и позволит масштабировать поддержку без пропорционального увеличения штата.

Проблема (боль клиента)

Перегруженность службы поддержки: большой поток типовых обращений («не работает компьютер», «не могу подключиться к VPN», проблемы с доступами и др.) обрабатывался вручную.

Низкая скорость обработки заявок: специалисты не успевали оперативно реагировать на все обращения, особенно в периоды пиковых нагрузок.

Отсутствие автоматизированного первичного фильтра: не было механизма, который бы:

классифицировал обращения;
отсекал некорректные/вредоносные запросы;
автоматически решал типовые инциденты без участия инженера.

Недостаточная прозрачность метрик: отсутствовала централизованная система мониторинга эффективности работы ИИ-сервиса и сценариев обработки.

Цель проекта

Что заказчик ожидал получить:

Голосового и текстового ИИ-ассистента для автоматизации внутренней IT-поддержки.
Возможность взаимодействия через два канала:

Звонок — голосовой бот отвечает и ведёт диалог.
Веб-чат — текстовое взаимодействие.

Набор преднастроенных сценариев, например:
не работает компьютер;
не могу подключиться к VPN;
проблемы с доступами и др.
Возможность редактирования промптов и логики сценариев без полной переработки системы.
Интеграцию с LDAP-авторизацией.
Автоматическое создание тикетов в Jira от имени авторизованного пользователя.
Масштабируемую архитектуру, готовую к росту нагрузки.

Условия успеха / KPI:

Время отклика интерфейса — не более 2 секунд при стандартной нагрузке.
Доля ошибок в детерминированных сценариях — не более 0,5%.
Отсутствие критических ошибок (обрывов диалога).
Поддержка многодиалоговости и хранения истории.
Стабильная работа при пиковых нагрузках (масштабирование до кластера из 8 GPU).
Полная интеграция с внутренним контуром безопасности компании.

Решение

1) Переработка логики сценариев

Оптимизированы логические блоки текстового и голосового бота для масштабирования.
Добавлен классификатор вредоносных запросов.
Реализован механизм предварительной проверки наличия сценария.

2) Доработка API и авторизации:

Реализована многосессионность.
Внедрена LDAP-авторизация с ролевой моделью доступа.
Обеспечено логирование и маршрутизация запросов.

3) Интеграция с Jira:

Передача данных авторизованного пользователя в систему Jira.
Создание тикета с указанием реального пользователя (через LDAP).
Безопасная передача данных.

4) RAG-модель и администрирование базы знаний:

Разработан веб-интерфейс администрирования RAG-модели.
Реализовано ручное добавление и редактирование инцидентов.
Контроль версий и журналирование изменений.

5) Персонализация бота:

Использование атрибутов LDAP (ФИО, подразделение, роль).
Индивидуальные сценарии и приветствия.
Fallback-режим при недоступности LDAP.

6) Система метрик и мониторинг:

Интеграция с Grafana.
Дашборды: время отклика, ошибки, активность пользователей, использование сценариев.
Обновление данных в реальном времени.

7) Масштабирование голосового сегмента:

Нагрузочное тестирование на 2–3 GPU.
Перенос на кластер из 8 GPU.
Балансировка воркеров и оптимизация распределения нагрузки.

8) Контроль качества логики:

Полное покрытие сценариев тест-кейсами.
Логирование всех ошибок.
Минимизация тупиков и некорректных переходов.

Технологии и инструменты

Архитектура:

Микросервисная архитектура с разделением голосового и текстового сегментов.

Транспорт и очереди:

Внутренние API и механизмы маршрутизации запросов между сервисами.

Веб / API-слой:

REST API, поддержка многосессионности.

Авторизация:

LDAP с ролевой моделью доступа.

Интеграции:

Jira (создание тикетов);
Grafana (дашборды);
Внутренние корпоративные сервисы.

ML‑ядро:

RAG-модель (Retrieval-Augmented Generation) для работы с базой инцидентов.

Инфраструктура:

Развёртывание во внутреннем контуре;
Кластер до 8 GPU;
Оптимизация воркеров;
Нагрузочное тестирование.

Результаты

Внедрён голосовой и текстовый ИИ-ассистент, который:

Обрабатывает типовые обращения сотрудников без участия инженера.
Автоматически классифицирует запросы.
Создаёт тикеты в Jira от имени пользователя.
Персонализирует общение на основе LDAP.
Поддерживает масштабирование при росте нагрузки.
Предоставляет прозрачную аналитику через систему метрик.

Влияние на бизнес

Снижение нагрузки на IT-службу за счёт автоматизации типовых инцидентов.
Сокращение времени реакции на обращения сотрудников.
Повышение SLA внутренней поддержки.
Возможность масштабирования без пропорционального роста штата.
Прозрачность операционных метрик через систему дашбордов.
Повышение удовлетворённости внутренних пользователей.