Кейсы

Проект «Голосовой и текстовый ИИ-ассистент» для оператора наружной рекламы

Маркетинг Реклама

Кто заказчик:

Сегмент / отрасль:

B2B / наружная реклама и цифровые медиа-решения.

Краткие бизнес-характеристики:

Российский оператор наружной рекламы с обширной сетью рекламных поверхностей по всей стране, охватывающей классические билборды, цифровые конструкции, transit и аэропортовые форматы.

Зачем заказчик обратился

Компания столкнулась с высокой нагрузкой на внутреннюю службу IT-поддержки. Количество обращений сотрудников существенно превышало пропускную способность специалистов, что приводило к:

  • увеличению времени реакции на инциденты;
  • росту очереди заявок;
  • снижению удовлетворённости внутренних пользователей;
  • отвлечению IT-специалистов от более сложных задач.

Заказчику требовалось решение, которое автоматизирует обработку типовых обращений и позволит масштабировать поддержку без пропорционального увеличения штата.

Проблема (боль клиента)

Перегруженность службы поддержки: большой поток типовых обращений («не работает компьютер», «не могу подключиться к VPN», проблемы с доступами и др.) обрабатывался вручную.
Перегруженность службы поддержки: большой поток типовых обращений («не работает компьютер», «не могу подключиться к VPN», проблемы с доступами и др.) обрабатывался вручную.
Низкая скорость обработки заявок: специалисты не успевали оперативно реагировать на все обращения, особенно в периоды пиковых нагрузок.
Отсутствие автоматизированного первичного фильтра: не было механизма, который бы:
  • классифицировал обращения;
  • отсекал некорректные/вредоносные запросы;
  • автоматически решал типовые инциденты без участия инженера.
Недостаточная прозрачность метрик: отсутствовала централизованная система мониторинга эффективности работы ИИ-сервиса и сценариев обработки.

Цель проекта

Что заказчик ожидал получить:

  • Голосового и текстового ИИ-ассистента для автоматизации внутренней IT-поддержки.
  • Возможность взаимодействия через два канала:

  1. Звонок — голосовой бот отвечает и ведёт диалог.
  2. Веб-чат — текстовое взаимодействие.

  • Набор преднастроенных сценариев, например:
  • не работает компьютер;
  • не могу подключиться к VPN;
  • проблемы с доступами и др.
  • Возможность редактирования промптов и логики сценариев без полной переработки системы.
  • Интеграцию с LDAP-авторизацией.
  • Автоматическое создание тикетов в Jira от имени авторизованного пользователя.
  • Масштабируемую архитектуру, готовую к росту нагрузки.

Условия успеха / KPI:

  • Время отклика интерфейса — не более 2 секунд при стандартной нагрузке.
  • Доля ошибок в детерминированных сценариях — не более 0,5%.
  • Отсутствие критических ошибок (обрывов диалога).
  • Поддержка многодиалоговости и хранения истории.
  • Стабильная работа при пиковых нагрузках (масштабирование до кластера из 8 GPU).
  • Полная интеграция с внутренним контуром безопасности компании.

Решение

1) Переработка логики сценариев

  • Оптимизированы логические блоки текстового и голосового бота для масштабирования.
  • Добавлен классификатор вредоносных запросов.
  • Реализован механизм предварительной проверки наличия сценария.

2) Доработка API и авторизации:

  • Реализована многосессионность.
  • Внедрена LDAP-авторизация с ролевой моделью доступа.
  • Обеспечено логирование и маршрутизация запросов.

3) Интеграция с Jira:

  • Передача данных авторизованного пользователя в систему Jira.
  • Создание тикета с указанием реального пользователя (через LDAP).
  • Безопасная передача данных.

4) RAG-модель и администрирование базы знаний:

  • Разработан веб-интерфейс администрирования RAG-модели.
  • Реализовано ручное добавление и редактирование инцидентов.
  • Контроль версий и журналирование изменений.

5) Персонализация бота:

  • Использование атрибутов LDAP (ФИО, подразделение, роль).
  • Индивидуальные сценарии и приветствия.
  • Fallback-режим при недоступности LDAP.

6) Система метрик и мониторинг:

  • Интеграция с Grafana.
  • Дашборды: время отклика, ошибки, активность пользователей, использование сценариев.
  • Обновление данных в реальном времени.

7) Масштабирование голосового сегмента:

  • Нагрузочное тестирование на 2–3 GPU.
  • Перенос на кластер из 8 GPU.
  • Балансировка воркеров и оптимизация распределения нагрузки.

8) Контроль качества логики:

  • Полное покрытие сценариев тест-кейсами.
  • Логирование всех ошибок.
  • Минимизация тупиков и некорректных переходов.

Технологии и инструменты

Архитектура:

Микросервисная архитектура с разделением голосового и текстового сегментов.

Транспорт и очереди:

Внутренние API и механизмы маршрутизации запросов между сервисами.

Веб / API-слой:

REST API, поддержка многосессионности.

Авторизация:

LDAP с ролевой моделью доступа.

Интеграции:

  • Jira (создание тикетов);
  • Grafana (дашборды);
  • Внутренние корпоративные сервисы.

ML‑ядро:

RAG-модель (Retrieval-Augmented Generation) для работы с базой инцидентов.

Инфраструктура:

  • Развёртывание во внутреннем контуре;
  • Кластер до 8 GPU;
  • Оптимизация воркеров;
  • Нагрузочное тестирование.

Результаты

Внедрён голосовой и текстовый ИИ-ассистент, который:
  • Обрабатывает типовые обращения сотрудников без участия инженера.
  • Автоматически классифицирует запросы.
  • Создаёт тикеты в Jira от имени пользователя.
  • Персонализирует общение на основе LDAP.
  • Поддерживает масштабирование при росте нагрузки.
  • Предоставляет прозрачную аналитику через систему метрик.

Влияние на бизнес

  • Снижение нагрузки на IT-службу за счёт автоматизации типовых инцидентов.
  • Сокращение времени реакции на обращения сотрудников.
  • Повышение SLA внутренней поддержки.
  • Возможность масштабирования без пропорционального роста штата.
  • Прозрачность операционных метрик через систему дашбордов.
  • Повышение удовлетворённости внутренних пользователей.