Speech Analytics в колл-центре: расшифровка, QA, поиск…
  • Контакт-центр
  • Автор: Команда CrmAI
  • Опубликовано:
Speech analytics в колл-центре: расшифровка звонков, контроль качества и KPI для казахстанского бизнеса

В офисе алматинского банка сидит Жанна — руководитель контакт-центра. Каждое утро она получает 47 новых жалоб на операторов, 12 записей, которые «нужно срочно прослушать», и отчёт о том, что средняя оценка упала на 0.3 балла. Жанна понимает: если слушать все проблемные звонки вручную, у неё уйдёт примерно 6 часов в день. А ведь ещё есть планёрки, обучение новичков, отчётность перед директором.

Знакомая ситуация? Если вы управляете колл-центром — скорее всего, да. Мы все знаем, что в записях звонков скрыты ответы на главные вопросы бизнеса: почему клиенты уходят, что раздражает людей, какие операторы реально продают, а какие просто «отрабатывают смену». Проблема в том, что этих записей — тысячи часов. И ни один супервайзер физически не может их все прослушать.

Именно поэтому появилась речевая аналитика — технология, которая делает за вас самую рутинную, но важную работу: слушает, расшифровывает, анализирует и показывает, на что обратить внимание. Не заменяет человека, но освобождает его для настоящей работы — принятия решений и работы с командой.

«Когда мы внедрили speech analytics, первое, что обнаружили: 23% операторов систематически не называют продукт по имени. Не потому что не хотят — просто никто раньше этого не замечал. Сотни звонков в день, кто это отследит? Теперь — система. Автоматически. Каждый звонок.»

Руководитель отдела качества
Финтех-компания, Казахстан
Цитата

Что такое речевая аналитика и зачем она нужна

Давайте начнём с простого объяснения. Речевая аналитика (speech analytics) — это технология, которая автоматически превращает аудиозаписи разговоров в текст, а затем анализирует этот текст по заданным вами правилам.

Представьте, что у вас есть очень усидчивый стажёр, который способен слушать 1000 звонков в день, никогда не устаёт, не отвлекается, и при этом отмечает всё, что вы попросите: упоминание конкурентов, жалобы на цену, благодарности, грубость, отклонения от скрипта. Речевая аналитика — это такой стажёр, только цифровой.

Но есть важный нюанс. Сама по себе расшифровка — это только первый шаг. Настоящая ценность появляется, когда вы настроили систему под свои задачи: определили, что искать, как классифицировать, какие метрики считать. Без этой настройки вы получите гору текста, но не получите ответов.

На что способен ваш «цифровой стажёр»

Слышит и записывает

Превращает голос в текст, причём понимает, кто говорит — оператор или клиент. Потом можно искать по словам.

Ловит нужные слова

Конкуренты, жалобы, благодарности, название продукта — система найдёт всё, что вы попросите отслеживать.

Чувствует настроение

Клиент раздражён? Оператор устал? Разговор пошёл не туда? Система это замечает — иногда раньше, чем сам супервайзер.

Проверяет скрипт

Поздоровался? Представился? Предложил помощь? Попрощался нормально? Автоматическая галочка — или красный флаг.

Считает и показывает

Кто из операторов молодец, о чём чаще всего спрашивают, где провалы — всё это на дашборде, а не в голове руководителя.

Бьёт тревогу вовремя

Клиент угрожает жалобой? Уведомление супервайзеру прилетает сразу — пока ещё можно что-то исправить.

Почему ручной контроль качества — это лотерея

Давайте посчитаем. У вас 30 операторов. Каждый принимает 50 звонков в день. Это 1500 звонков ежедневно. За месяц — 30 000.

Отдел качества — два человека. Если они прямо очень стараются, ни на что не отвлекаются, пьют много кофе — они осилят 100 звонков в день. Это 3% от общего потока.

Три процента, Карл.

Причём эти три процента — не случайная выборка. Обычно слушают длинные звонки («там наверняка что-то интересное»), звонки по жалобам, звонки новичков. То есть вы целенаправленно ищете проблемы — и удивляетесь, что находите проблемы. А что в остальных 97%? Может, там операторы делают что-то гениальное, что стоило бы растиражировать. Может, там паттерн, объясняющий падение конверсии. Вы не знаете. Эти записи уходят в архив, и никто их никогда не услышит.

Пока клиент не напишет пост в Instagram с тегом вашей компании. Тогда услышат все.

Сравнение подходов: ручной QA vs. речевая аналитика

Параметр Ручной контроль Speech Analytics
Охват звонков 2-5% от общего объёма 100% — анализируется каждый звонок
Скорость анализа Звонок 5 мин = 7-10 мин на анализ Звонок 5 мин = 30 сек на обработку
Субъективность Высокая: зависит от настроения QA Низкая: одинаковые правила для всех
Масштабируемость Линейная: больше звонков = больше людей Нелинейная: система справляется с ростом
Скорость обратной связи Дни или недели Минуты или часы
Поиск паттернов Практически невозможно Автоматически: тренды, корреляции

Это не значит, что ручной контроль нужно полностью отменить. Опытный QA-специалист видит нюансы, которые машина пока не улавливает: интонацию, контекст, «химию» между оператором и клиентом. Но автоматика берёт на себя рутину, чтобы человек мог сфокусироваться на сложных случаях.

Расшифровка звонков: как это работает технически

Давайте заглянем «под капот» технологии. Понимание того, как устроена расшифровка, поможет вам правильно выбрать решение и настроить его под свои задачи.

Speech-to-Text (STT): превращаем звук в текст

Первый этап — это распознавание речи. Современные STT-системы используют нейросети, обученные на миллионах часов аудио. Они научились понимать разные акценты, справляются с шумом, различают говорящих.

Для казахстанского рынка важный момент: качество распознавания зависит от языка. Русский язык большинство современных систем распознаёт хорошо — точность около 90-95% на чистой записи. С казахским языком ситуация сложнее, но прогресс есть: появляются модели, специально обученные на казахской речи.

Что влияет на качество расшифровки:

  • Качество записи — чем меньше шума, эха и помех, тем точнее результат. Инвестиции в хорошую телефонию окупаются
  • Разделение каналов — если оператор и клиент записаны на разных каналах (стерео), расшифровка точнее
  • Специализированный словарь — система, обученная на банковских терминах, лучше распознает «депозит» и «овердрафт», чем универсальная
  • Адаптация под голоса — некоторые системы умеют «привыкать» к голосам конкретных операторов

Диаризация: кто это сказал?

После расшифровки важно понять, какие реплики принадлежат оператору, а какие — клиенту. Этот процесс называется диаризация (speaker diarization). Если у вас стерео-запись с разделёнными каналами — всё просто. Если моно — система использует алгоритмы для определения смены говорящего.

Зачем это нужно? Чтобы правильно анализировать. Например, если клиент сказал «я недоволен» — это одно. Если оператор сказал «вы недовольны» — это совсем другое. Без диаризации вы не отличите одно от другого.

Иллюстрация

Хотите посмотреть, как это работает на ваших звонках?

Загрузите 10 записей — мы бесплатно покажем, что увидит система и какие инсайты можно получить.

Получить демо-анализ

Что проверять автоматически (и как не сойти с ума от правил)

Расшифровка — это только начало. Текст у вас есть, теперь нужно понять, что с ним делать. И тут важно не перегнуть: если настроите 200 правил, система будет орать красными флагами на каждый второй звонок, и вы перестанете обращать внимание.

Начните с простого. Вот что реально важно проверять.

Скрипт: сказал или нет?

Базовые вещи, которые должны быть в каждом звонке:

Приветствие. Не обязательно слово в слово «Здравствуйте, компания Ромашка, меня зовут Алексей, чем могу помочь?» — но какое-то приветствие должно быть. Система понимает семантику: «Добрый день, Ромашка, Алексей у аппарата» тоже засчитается.

Идентификация клиента. Спросили имя? Номер договора? ИИН? Что-то, что подтверждает — вы говорите с тем, с кем думаете.

Предложение помощи. Не просто ответили на вопрос, а спросили: «Могу чем-то ещё помочь?» Мелочь, но она влияет на NPS.

Прощание. Не бросили трубку, а нормально попрощались. «Спасибо, хорошего дня» — не сложно, но многие забывают.

И отдельно — чего быть НЕ должно. «Я не знаю» без альтернативы. Слова-паразиты в промышленных масштабах. Обещания, которые оператор не может выполнить.

Красные флаги: чего быть не должно

Теперь про плохое. Это вещи, которые система должна ловить и сигнализировать:

Грубость. Оскорбления, сарказм, повышенный тон. Иногда оператор сам не замечает, что скатился в хамство — устал, клиент довёл. Система замечает.

Разозлённый клиент. Угрозы пожаловаться, нецензурная лексика, фразы вроде «это издевательство». Такие звонки нужно разбирать сразу, а не через неделю.

Упоминание конкурентов. «У вас дороже, чем в [название]» — это сигнал SOS для отдела удержания. Клиент уже смотрит на сторону.

Неловкое молчание. Если в разговоре пауза больше 15 секунд — что-то пошло не так. Оператор не знает ответ? Система зависла? Нужно разбираться.

Если вы ещё и продаёте

Для колл-центров с функцией продаж — отдельный слой проверок:

Выявление потребности. Оператор спросил, что нужно клиенту? Или сразу начал продавать? Первое работает лучше.

Работа с возражениями. Клиент сказал «дорого» — оператор сдался или попытался обработать? Сколько попыток было? (Три — норма, после пяти — уже навязчивость.)

Предложение купить. Звучит очевидно, но половина операторов забывает прямо предложить оформить заказ. Рассказали про продукт — и замолчали. А надо спросить: «Оформляем?»

Кросс-продажа. К основному продукту есть что-то дополнительное? Оператор это предложил? Если нет — это упущенная выручка.

Пример автоматического чек-листа качества звонка

Выполнено
  • Приветствие по стандарту
  • Представился по имени
  • Идентифицировал клиента
  • Предложил решение проблемы
  • Прощание по стандарту
Не выполнено / Нарушено
  • Не предложил дополнительную услугу
  • Пауза более 15 секунд (02:34)
  • Обнаружена негативная эмоция клиента

Общая оценка: 78/100

Триггер-фразы: ловушки для важных моментов

Поиск по ключевым словам — это, пожалуй, самая практичная фишка речевой аналитики. Вы говорите системе: «Если кто-то произнесёт вот эти слова — сообщи мне». И она сообщает. Из тысяч звонков.

За годы работы мы собрали целую библиотеку триггеров. Делюсь — пользуйтесь.

Сигналы тревоги (реагировать немедленно)

Эти фразы означают: клиент на грани. Или уже за гранью. Нужно бросать всё и разбираться.

Категория Примеры фраз Действие
Угроза жалобой «напишу жалобу», «обращусь в суд», «позвоню в министерство», «пост в соцсетях» Алерт руководителю, звонок на контроль
Уход к конкуренту «перейду в [название]», «у вас дороже чем у...», «закрою счёт» Передача в отдел удержания
Эмоциональный негатив «достали», «это издевательство», ненормативная лексика Разбор с оператором, возможно — звонок клиенту от руководителя
Технический сбой «не работает», «ошибка», «не могу войти», «списали деньги» Эскалация в техподдержку / IT

Сигналы возможностей (тут можно заработать)

Не все триггеры про проблемы. Некоторые — про деньги, которые лежат на столе.

«А у вас есть ещё...» — клиент сам спрашивает о дополнительных продуктах. Если оператор не предложил — это провал.

«Мы растём» / «открываем филиал» — B2B-золото. Клиенту нужно больше, и он об этом говорит.

«Мой друг пользуется» — потенциальная рекомендация. Можно попросить отзыв или предложить реферальную программу.

«Спасибо, очень помогли» — идеальный момент попросить оценку или отзыв. Клиент доволен прямо сейчас.

Звонки для обучения (золотой фонд)

Отдельная категория: звонки, которые нужно сохранить не для разбора полётов, а для тренинга. Система может автоматически собирать:

Успешные продажи. Звонок закончился сделкой — отлично, разберём, как оператор это сделал.

Красивая работа с возражением. Клиент сначала сказал «нет», потом сказал «да». Что произошло между этими словами? Это надо показывать новичкам.

Спасённый клиент. Пришёл злой, ушёл довольный. Такие звонки — учебник по работе с негативом.

Реальный кейс: как триггеры спасли клиента

Страховая компания настроила триггер на фразу «думаю расторгнуть». За первый месяц система нашла 47 таких звонков. Оказалось, что 80% из них — клиенты, которые не поняли условия полиса и думали, что их «обманули».

Руководитель отдела лично перезвонил каждому из этих клиентов, объяснил условия, предложил помощь. Результат: 38 из 47 клиентов остались. А компания получила сигнал, что нужно переработать объяснение условий при продаже.

Без речевой аналитики эти 47 звонков просто ушли бы в архив. Клиенты ушли бы молча.

Метрики: что измерять и на что забить

Речевая аналитика генерирует тонну данных. Можно измерить всё — от количества «эээ» в речи оператора до средней длины паузы перед ответом. Вопрос: нужно ли?

Нет. Нужны метрики, которые влияют на деньги или клиентский опыт. Остальное — шум.

Что смотреть по каждому оператору

Метрика Что измеряет Целевое значение
Script Compliance Rate % звонков, где скрипт соблюдён полностью 85%+
Negative Sentiment Rate % звонков с негативной эмоцией клиента менее 10%
Cross-sell Offer Rate % звонков, где предложен доп. продукт зависит от политики
Talk Ratio Соотношение речи оператора к клиенту 40/60 — 50/50
Hold Time % % времени, когда клиент на удержании менее 15%
Dead Air % % времени молчания (паузы более 5 сек) менее 5%

Что смотреть по контакт-центру в целом

First Call Resolution (FCR). Какой процент проблем решается с первого звонка? Если клиент перезванивает — либо не помогли, либо недообъяснили. Речевая аналитика покажет почему.

Распределение тем. О чём вообще звонят люди? Если 40% обращений — про одну и ту же проблему, может, проще её починить, чем отвечать?

Escalation Rate. Сколько звонков уходит «на старшего»? Если много — либо операторы не обучены, либо у них нет полномочий решать.

Зачем это всё? Ради денег

Метрики ради метрик — бесполезны. Вот примеры связи с бизнесом:

Операторы с соблюдением скрипта выше 90% закрывают на 23% больше сделок. Это уже не «соблюдение правил ради правил» — это деньги.

Звонки с негативным сентиментом в 4 раза чаще приводят к оттоку. Поймали негатив — спасли клиента — сохранили LTV.

Каждый процент роста FCR экономит условные 50 000 тенге в месяц на повторных звонках. Меньше звонков — меньше нагрузка — меньше затраты.

Как это внедрить (без страданий)

Теория — отлично. Теперь практика. Вот план, который работает для контакт-центров от 10 до 500 операторов.

Сначала — разведка

Прежде чем что-то автоматизировать, поймите, что у вас есть. Где лежат записи? В каком формате? Стерео или моно? Сколько их в день, в месяц?

Есть ли скрипты? Они записаны или «в голове у старших»? Как сейчас работает контроль качества? Кто слушает, сколько, по каким критериям?

И главное: что болит? Какую проблему хотите решить в первую очередь?

Потом — правила игры

Самый важный этап. Вы решаете, что система будет искать. Составляете список обязательных элементов скрипта. Определяете триггер-фразы. Описываете, что такое «хороший звонок».

Совет: не пытайтесь сразу настроить 50 правил. Начните с пяти-десяти самых важных. Посмотрите, как работает. Добавите остальное потом.

Дальше — пилот на маленькой группе

Не раскатывайте сразу на весь контакт-центр. Возьмите 5-10 операторов. Посмотрите: система вообще нормально расшифровывает? Правила срабатывают корректно или ловят ложные цели? QA-специалисты понимают интерфейс? Операторы не саботируют?

По результатам пилота всегда что-то нужно подкрутить. Добавить в словарь профессиональный сленг. Убрать правило, которое орёт на каждый второй звонок. Поправить пороги оценки.

И наконец — встраиваем в жизнь

Речевая аналитика — не отдельный инструмент, на который заходят раз в месяц. Это часть ежедневной работы:

Алерты прилетают супервайзеру в Telegram или в CRM. Дашборд с метриками — на экране руководителя. Данные по оператору — в его карточке. Лучшие звонки автоматически собираются в библиотеку для обучения.

Когда это работает — вы перестаёте замечать систему. Она просто есть. И делает свою работу.

Иллюстрация

Готовы внедрить речевую аналитику?

Проведём аудит вашего контакт-центра, настроим правила анализа, обучим команду. Первая консультация бесплатно.

Получить консультацию

Особенности речевой аналитики для казахстанского рынка

Казахстан имеет свою специфику, которую нужно учитывать при внедрении speech analytics.

Многоязычность

В Казахстане говорят на русском и казахском, часто — переключаются между языками в одном разговоре (code-switching). Хорошая система должна уметь:

  • Распознавать оба языка
  • Корректно обрабатывать смешанную речь
  • Анализировать триггеры на обоих языках

На практике это означает, что вам нужны отдельные словари и правила для казахского и русского языков.

Локальные регуляции

В Казахстане есть требования по хранению персональных данных. Если вы работаете с банковской или страховой информацией, убедитесь, что:

  • Данные хранятся на территории Казахстана или в разрешённых юрисдикциях
  • Есть механизм удаления персональных данных по запросу
  • Доступ к расшифровкам ограничен и логируется

Интеграция с локальными системами

Многие казахстанские компании используют локальные АТС, CRM-системы, ERP. Важно, чтобы речевая аналитика интегрировалась с вашим стеком:

  • Интеграция с — для связи звонков с клиентами и сделками
  • Интеграция с Kaspi — для e-commerce и финтех
  • Поддержка локальных SIP-провайдеров и АТС

Грабли, на которые все наступают

Мы видели много внедрений. Ошибки повторяются. Вот самые частые.

«Настроили и забыли»

Система работает, генерирует отчёты. Которые никто не открывает. Через полгода руководство спрашивает: «А зачем мы за это платим?»

Что делать: назначьте ответственного. Введите еженедельный ритуал — 15 минут на дашборд. Включите метрики в KPI супервайзеров.

Правила жёстче, чем надо

Требуете дословного приветствия: «Добрый день, компания X, меня зовут Y». Оператор говорит: «Здравствуйте, это Y из X» — минус балл. 80% звонков в красной зоне, хотя всё нормально.

Что делать: используйте семантический анализ. Система должна понимать смысл, а не ловить буквы.

Превратили в палку для наказания

Операторы узнали, что их слушают. Стресс, демотивация, попытки обмануть систему («буду говорить приветствие роботу, потом нормально с клиентом»).

Что делать: позиционируйте как инструмент помощи, не надзора. Показывайте лучшие практики, а не только ошибки. Хвалите за рост.

Забыли про контекст

Клиент сказал «это ужасно» — система пометила как негатив. Но он говорил про конкурента. Оператор не предложил продукт — минус. Но клиент звонил с жалобой на брак, какие тут продажи?

Что делать: учитывайте тип звонка. Настраивайте исключения. Регулярно проверяйте, адекватно ли срабатывают правила.

Данные есть, а обучения нет

Система нашла 50 операторов, которые не умеют работать с возражениями. И что? Если нет тренинговой программы — цифры так и останутся цифрами.

Что делать: свяжите аналитику с обучением. Используйте найденные звонки как материал для разбора. Отслеживайте, растут ли показатели после тренинга.

Итог: это уже не вопрос «надо или нет»

Пять лет назад речевая аналитика стоила как крыло самолёта и была доступна только крупным банкам. Сегодня — облачные решения, оплата за минуту, готовые интеграции. Порог входа снизился в разы.

Для контакт-центра от 20 операторов это уже не вопрос «нужно или не нужно». Это вопрос «когда начнём». Потому что конкуренты, скорее всего, уже начали.

Что вы получаете на практике:

100% охват вместо выборочных 3%. Вы видите всё, а не случайный кусочек.

Объективность. Одни правила для всех. Без «этот оператор мне нравится, поэтому я его не замечаю».

Скорость. Проблема видна сразу, а не через неделю, когда клиент уже ушёл.

Инсайты. Паттерны, которые невозможно заметить, слушая по 10 звонков в день.

Начните с малого. Загрузите сотню звонков. Настройте пять правил. Посмотрите, что получится. А дальше — масштабируйте то, что работает.

И помните: сама по себе технология ничего не меняет. Меняют решения, которые вы принимаете на основе данных. Технология — только инструмент. Но очень, очень полезный.