Бекзат запустил чат-бота для своего интернет-магазина электроники в Нур-Султане три месяца назад. Вложил деньги в разработку, интегрировал с CRM, обучил на базе знаний о товарах. Красиво. Современно. Клиенты пишут.
А потом случилось то, что случается с большинством ботов: он просто... работал. Как-то. Никто не мог сказать — хорошо или плохо. Бот отвечал, иногда переводил на операторов, иногда справлялся сам. Продажи вроде бы не упали, но и чуда не произошло.
«Я понял, что понятия не имею, приносит ли бот пользу», — признался мне Бекзат. «Потратил полтора миллиона тенге, а не могу ответить на простой вопрос: это инвестиция или выброшенные деньги?»
Знакомая ситуация? Если да — вы не одиноки. По нашим наблюдениям, больше половины компаний в Казахстане, внедривших AI-ботов, не отслеживают вообще никаких метрик. Ещё треть смотрит только на количество диалогов — и всё. Это как управлять машиной, глядя только на спидометр и игнорируя остальные приборы.
В этой статье я расскажу про 15 метрик, которые действительно важны для понимания эффективности бота. Не потому что это красивые графики для презентаций, а потому что каждая из них отвечает на конкретный бизнес-вопрос. И да — мы разберём, какие значения считать хорошими, а какие должны вас насторожить.
«Что измеряешь — тем управляешь. Бот без метрик — это чёрный ящик, в который вы кидаете деньги и надеетесь на лучшее. С метриками — это инструмент, который можно настраивать, улучшать и масштабировать.»
Прежде чем погружаться в конкретные показатели, давайте разберёмся, зачем это нужно. Потому что «просто потому что так принято» — не ответ.
Метрики бота работают на трёх уровнях, и каждый уровень решает свои задачи.
Бот работает? Не сломался? Отвечает вовремя? Это здоровье системы — основа основ.
Клиенты довольны? Бот решает их проблемы? Не раздражает? Это про пользу для клиента.
Бот приносит деньги? Экономит ресурсы? Влияет на продажи? Это про ROI.
Большинство компаний застревает на первом уровне. «Бот работает, диалоги идут — значит, всё нормально». Но это как измерять успех магазина по количеству посетителей, игнорируя выручку и средний чек.
Идеальный дашборд содержит метрики всех трёх уровней. Причём не двадцать-тридцать, от которых рябит в глазах, а 10-15 ключевых показателей, которые действительно влияют на решения. Давайте разберём каждый.
Эти метрики показывают, жив ли бот и насколько стабильно он работает. Без них всё остальное не имеет смысла — какой толк в высоком CSAT, если бот половину времени недоступен?
Что измеряет: Какой процент времени бот доступен и отвечает на запросы.
Формула: (Общее время - Время простоя) / Общее время × 100%
Хорошо: 99.5%+ (не более 3.6 часа простоя в месяц)
Плохо: <98% (больше 14 часов простоя в месяц)
Кажется очевидным, но удивительно много ботов «падают» в самый неподходящий момент — в пятницу вечером, когда разработчики уже отдыхают, или в праздники, когда трафик пиковый. Настройте мониторинг и алерты. Бот должен быть доступен, когда он нужен клиентам, а не когда удобно IT-отделу.
Что измеряет: Сколько секунд проходит от получения сообщения клиента до отправки ответа ботом.
Что отслеживать: Медиану (P50), 90-й перцентиль (P90), максимум
Хорошо: P50 <3 сек, P90 <8 сек
Плохо: P50 >10 сек (клиенты уходят)
Люди нетерпеливы. Исследования показывают: если ответ приходит дольше 10 секунд, часть пользователей просто закрывает чат. Причём важен не средний показатель, а перцентили — если 10% запросов обрабатываются по 30 секунд, это серьёзная проблема, даже если среднее выглядит прилично.
Частая причина высокой задержки — сложные запросы к базе знаний или перегруженный LLM-провайдер. Отслеживайте, какие типы запросов тормозят, и оптимизируйте именно их.
Что измеряет: Какой процент запросов завершается ошибкой — таймаутом, сбоем API, необработанным исключением.
Не путать с: Ситуациями, когда бот честно сказал «не знаю» — это не ошибка, это корректное поведение.
Хорошо: <0.5%
Плохо: >2% (системная проблема)
Важно различать типы ошибок. Таймаут LLM-провайдера — одна история (нужен fallback). Ошибка парсинга ответа — другая (баг в коде). Недоступность CRM для записи данных — третья (проблема интеграции). Каждый тип требует своего решения.
Подробнее о том, как строить устойчивую архитектуру бота, читайте в статье Катастрофоустойчивость для AI-ботов.
Что измеряет: Объём активности — сколько диалогов в день/неделю, сколько сообщений в диалоге.
Зачем нужно: Понять нагрузку, спланировать ресурсы, заметить аномалии
Типично: 3-7 сообщений на диалог
Аномалия: Резкий рост/падение (>30%)
Сами по себе эти числа мало что значат — 100 диалогов в день для салона красоты в Алматы это много, а для маркетплейса — капля в море. Но динамика важна. Резкий рост может означать удачную маркетинговую кампанию (хорошо) или вирусную проблему, которую все обсуждают (плохо). Резкое падение — сезонность (нормально) или сломанный виджет (катастрофа).
Бот работает стабильно — отлично. Но это не значит, что он полезен. Метрики качества отвечают на главный вопрос: решает ли бот проблемы клиентов или только создаёт новые?
Что измеряет: Какой процент диалогов бот завершает самостоятельно, без передачи оператору.
Формула: (Диалоги без эскалации / Все диалоги) × 100%
Это, пожалуй, главная метрика эффективности бота
Хорошо: 60-80%
Плохо: <40% (бот не справляется)
Но тут есть подвох. Высокий containment rate — не всегда хорошо. Если он 95%, а клиенты при этом недовольны, возможно, бот просто не даёт возможности переключиться на человека. Или отвечает формально, но не решает проблему.
Идеальная картина: containment rate 65-75% при высоком CSAT. Это значит, что бот обрабатывает типовые запросы сам, а сложные честно передаёт оператору — и все довольны.
Важно также смотреть containment rate по категориям запросов. «Узнать время работы» — должен быть близок к 100%. «Оформить возврат сложного заказа» — может быть 30%, и это нормально.
Что измеряет: Как часто диалог переходит от бота к оператору.
Разделять на: Voluntary (клиент попросил) vs Forced (бот не справился)
Voluntary: 5-15% — норма
Forced: <10% — хорошо
Добровольная эскалация — когда клиент сам написал «позови оператора» или нажал соответствующую кнопку. Это нормально и даже хорошо: значит, клиент знает, что есть выход, и пользуется им, когда нужно.
Принудительная эскалация — когда бот сам понял, что не справляется: слишком много уточняющих вопросов, определил негативную тональность, встретил неизвестный сценарий. Высокая forced escalation rate — сигнал к доработке бота.
Подробнее о правильной организации передачи диалога читайте в статье Human handoff: передача диалога оператору.
Что измеряет: Насколько клиенты довольны конкретным диалогом с ботом.
Как собирать: Простой вопрос после диалога: «Смог ли я помочь?» + оценка 1-5 или thumbs up/down
Хорошо: 4.0+ из 5 (или 75%+ положительных)
Плохо: <3.5 (требует срочного внимания)
CSAT — голос клиента. Но есть нюанс: обычно оценку оставляют те, кто либо очень доволен, либо очень недоволен. «Середина» молча уходит. Поэтому смотрите не только на средний балл, но и на response rate — какой процент клиентов вообще отвечает на вопрос об удовлетворённости.
Хорошая практика — анализировать CSAT в связке с другими метриками. Низкий CSAT + высокий containment rate = бот отвечает формально, но не помогает. Высокий CSAT + низкий containment rate = бот хорошо распознаёт сложные случаи и правильно передаёт их людям.
Что измеряет: Как часто клиенты уходят из диалога, не получив ответа или не завершив сценарий.
Считать: Клиент написал, но не дождался ответа / ушёл после 1-2 сообщений без результата
Хорошо: <20%
Плохо: >40% (что-то не так)
Высокий abandonment rate — тревожный сигнал. Причины могут быть разные: слишком долгий ответ (смотрите latency), непонятный интерфейс (UX-проблема), бот не понял запрос и начал задавать раздражающие уточняющие вопросы.
Полезно смотреть, на каком сообщении клиенты уходят. Если сразу после первого ответа бота — возможно, бот не попал в тему. Если после третьего-четвёртого — возможно, увяз в уточнениях.
Что измеряет: Решена ли проблема клиента с первого обращения, без повторных контактов.
Как считать: Клиент не возвращается с тем же вопросом в течение 24-48 часов
Хорошо: >70%
Плохо: <50%
FCR — более глубокая метрика, чем containment rate. Бот может «закрыть» диалог, но не решить проблему — и клиент вернётся через час с тем же вопросом. Настоящий успех — когда клиент ушёл довольный и не вернулся (по крайней мере, с этой проблемой).
Для измерения FCR нужно уметь связывать диалоги одного клиента и классифицировать их по темам. Если технически сложно — начните хотя бы с отслеживания повторных обращений в целом.
Поможем построить дашборд с нужными метриками, настроить алерты и научиться интерпретировать данные. Первая консультация — бесплатно.
Получить консультациюОперационные метрики в порядке, клиенты довольны — отлично. Но бот внедряли не для красивых графиков, а для бизнес-результата. Следующие метрики связывают работу бота с деньгами.
Что измеряет: Сколько стоит один диалог с ботом — включая API LLM, инфраструктуру, амортизацию разработки.
Формула: (Затраты на LLM + хостинг + поддержка) / Количество диалогов
Типично: $0.02-0.15 за диалог
Сравнение: Оператор: $1-3 за диалог
Это основа для расчёта ROI. Если диалог с ботом стоит $0.05, а с оператором — $2, то при 1000 диалогов в месяц экономия составляет почти $2000. Умножьте на 12 месяцев — и вот вам обоснование для CFO.
Но важно считать честно. В стоимость диалога входят не только токены LLM, но и хостинг, мониторинг, часть зарплаты разработчика на поддержку, амортизация затрат на разработку. Не занижайте — это приведёт к разочарованию.
Подробнее об экономике AI-ботов читайте в статье Оптимизация стоимости AI-бота: токены, кеш, routing.
Что измеряет: Сколько денег сэкономлено благодаря автоматизации — не наняли дополнительных операторов, сократили время обработки.
Формула: (Диалоги бота × Стоимость диалога оператора) - Затраты на бота
Пример: 1000 диалогов × $2 = $2000 - $200 (затраты на бота) = $1800 экономии/месяц
Этот показатель нужен для отчётов руководству. «Бот сэкономил 650 000 тенге в этом месяце» — понятный язык для CEO и CFO.
Только не забывайте про нюанс: экономия реальна, если вы действительно сократили расходы (не наняли людей, которых иначе пришлось бы нанять) или увеличили пропускную способность (обрабатываете больше клиентов теми же ресурсами). «Виртуальная» экономия («если бы все диалоги бота обрабатывали люди...») — менее убедительна.
Что измеряет: Сколько потенциальных клиентов бот квалифицировал и передал в отдел продаж.
Что отслеживать: Количество лидов, конверсия в сделки, качество лидов
Важно: Связывать с CRM — отслеживать путь лида от бота до закрытой сделки
Если бот используется для продаж, это ключевая метрика. Но недостаточно считать только количество. Важно качество: сколько из этих лидов конвертируются в сделки? Какой средний чек? Может оказаться, что бот генерирует много «мусорных» лидов, которые только отвлекают менеджеров.
Идеальная настройка: бот квалифицирует лида (выясняет бюджет, потребность, срочность), присваивает скоринг и передаёт в CRM с полным контекстом. Подробнее об этом в статье Квалификация лидов без менеджера.
Что измеряет: Какой процент диалогов с ботом завершается целевым действием — записью, заказом, заявкой.
Формула: Целевые действия / Все диалоги × 100%
Типично: 2-10% (зависит от ниши)
Сравнивать: С конверсией без бота
Конверсия — главная метрика для продающих ботов. Но важен контекст: конверсия 5% для холодного трафика — отлично, для горячих обращений с сайта — так себе.
Полезно сравнивать: какая конверсия была до бота (через форму на сайте, через звонок)? Если бот не улучшает конверсию — либо он плохо настроен, либо не подходит для этого канала.
Что измеряет: Выручка от сделок, в которых участвовал бот
Как считать: Связать диалоги бота с CRM-сделками через customer ID
Что измеряет: Отношение выгоды от бота к затратам на него
Формула: (Экономия + Доп. выручка - Затраты) / Затраты × 100%
Revenue Influenced и ROI — это «высший пилотаж» аналитики. Для их расчёта нужна интеграция бота с CRM и сквозная аналитика. Но это именно те метрики, которые оправдывают инвестиции в бота перед руководством.
Подробнее о расчёте ROI для AI-проектов читайте в статье ROI чатбота, голосового помощника, RPA: как считать.
Для удобства собрал все метрики в одну таблицу. Можете использовать как чек-лист при настройке своего дашборда.
| # | Метрика | Уровень | Хороший показатель | Тревожный сигнал |
|---|---|---|---|---|
| 1 | Uptime | Операции | 99.5%+ | <98% |
| 2 | Response Latency (P50) | Операции | <3 сек | >10 сек |
| 3 | Error Rate | Операции | <0.5% | >2% |
| 4 | Sessions & Messages | Операции | Стабильный рост | Резкие скачки >30% |
| 5 | Containment Rate | Качество | 60-80% | <40% или >95% |
| 6 | Escalation Rate | Качество | Voluntary 5-15% | Forced >25% |
| 7 | CSAT | Качество | 4.0+ из 5 | <3.5 |
| 8 | Abandonment Rate | Качество | <20% | >40% |
| 9 | FCR (First Contact Resolution) | Качество | >70% | <50% |
| 10 | Cost per Conversation | Бизнес | $0.02-0.15 | >$0.50 (неоптимально) |
| 11 | Cost Savings | Бизнес | Положительная | Отрицательная |
| 12 | Leads Generated | Бизнес | Рост MoM | Низкое качество лидов |
| 13 | Conversion Rate | Бизнес | Выше, чем без бота | Ниже, чем без бота |
| 14 | Revenue Influenced | Бизнес | Рост MoM | Падение |
| 15 | ROI | Бизнес | >100% | <0% |
Метрики определили — теперь вопрос, где и как их визуализировать. Хорошая новость: не нужен сложный BI-инструмент, чтобы начать. Плохая: совсем без инструментов не обойтись.
Бесплатный, хорошо работает с российскими/казахстанскими источниками данных
Бесплатный, простой интерфейс, много коннекторов
Open-source, можно развернуть у себя
Мощный enterprise-инструмент, есть бесплатная версия
3-5 ключевых показателей крупно наверху
Графики за последние 30 дней с возможностью drill-down
Красные индикаторы для показателей вне нормы
Фильтры по каналам, типам запросов, периодам
Главное правило дашборда: он должен отвечать на вопросы, а не порождать новые. Если, глядя на дашборд, вы думаете «так хорошо это или плохо?» — добавьте бенчмарки, цветовую индикацию, сравнение с предыдущим периодом.
И ещё: дашборд должен обновляться автоматически. Ручное обновление раз в неделю — это не дашборд, это отчёт. Настройте data pipeline так, чтобы данные приходили минимум раз в день, а лучше — в реальном времени.
Подробнее о построении BI-дашбордов вокруг CRM читайте в статье BI вокруг CRM: DWH, ETL, витрины данных.
За годы работы с AI-ботами мы видели много попыток настроить аналитику. И ещё больше — ошибок при её интерпретации. Вот самые распространённые.
«Containment rate 90%!» — звучит круто, пока не выяснится, что клиенты уходят недовольными, потому что бот не даёт переключиться на человека.
Conversion rate упал на 20% — паника! Но это просто сезонность: в январе все на праздниках. Смотрите год к году, не только месяц к месяцу.
«Средняя задержка 2 секунды» — звучит хорошо. Но если 5% запросов обрабатываются 30 секунд — это проблема, которую среднее скрывает.
Дашборд с 50 графиками, которые никто не смотрит. Лучше 10 метрик, за которыми следят и по которым принимают решения.
Ещё одна распространённая ошибка — откладывать настройку аналитики «на потом». «Сначала запустим бота, потом разберёмся с метриками». В итоге бот работает месяцами, а данные не собираются или собираются неправильно. Когда наконец доходят руки до аналитики — исторических данных нет.
Настраивайте сбор данных с первого дня. Даже если пока не строите красивый дашборд — пусть данные копятся. Потом скажете себе спасибо.
Вернёмся к Бекзату из начала статьи. После нашего разговора он настроил базовый дашборд — сначала в Google Sheets, потом перенёс в DataLens. Начал с пяти метрик: uptime, containment rate, CSAT, leads generated, cost per conversation.
Через месяц он уже понимал: бот хорошо справляется с вопросами о наличии товара (containment rate 85%), но плохо — с возвратами (containment rate 30%, CSAT 2.8). Понятно, что дорабатывать. Ещё выяснилось, что вечерние часы дают лучшую конверсию — значит, можно оптимизировать рекламу.
«Теперь я чувствую, что управляю ботом, а не он мной», — сказал Бекзат. «И да, он окупается — это я теперь могу доказать цифрами».
Метрики — это не бюрократия и не красивые графики для презентаций. Это инструмент управления. С ними вы понимаете, что работает, что нет, и куда направить усилия. Без них — летите вслепую и надеетесь на удачу.
Начните с 5 ключевых метрик. Постепенно добавляйте новые. Стройте гипотезы и проверяйте их данными. И помните: цель не в том, чтобы все показатели были «зелёными», а в том, чтобы понимать, почему они такие, и знать, как их улучшить.
Поможем настроить систему метрик, построить дашборд и научиться принимать решения на основе данных. От аудита текущего состояния до полноценной аналитической системы.
Обсудить аналитикуГлубокий разбор метрик качества диалогов
Как связать активность бота с выручкой
Анализ неудачных диалогов и точки роста
Методология тестирования и улучшения ботов
Как снизить затраты без потери качества
Методология расчёта возврата инвестиций