«Пусть AI сам решает — мы же для этого его внедряем!» — говорит CEO на совещании, мечтательно глядя в даль. «Ни в коем случае, каждое действие через согласование!» — возражает юрист, и в его голосе слышится паника человека, который уже представляет судебные иски. Знакомая картина? Мы видим её в каждом втором проекте.
Правда в том, что оба правы — и оба неправы. Вопрос не в том, доверяем мы AI или нет. Это вообще не вопрос доверия. Это вопрос экономики и здравого смысла. Где‑то AI может работать на автопилоте и освобождать людей для важных задач. А где‑то его нужно держать на коротком поводке — не потому что он «плохой», а потому что цена ошибки слишком высока.
Давайте разберёмся, как найти эту золотую середину без философских дебатов про «восстание машин».
Когда мы помогаем клиентам настраивать AI‑агентов, мы задаём три простых вопроса. Ответы на них сразу показывают, сколько свободы можно дать системе.
Вопрос первый: «Можно ли это отменить?»
Представьте: AI написал черновик письма клиенту. Вы посмотрели — ерунда. Удалили, написали своё. Никаких последствий. А теперь представьте: AI сам отправил это письмо. Или, ещё хуже, — перевёл деньги не тому контрагенту. Чувствуете разницу?
Черновики, заметки в CRM, внутренние пометки — это можно переделать за секунду. Отправленное письмо — уже сложнее, придётся извиняться. А вот платёж, удалённые данные или публичное заявление от имени компании — это уже не отменишь. Это первое измерение: обратимость действия.
Вопрос второй: «Во что обойдётся ошибка?»
Одно дело — AI неправильно рассортировал входящие заявки. Менеджер потратит лишние пять минут на пересортировку. Неприятно, но не смертельно. Другое дело — AI отправил клиенту коммерческое предложение с неправильной ценой, и теперь вы либо теряете деньги, либо теряете лицо. А есть ситуации, где ошибка AI означает судебный иск или потерю лицензии.
Мы делим это просто: низкая цена (потеря времени, мелкое неудобство), средняя (недовольный клиент, упущенная сделка) и высокая (деньги, репутация, суд). Это второе измерение.
Вопрос третий: «Придётся ли объяснять, почему так решили?»
Если AI автоматически распределяет лиды между менеджерами — никто не спросит «почему этот лид достался Ивану, а не Марии». Но если AI отклонил заявку клиента на кредит — будьте готовы объяснить. А если речь про регулируемую отрасль — банки, страхование, медицина — то объяснение нужно не просто клиенту, а аудитору или регулятору. И «ну, нейросеть так решила» — это не объяснение. Это третье измерение: требования к объяснимости.
Автономность — это не переключатель «вкл/выкл». Это скорее регулятор громкости с несколькими положениями. Мы выделяем пять уровней, и каждый подходит для своих ситуаций.
Уровень 0: «Подскажи, но не трогай»
AI анализирует ситуацию и предлагает варианты действий. Но делает всё человек. Это как навигатор, который говорит «поверните направо через 200 метров», но руль в ваших руках. Идеально для сложных B2B‑переговоров, где каждое слово важно. AI проанализировал звонок с клиентом и показывает: «Клиент трижды упомянул сроки — похоже, это его главная боль. Рекомендую в follow‑up сделать акцент на гарантии сроков». А дальше менеджер сам решает, следовать совету или нет.
Уровень 1: «Приготовь, я проверю»
AI делает черновик, человек смотрит и нажимает «отправить». Или не нажимает. Типичная история: клиент написал в поддержку, AI подготовил ответ, менеджер пробежался глазами, поправил пару слов — и отправил. Экономия времени есть, но контроль полный. Хорошо работает там, где качество важнее скорости.
Уровень 2: «Делаю, но ты можешь остановить»
AI показывает: «Отправляю это письмо через 30 секунд» — и запускает обратный отсчёт. Если всё хорошо, можно ничего не делать. Если что‑то не так — одна кнопка «Отмена». Это как автопилот в самолёте: он ведёт, но пилот в любой момент может взять управление. Отлично подходит для массовых follow‑up'ов и типовых рассылок.
Уровень 3: «Делаю и отчитываюсь»
AI работает самостоятельно, но присылает отчёт. «Сегодня обработано 47 обращений, 3 эскалировано на менеджера». Человек смотрит статистику и вмешивается только если что‑то пошло не так. Чат‑боты для FAQ обычно работают именно так — они сами отвечают на типовые вопросы, а менеджер подключается только к сложным случаям.
Уровень 4: «Полный автопилот»
AI делает своё дело, никого не спрашивает и не уведомляет о каждом действии. Логи пишутся, но никто их не читает, пока не понадобится разбор полётов. Так обычно работает распределение входящих лидов: заявка упала — AI посмотрел, какой менеджер свободен и подходит по специализации — назначил. Тысячи таких решений в день, и никому в голову не придёт подтверждать каждое вручную.
Помните три вопроса из начала статьи? Вот как они работают вместе: берёте каждый параметр, определяете максимально допустимый уровень — и выбираете минимальный из трёх. Звучит как формула, но на практике это быстро становится интуитивно понятным.
Принцип простой: ограничивает самое слабое звено. Если действие можно отменить (хорошо для L4), но ошибка дорого стоит (ограничивает до L1) — выбираем L1. Лучше перестраховаться, чем объяснять клиенту, почему AI написал ему глупость.
Давайте на примере. Задача: AI автоматически отвечает на жалобы клиентов.
Прогоняем через три вопроса. Можно ли отменить? Ну, письмо уйдёт клиенту — это уже не черновик. Но если AI напишет что‑то не то, можно извиниться и исправить. Частичная обратимость — значит, максимум L3.
Во что обойдётся ошибка? Жалоба — это уже недовольный клиент. Неправильный ответ может превратить недовольство в скандал. Не катастрофа, но и не мелочь. Средняя цена — ограничивает до L2–L3.
Нужно ли объяснять? Клиент может спросить «почему вы так ответили?» — и менеджер должен понимать логику. Средние требования — опять же, L2–L3.
Итог: берём минимум, это L2. AI показывает подготовленный ответ, даёт 30 секунд на отмену, потом отправляет. Менеджер видит, что уходит, и может вмешаться. Скорость есть, контроль есть.
Проведём аудит ваших процессов и определим оптимальные уровни для каждого AI‑агента.
Запросить аудитТеория — это хорошо, но давайте посмотрим, как это выглядит на практике. Пройдёмся по типичным бизнес‑процессам и разберём, почему для каждого подходит свой уровень.
Маркетинг: от полного автопилота до ручного управления
Скоринг лидов — классический L4. AI смотрит на данные, присваивает баллы, сортирует. Ошибся в оценке одного лида? Ничего страшного, менеджер сам разберётся при первом контакте. Ничего не сломается, ничего не уйдёт клиенту. Пусть работает сам.
Распределение лидов — тоже L4 по той же логике. Если лид попал не к тому менеджеру — переназначить дело минуты. А вот если каждое распределение согласовывать вручную... представьте: 200 лидов в день, каждый надо подтвердить. Кто этим будет заниматься?
Email‑рассылки — уже L2. Письмо уйдёт живым людям, и если там ерунда — это репутационный риск. Поэтому: AI готовит рассылку, показывает превью, даёт время на отмену. Быстро, но с подстраховкой.
Публикации в соцсетях — тоже L2. Один неудачный пост может разлететься по сети раньше, чем вы успеете его удалить. Классика: AI забыл про контекст и опубликовал что‑то весёлое в день трагедии. Лучше лишний раз глянуть перед публикацией.
Продажи: тут всё сложнее
Резюме звонка в CRM — L4. AI послушал разговор, записал ключевые моменты. Это внутренний документ, клиент его не увидит. Если что‑то записано неточно — менеджер поправит. Никакого риска.
Follow‑up письма — L2. Письмо идёт клиенту, но это не первый контакт и не критичное сообщение. AI показывает, что собирается отправить, даёт 30 секунд. Обычно всё нормально, но иногда менеджер успевает заметить, что AI не учёл какой‑то нюанс из последнего разговора.
Генерация коммерческого предложения — L1. КП — это документ, который клиент будет изучать, показывать коллегам, может, даже юристам. Там цены, условия, обязательства. AI делает черновик, менеджер внимательно проверяет каждую цифру, редактирует — и только потом отправляет.
Согласование скидки — чистый L0. AI может подсказать: «Для этого клиента исторически работала скидка 15%, маржа позволяет до 20%». Но решение принимает человек. Потому что неправильная скидка — это или потерянные деньги, или потерянный клиент. И объяснять потом придётся менеджеру, а не AI.
Поддержка: баланс между скоростью и качеством
Ответы на FAQ — L3. «Как сбросить пароль?», «Какие у вас часы работы?» — на такое AI может отвечать сам и присылать отчёт. Ошибка маловероятна (ответы типовые), а скорость важна.
Маршрутизация тикетов — L4. AI читает обращение, определяет тему и срочность, назначает на нужный отдел. Ошибся — тикет переназначат. Зато не нужен диспетчер, который вручную сортирует сотни обращений.
Ответы на жалобы — L2, мы это уже разбирали. Тут нужен баланс: отвечать надо быстро (клиент и так недоволен), но цена ошибки выше обычного.
Возврат денег — L1. Деньги ушли — не вернёшь. Ну, то есть вернёшь, но с кучей согласований и объяснений. AI готовит решение и обоснование, человек подтверждает.
Финансы: зона особого внимания
Классификация расходов — L3. AI разносит чеки по категориям, бухгалтер смотрит сводку раз в день. Ошибка поправляется легко, аудитор спросит — покажем логи.
Выставление счетов — L1. Счёт — это юридический документ. Неправильная сумма или реквизиты — это как минимум лишняя переписка с клиентом, как максимум — налоговые проблемы. AI готовит, бухгалтер проверяет.
Платежи поставщикам — строгий L0. Деньги ушли — всё. AI может подсказать: «Вот счёт от поставщика, срок оплаты завтра, предлагаю оплатить». Но кнопку «оплатить» нажимает человек. Это даже не вопрос доверия к AI — это вопрос финансового контроля.
Самое интересное: уровень автономности — это не константа. Умная система должна адаптироваться к ситуации. Вот несколько способов сделать это.
AI сам не уверен — пусть спросит
Хорошие модели умеют оценивать свою уверенность. Если AI на 95% уверен, что понял запрос клиента — пусть работает на L3 (сделает и отчитается). Если уверенность 60% — лучше спуститься на L1 и показать черновик. Это не слабость, это разумная осторожность. Как врач, который признаёт: «тут мне нужно ещё одно обследование», вместо того чтобы гадать.
VIP‑клиенты — особый режим
Обращение от обычного клиента — L3, автоответ. Обращение от клиента, который приносит 30% выручки — L2, а то и L1. Цена ошибки разная, и система должна это учитывать. То же с новыми клиентами: первое впечатление важно, лучше перестраховаться.
Сумма сделки имеет значение
Follow‑up по сделке на 50 000 тенге — пусть AI отправляет сам. Follow‑up по сделке на 5 миллионов — менеджер должен хотя бы глазами пробежать, прежде чем письмо уйдёт. Это не паранойя, это здравый смысл: где больше денег — там больше внимания.
Ночь vs. день
В рабочие часы менеджер рядом — можно использовать L2 (показать, дать время на отмену). Ночью и в выходные никто не сидит у экрана — лучше L3 (пусть AI отвечает сам, а менеджер утром посмотрит отчёт). Потому что ждать до утра клиент не будет, а автоответ лучше, чем тишина.
Доверие растёт со временем
Новый сценарий — начинаем с L1, смотрим каждый ответ. Сто ответов без косяков — переходим на L2. Тысяча — на L3. Это как стажёр: сначала всё проверяешь, потом даёшь больше самостоятельности. AI тоже должен «заслужить» автономию на конкретной задаче.
Совет из практики: Настройте правило: «Если уверенность < 70% ИЛИ сумма сделки > 500 000 ₸ ИЛИ клиент VIP → снизить уровень на единицу». Это ловит большинство ситуаций, где нужна дополнительная осторожность.
Выбрать уровень — полдела. Нужно ещё реализовать механизмы контроля. Без этого всё останется на бумаге.
Для режимов «советник» и «черновик» (L0–L1)
Нужен интерфейс, где AI показывает свои предложения, а человек их принимает, отклоняет или редактирует. Три кнопки: «Да», «Нет», «Поправить». И — важно — логирование каждого решения. Не для контроля за людьми, а для обучения: если менеджеры постоянно правят один и тот же тип ответов, значит, промпт надо переписать.
Для режима «обратный отсчёт» (L2)
Тут интереснее. Нужна очередь отложенных действий с таймером. AI кладёт действие в очередь, запускается обратный отсчёт (обычно 15–60 секунд), уведомление улетает в Telegram или Slack. Пока таймер тикает — можно отменить одной кнопкой. Кнопка должна работать мгновенно, без подтверждений — секунды на счету.
Для режима «делаю и отчитываюсь» (L3)
Асинхронная очередь, где действия выполняются сразу, без ожидания. Плюс система уведомлений: дайджест раз в час или раз в день, дашборд с историей, алерты на аномалии. Если вдруг посыпались отказы или AI начал отвечать странно — система должна сама поднять флаг.
Для полного автопилота (L4)
Здесь критичен audit trail — полный журнал всего: кто запросил, что AI решил, почему, каков результат. Это страховка на случай разбора полётов. Плюс rate limits (чтобы AI не отправил тысячу писем за секунду из‑за бага) и circuit breakers (если что‑то явно пошло не так — автоматически тормозим и снижаем уровень). Про метрики качества подробнее — в статье про workslop.
И для всех уровней без исключения: логи. Вход, выход, решение. Без логов вы никогда не поймёте, что пошло не так. А если поймёте — не сможете доказать. И уж точно не сможете улучшить систему.
За годы работы с AI‑проектами мы насмотрелись на одни и те же ошибки. Вот топ‑5 — и как их избежать.
«Пусть AI делает всё, мы же за это платим!»
Энтузиазм похвальный, результат предсказуемый. Клиенты начинают жаловаться на странные письма. Сделки срываются из‑за некорректных ответов. Репутация страдает. Проблема в том, что AI хорош в 90% случаев — но 10% ошибок на критичных процессах превращаются в катастрофу. Один клиент сказал нам: «AI отправил VIP‑клиенту письмо с обращением «Уважаемый [ИМЯ_КЛИЕНТА]». Буквально так, с квадратными скобками». Это был последний день полной автономии в их компании.
«Каждое действие через согласование!»
Противоположная крайность. Менеджеры тонут в уведомлениях, тратят на согласования больше времени, чем сэкономили бы без AI. В итоге начинают игнорировать уведомления — и пропускают действительно важное. Или саботируют систему: «Да, да, отправляй» — не глядя. Если AI экономит 5 минут, а согласование занимает 3 — вы получили 2 минуты экономии ценой раздражённой команды. Не лучшая сделка.
«У нас один уровень на всё»
Классика: «мы решили, что все действия AI будут на L2». Результат? Менеджер подтверждает каждое распределение лида (зачем?), но тем же способом подтверждает и ответы на жалобы (недостаточно внимания). Универсальное решение — это отсутствие решения. Каждый процесс требует своей настройки.
«А логи нам зачем?»
Пока всё работает — логи кажутся лишней тратой места. А потом клиент спрашивает «почему мне отказали?» — и никто не может объяснить. Или регулятор просит аудит — а показать нечего. Или AI начал ошибаться чаще — а понять, когда и почему, невозможно. Логи — это не бюрократия. Это страховка. Даже на L4 сохраняйте полный журнал решений.
«Настроили и забыли»
AI работает полгода. Данные изменились, клиенты изменились, продукт изменился — а уровни автономности те же. Качество падает, но никто не замечает, потому что никто не смотрит. Решение простое: квартальный пересмотр. Смотрите на метрики, слушайте команду, корректируйте уровни. Это живая система, а не памятник.
Поможем спроектировать систему, которая ускоряет процессы без неприемлемых рисков.
Обсудить проектЕсли всё это звучит разумно, но непонятно, с какого конца подступиться — вот пошаговый план.
Шаг первый: разберитесь, что у вас есть
Составьте список всех процессов, где AI принимает решения или действует. Для каждого ответьте на три вопроса: можно ли отменить? во что обойдётся ошибка? нужно ли объяснять? Если AI уже работает — запишите текущий уровень автономности. Это может быть простая табличка в Google Sheets, ничего сложного.
Шаг второй: найдите несоответствия
Сравните текущие уровни с рекомендуемыми по матрице. Где‑то окажется, что AI работает на L4, а должен на L2 (риск!). Где‑то наоборот — на L1, хотя можно спокойно на L3 (упущенная эффективность). Приоритизируйте: сначала займитесь критичными процессами с высоким риском.
Шаг третий: настройте механизмы
Для каждого уровня нужны свои технические возможности: интерфейсы согласования, таймеры, очереди, уведомления, логирование. Не пытайтесь сделать всё сразу — начните с самых критичных процессов. Настройте правила динамической эскалации: когда AI должен автоматически снижать уровень.
Шаг четвёртый: объясните команде
Люди должны понимать, почему разные процессы имеют разные уровни. Иначе будут либо игнорировать уведомления («да ладно, AI и так нормально работает»), либо перестраховываться там, где это не нужно. Научите работать с интерфейсами согласования. Объясните, когда нужно эскалировать вручную.
Шаг пятый: следите и корректируйте
Настройте мониторинг: сколько действий на каждом уровне, сколько ошибок, сколько эскалаций. Раз в квартал садитесь и пересматривайте уровни. AI, который полгода работал без ошибок — кандидат на повышение уровня. AI, который начал косячить — кандидат на понижение. Это не один раз настроил и забыл — это постоянный процесс.
Вернёмся к началу. CEO хочет, чтобы AI всё делал сам. Юрист хочет, чтобы каждое действие согласовывалось. Кто прав?
Оба. И никто. Потому что правильный ответ зависит от конкретного процесса. Распределение лидов — пусть AI работает сам, это L4. Ответы на жалобы — L2, с обратным отсчётом. Платежи поставщикам — L0, только рекомендации.
Три вопроса определяют всё: можно ли отменить, во что обойдётся ошибка, нужно ли объяснять. Пять уровней — от советника до автопилота — дают гибкость. Динамические правила — по сумме сделки, по типу клиента, по уверенности AI — добавляют интеллекта.
Главное — это не про доверие к AI. Это про управление рисками и здравый смысл. AI может ошибаться. Люди тоже могут ошибаться. Задача — найти баланс, где скорость максимальна, а риски приемлемы.
Формула простая: правильный уровень автономности — это когда AI ускоряет работу, а команда спокойна за качество. Не слишком много контроля (тормозит), не слишком мало (рискует). И эта золотая середина находится через анализ, а не через интуицию или страхи.
Если прямо сейчас хотите сделать что‑то полезное — возьмите пять ключевых процессов, где у вас работает AI. Прогоните каждый через три вопроса. Сравните текущий уровень с рекомендуемым. Скорректируйте. И посмотрите, что изменится за месяц.
Если тема зацепила — вот несколько статей, которые её дополняют:
AI‑агенты без риска: контур контроля для production — про технические механизмы безопасности. Как сделать так, чтобы даже при ошибке AI ничего критичного не сломалось.
Human‑in‑the‑loop как способ заработать больше — парадоксальная идея: человек в цикле не только снижает риски, но и увеличивает ценность продукта. Почему так — разбираем на примерах.
Workslop и бизнес‑потери: качество AI как экономика — как измерять качество AI и почему «работает нормально» — это не метрика.