Incident response для AI: план действий при утечке, ошибочных…

Представьте: три часа ночи, и телефон взрывается звонком. На том конце — взволнованный руководитель поддержки. Ваш AI-бот, в который вложено столько сил и денег, только что посоветовал клиенту лекарство... на которое у человека аллергия. В другой версии кошмара — бот «случайно» выдал персональные данные одного клиента другому. Или с убедительностью профессора заявил, что компания предоставляет услугу, которая вообще не существует.

Звучит как страшилка? Увы, это реальные истории казахстанских компаний. За каждой — потерянные деньги, разгневанные клиенты и седые волосы у владельцев бизнеса. Вопрос не в том, случится ли это с вами. Вопрос — когда случится, и будете ли вы готовы.

Эта статья — ваша шпаргалка на случай, если AI решит устроить сюрприз. Никакой воды и теории — только проверенные действия из окопов реальных инцидентов. Некоторые уроки мы получили болезненным путём, чтобы вам этого не пришлось.

Почему инциденты с AI — это не то же самое, что упавший сервер

Когда падает обычный сервис — сразу понятно. Ошибка 500 на экране, звонки в поддержку, все побежали чинить. Кристально ясная ситуация. С AI-ботом всё коварнее. Он выглядит живым и здоровым, отвечает пользователям, метрики зелёные... И в это же время спокойно врёт, раздаёт чужие данные или даёт советы, от которых волосы дыбом.

Вот реальный случай: у бота в базе знаний оказался старый прайс-лист. Два месяца назад. Бот радостно называет клиентам те цены, заказы оформляются, а потом люди получают счета совсем на другие суммы. При этом в логах — полный порядок, алерты молчат. Репутация компании тает как мороженое на солнце, а вы даже не знаете, что что-то не так.

А бывает вообще жесть. Кто-то умный проворачивает prompt injection — обходит все ваши защитные инструкции. И теперь бот выдаёт внутреннюю информацию компании, но делает это так аккуратно, что ваш мониторинг даже не моргнёт. Стандартные методы борьбы с инцидентами здесь бессильны — нужна совершенно другая стратегия.

Три уровня паники: когда хватает кофе, а когда пора звонить всем

Инциденты с AI бывают разные. Есть досадные промахи, есть серьёзные проблемы, а есть «всё пропало, шеф». Прежде чем поднимать на ноги весь офис и будить CEO, стоит понять масштаб бедствия. Мы делим их на три уровня — по принципу светофора.

Жёлтый: неприятно, но переживём

Бот немного тупит — путает факты, выдаёт неточные ответы, косячит в мелочах. Клиенты хмурятся, но катастрофы нет. Обычно хватает свежего кофе, правки базы знаний и подкрутки промпта. Дежурный инженер справится.

Оранжевый: уже серьёзно

Вот тут пора нервничать. Бот слил чьи-то персональные данные, дал финансовый совет, который может разорить клиента, или проигнорировал политики компании. На горизонте маячат штрафы, судебные иски и клиенты, бегущие к конкурентам. Действуем быстро и решительно.

Красный: катастрофа в прямом эфире

Всё горит. Массовая утечка данных, публичный скандал в соцсетях, бот советует что-то опасное для здоровья людей. Здесь уже не до церемоний — будим CEO, юристов, PR-отдел. Скорее всего, придётся вырубать бота до выяснения обстоятельств. Это тот самый момент, когда понимаешь ценность хорошей страховки.

Это не просто красивая схема для презентаций. От уровня зависит всё: кто берётся за проблему, как быстро нужно реагировать, сколько людей и ресурсов бросать на тушение. Жёлтый — справится дежурный инженер с энергетиком. Красный — все бегут, включая тех, кто в отпуске на Мальдивах.

Кто за что отвечает, когда всё летит в тартарары

Знаете, что хуже самого инцидента? Когда все бегают как курицы без головы, орут друг на друга, никто не знает, кто главный, и каждый пытается «помочь» по-своему. Итог — ещё больший хаос. Единственный способ не превратить кризис в фарс — распределить роли ДО того, как что-то случится. Пока все спокойны и могут думать головой.

Вот четыре ключевые роли, которые работают на практике:

Incident Commander (Капитан тонущего корабля): Это главный. Он принимает решения, говорит всем что делать, решает когда звать подкрепление. Обычно это опытный руководитель или старший инженер. У него только одна цель — вытащить систему из болота, живой и по возможности целой.
Technical Lead (Технический шерлок): Роется в логах, ищет где зарыта собака, чинит код. Это человек, который знает бота как свои пять пальцев и может найти иголку в стоге технических данных. Пока все паникуют — он спокойно разбирается в причинах.
Communications Lead (Голос разума): Отвечает за то, что и как мы говорим миру. Пишет сообщения клиентам, докладывает боссам, при необходимости отбивается от прессы. Главное — чтобы все получали правдивую информацию в правильной упаковке, без паники и преувеличений.
Legal/Compliance (Юридический щит): Смотрит, не нарушаем ли мы законы (а мы обычно уже нарушили), оценивает риски штрафов, готовит уведомления регуляторам. Знает наизусть закон РК о персональных данных и не даёт нам сесть в лужу ещё глубже.

Критически важно: все эти роли назначаются ЗАРАНЕЕ. С запасными игроками на каждую позицию. Потому что в три ночи, когда всё рушится, у вас не будет времени и сил выяснять, а кто же у нас, собственно, отвечает за PR-кризисы.

План действий: что делать, когда уже случилось

Хватит теории, давайте к делу. Вот пошаговый алгоритм, который мы обкатали на собственных шишках и теперь внедряем у клиентов. Каждый шаг — это не фантазии из учебника, а реальный опыт тушения пожаров.

Этап	Время	Что делать	Кто отвечает
1. Обнаружение	0 минут	Зафиксировать инцидент: время, канал (откуда узнали), первичное описание. Завести тикет или запись в инцидент-трекере. Классифицировать по уровню (жёлтый/оранжевый/красный).	Тот, кто обнаружил
2. Оповещение	0-5 минут	Уведомить Incident Commander по основному каналу (Telegram, звонок). IC принимает решение о сборе команды и эскалации.	Тот, кто обнаружил
3. Локализация	5-15 минут	Остановить распространение ущерба. Варианты: переключить бота в «тихий режим» (только передача на оператора), отключить проблемную функцию, ограничить доступ к определённым данным. Цель — не дать ситуации ухудшиться.	Technical Lead
4. Диагностика	15-60 минут	Понять причину: анализ логов, воспроизведение проблемы, проверка недавних изменений (промпты, база знаний, код). Документировать все находки.	Technical Lead
5. Исправление	По ситуации	Устранить причину: откатить изменения, обновить промпт, исправить базу знаний, заблокировать уязвимость. Протестировать исправление в staging-среде.	Technical Lead
6. Восстановление	После исправления	Вернуть бота в нормальный режим работы. Мониторить первые часы особенно внимательно. Убедиться, что проблема не повторяется.	Technical Lead + IC
7. Пост-мортем	24-48 часов	Провести разбор: что случилось, почему, как предотвратить в будущем. Обновить документацию, добавить тесты, улучшить мониторинг.	Вся команда

Посмотрите на время — первые этапы измеряются минутами, а не часами. Каждая минута промедления — это новые жертвы среди клиентов и новые дыры в репутации. Вот почему нельзя импровизировать на ходу. План должен быть отрепетирован, команда — натренирована. В идеале — хотя бы раз «прогнать» всё это в тестовом режиме, пока ничего реально не горит.

История из жизни: когда бот устроил чёрную пятницу без спроса

Интернет-магазин в Алматы, обычный такой, со своим ассортиментом и амбициями. Внедрили AI-бота для консультаций — вроде всё работало отлично. Клиенты довольны, продажи растут. А потом кто-то из сотрудников случайно залил в базу знаний старый прайс-лист. Квартальной давности.

И понеслось. Бот начал озвучивать цены на 30-40% ниже реальных. Клиенты, естественно, в восторге — оформляют заказы пачками. А потом приходят счета на совсем другие суммы. Начинается: «Как так?! Мне бот сказал 5000, а тут 7000!». Менеджеры тратят часы на извинения, объяснения, некоторые клиенты требуют продать по «обещанной» цене и грозятся пожаловаться во все инстанции.

Самое обидное — обнаружили косяк только через ДВА ДНЯ. Когда жалоб накопилось столько, что кто-то наконец заметил закономерность. За это время бот успел «раздать скидок» на 200 с лишним заказов. Часть пришлось выполнять по старым ценам (иначе совсем бы обозлились), часть — отменять с компенсациями и извинениями.

Что поменялось после? Теперь там система автоматически проверяет все загружаемые документы — сравнивает цены с актуальным каталогом, при расхождениях кричит во все колокола. И, конечно, появился нормальный план реагирования на инциденты. Чтобы в следующий раз узнавать о проблеме за минуты, а не за дни молчаливых убытков.

Как говорить с людьми, когда всё сломалось

Починить бота — это только половина битвы. Дальше начинается дипломатия: нужно объяснить людям, что произошло, почему, и что вы с этим делаете. И вот тут многие спотыкаются — начинают юлить, прятаться за корпоративными отписками или вообще молчать в тряпочку. Всё это только раздражает.

Пострадавшим клиентам

С ними — максимум честности и конкретики. Забудьте про «произошёл технический сбой» и прочую бюрократическую шелуху. Люди не дураки, чувствуют фальшь за километр и злятся ещё сильнее.

Говорите прямо: «Наш бот накосячил вот так [конкретно что]. Это случилось с [время] по [время], и могло коснуться вас. Мы уже [что исправили], и сделали [что], чтобы больше не повторилось. Есть вопросы — пишите сюда [контакт], мы на связи». Коротко, ясно, без воды.

Своему начальству

Тут нужна золотая середина — полная картина, но без простыней текста. Руководителям важно понять: насколько всё плохо, сколько это стоит, и когда исправим.

Формула простая: что случилось (буквально два предложения), статус по цветам светофора, что уже сделали, что делаем сейчас, когда будет следующий отчёт. Технические дебри оставьте при себе — расскажете, если спросят.

Отдельная головная боль — соцсети. Инцидент становится публичным (а в эпоху всеобщих скриншотов это происходит мгновенно), и тут уже нельзя тянуть. Человек написал гневный пост в Instagram? Отвечайте там же, а не пытайтесь утащить разговор в личные письма или на почту. Это выглядит как попытка замять, и злит ещё больше.

И не забудьте про своих людей! Все, кто разговаривает с клиентами — от операторов колл-центра до менеджеров — должны знать о проблеме и понимать, что говорить. Худшее, что может быть: клиент звонит с претензией, а на том конце провода сидит растерянный оператор, который вообще не в курсе, что что-то случилось. Это добивает доверие окончательно.

Когда бот врёт с каменным лицом: про галлюцинации

Галлюцинации AI — это когда он врёт так уверенно, что сам начинаешь сомневаться в реальности. Это не баг, не глюк, не «что-то пошло не так». Это фундаментальная особенность нейросетей, с которой нужно уметь жить.

Почему это так опасно? Штука в том, что распознать враньё сложно — ответ выглядит абсолютно нормально, никаких тревожных звоночков. Бот говорит с интонацией профессора, и люди верят. А там — финансовый совет из параллельной вселенной, несуществующая политика возвратов или характеристики продукта, которые вы никогда не обещали. И вот уже клиент требует то, чего нет.

Как поймать бота на вранье: Проверяйте выборочно — пусть каждый 20-й диалог смотрит живой человек. Особенно подозрительны ответы, где бот уверенно рассуждает на тему, по которой у вас вообще мало данных. Это как раз зона риска.

Как не дать ему соврать: RAG (Retrieval-Augmented Generation) — ваш друг. Это когда бот отвечает ТОЛЬКО на основе вашей базы знаний, а не из головы (точнее, весов нейросети). Плюс настройте порог уверенности: не уверен — передаёшь человеку. Лучше лишний раз переспросить, чем наобещать несуществующего.

Что делать, если поймали: Сузить зону ответственности бота — пусть отвечает только на то, в чём точно уверен. Разобраться, откуда взялась галлюцинация. Добавить нужную информацию в базу или явно прописать в промпте: «на этот вопрос НЕ отвечай, передавай оператору».

Крутой приём от одного нашего клиента: бот обязан ссылаться на источник для любого факта. Нет источника? Честно говори: «Точной информации не нашёл, лучше уточнить у специалиста». Галлюцинации это не убирает на 100%, но их становится гораздо проще заметить.

Утечка данных: юридические аспекты для Казахстана

Если инцидент связан с утечкой персональных данных, включаются дополнительные обязательства. В Казахстане действует Закон о персональных данных и их защите (от 21 мая 2013 года № 94-V), и его требования нужно учитывать в плане реагирования.

Обязательные действия при утечке ПДн

Зафиксировать факт утечки: какие данные, какой объём, какие субъекты затронуты. Сохранить все доказательства (логи, скриншоты).
Уведомить уполномоченный орган: Комитет по информационной безопасности МЦРИАП РК — если утечка существенная.
Уведомить субъектов данных: Люди, чьи данные утекли, имеют право знать об этом. Уведомление должно содержать информацию о характере утечки и рекомендации по защите.
Провести внутреннее расследование: Задокументировать причины, принятые меры, выводы.
Обновить защитные меры: По результатам расследования внести изменения в систему безопасности.

Если ваш бот работает с клиентами из Европы, добавляются требования GDPR — там сроки уведомления ещё жёстче (72 часа), а штрафы серьёзнее. В любом случае, рекомендую заранее проконсультироваться с юристом и подготовить шаблоны уведомлений — когда инцидент уже случился, времени на их написание не будет.

Разбор полётов: как не наступать на те же грабли дважды

Инцидент потушен, можно выдохнуть и налить чего покрепче. Но расслабляться рано — именно сейчас начинается самая важная часть. Пост-мортем (или «разбор полётов», как говорят в армии) — это НЕ поиск виноватого, которого можно поставить к стенке. Это честный разговор о том, что пошло не так, почему система дала слабину, и как это исправить.

Хороший разбор должен ответить на пять ключевых вопросов:

1

Что произошло?

Фактическое описание инцидента: хронология событий, что видели клиенты, какой был ущерб. Без оценок и интерпретаций — только факты.

2

Почему это произошло?

Корневая причина (root cause). Здесь важно копать глубже первого слоя. «Загрузили не тот файл» — это не причина. А почему его загрузили? А почему система это позволила? А почему не было проверки?

3

Как мы узнали о проблеме?

Было ли обнаружение своевременным? Могли ли мы узнать раньше? Какие сигналы пропустили?

4

Что помогло, а что мешало?

Какие процессы сработали хорошо? Где были задержки? Какой информации не хватало? Кто из команды отработал отлично (не забудьте отметить)?

5

Что мы изменим?

Конкретные действия с ответственными и сроками. Не общие пожелания («улучшить мониторинг»), а конкретные задачи («добавить алерт на расхождение цен > 10%, ответственный: Иван, срок: 15 января»).

И главное — результаты этого разбора должны быть открыты всей команде. Не запирайте их в закрытом документе. Это дорогой опыт, купленный потом и кровью. Пусть все учатся на этих ошибках, чтобы не совершать своих.

Готовы ли вы? Быстрая самопроверка

Лучшее время проверить, готовы ли вы к инциденту — это когда всё тихо и спокойно. Пока бот ведёт себя прилично, а клиенты довольны. Пройдитесь по этому списку честно, без самообмана:

Роли чётко распределены: У каждой роли есть конкретный человек (и запасной) с телефонами, которые они реально берут.
Все знают, куда кричать: Определён канал связи при инциденте (Telegram-чат, звонок, что угодно). И есть план Б на случай, если основной канал лежит.
Инструкция живая: Пошаговый план существует, его видели все причастные, и он свежее трёх месяцев.
Есть красная кнопка: Вы можете за пару минут прикрутить бота или перевести в безопасный режим. Без согласований, форм и одобрения совета директоров.
Логи не выбрасываются: Все диалоги бота сохраняются с достаточной детализацией, чтобы потом разобраться, что произошло.
Мониторинг не спит: Настроены алерты на всякие странности — всплеск ошибок, дикие запросы, метрики поехали куда-то не туда.
Заготовки сообщений есть: Шаблоны писем клиентам и отчётов руководству на типовые сценарии. Чтобы не сочинять с нуля, когда руки трясутся.
Хоть раз репетировали: Команда отработала учебный инцидент. Хотя бы раз. Чтобы понять, где план хромает, пока это не стоит реальных денег.

Что ещё почитать по теме

Эта статья — часть серии об управлении рисками AI. Вот что ещё стоит прочитать:

AI governance в CRM: политики, роли, риск-оценка, аудит и контроль изменений — базовая статья о том, как выстроить управление AI в компании.
Threat modeling для LLM-бота: 12 угроз и как закрывать их архитектурно — какие риски существуют и как их предотвращать ещё до инцидента.
DLP для AI: маскирование PII, политики хранения и минимизация данных — как защитить персональные данные в системах с AI.
Как внедрять LLM безопасно: промпт-инжиниринг, ограничения, оценка качества — практический гайд по безопасному запуску AI-ботов.
Аудит AI-решений: чек-лист для службы безопасности — как проверить AI-систему перед запуском.

Не хотите учиться на своих ошибках?

Мы уже набили свои шишки и готовы помочь вам избежать тех же граблей. Проведём аудит вашего AI-бота, построим систему управления рисками, разработаем план реагирования на инциденты и научим команду им пользоваться. Без шаблонов — под вашу специфику и реальные угрозы.

Давайте обсудим

Почему инциденты с AI — это не то же самое, что упавший сервер

Три уровня паники: когда хватает кофе, а когда пора звонить всем

Жёлтый: неприятно, но переживём

Оранжевый: уже серьёзно

Красный: катастрофа в прямом эфире

Кто за что отвечает, когда всё летит в тартарары

План действий: что делать, когда уже случилось

История из жизни: когда бот устроил чёрную пятницу без спроса

Как говорить с людьми, когда всё сломалось

Пострадавшим клиентам

Своему начальству

Когда бот врёт с каменным лицом: про галлюцинации

Утечка данных: юридические аспекты для Казахстана

Обязательные действия при утечке ПДн

Разбор полётов: как не наступать на те же грабли дважды

Готовы ли вы? Быстрая самопроверка

Что ещё почитать по теме

Не хотите учиться на своих ошибках?

Услуги по теме статьи

AI-боты для входящих обращений

Омниканал без хаоса в одном окне

Интеграции и автоматизация процессов

Incident response для AI: план действий при утечке, ошибочных советах и репутационных рисках

Почему инциденты с AI — это не то же самое, что упавший сервер

Три уровня паники: когда хватает кофе, а когда пора звонить всем

Жёлтый: неприятно, но переживём

Оранжевый: уже серьёзно

Красный: катастрофа в прямом эфире

Кто за что отвечает, когда всё летит в тартарары

План действий: что делать, когда уже случилось

История из жизни: когда бот устроил чёрную пятницу без спроса

Как говорить с людьми, когда всё сломалось

Пострадавшим клиентам

Своему начальству

Когда бот врёт с каменным лицом: про галлюцинации

Утечка данных: юридические аспекты для Казахстана

Обязательные действия при утечке ПДн

Разбор полётов: как не наступать на те же грабли дважды

Готовы ли вы? Быстрая самопроверка

Что ещё почитать по теме

Не хотите учиться на своих ошибках?

Читайте также

Услуги по теме статьи

AI-боты для входящих обращений

Омниканал без хаоса в одном окне

Интеграции и автоматизация процессов