В каждом отделе продаж работает негласное правило: все лиды равны, но некоторые равнее. Беда в том, что «равнее» определяется по настроению менеджера, громкости имени компании или просто порядку в списке. Lead scoring — попытка навести порядок. AI-скоринг — попытка сделать это нормально.

Раньше скоринг выглядел как Excel с формулой: «финансы = +10, скачал whitepaper = +5». Делалось за день, работало первую неделю — пока все помнили, что эти баллы значат. Потом веса устаревали, формулы переставали отражать реальность, менеджеры игнорировали скор и возвращались к интуиции.

AI-скоринг устроен иначе. Вы не угадываете, какие признаки важны. Алгоритм сам находит закономерности и пересчитывает веса по мере накопления данных. Но для этого ему нужны данные — и понимание, как с ними работать.

Чем плох ручной скоринг

Почему ручной скоринг не работает? Он построен на предположениях: «финансы покупают чаще», «демо-запрос = горячий лид», «если ЛПР — гендир, шанс выше». Может, это правда. Может, нет. Обычно никто не проверяет.

Пример из практики: в одной модели «посещение страницы с ценами» давало максимум баллов. Логично — смотрит цены, значит близок к покупке. Проанализировали данные — страница самая посещаемая на сайте. Заходят конкуренты, студенты с курсовыми, случайные люди из поиска. «Золотой» признак оказался почти бесполезным.

Ещё проблема — веса устаревают. Рынок меняется, ICP эволюционирует, поведение покупателей другое. Модель двухлетней давности выдаёт мусор. Кто её обновляет? Никто — требует времени и экспертизы.

И сложные зависимости. Человек учтёт десяток факторов. А если конверсия зависит от нелинейной комбинации размера, сезона, источника и количества касаний? Это не уловить руками. Машинное обучение — может.

Как работает AI-скоринг

Идея простая: вместо придумывания правил даём алгоритму историю. «Вот кто купил, вот кто нет — найди разницу». Алгоритм анализирует признаки и находит, что статистически отличает покупателей.

Технически — бинарная классификация. На входе признаки лида (отрасль, размер, поведение, история касаний), на выходе — вероятность конверсии. Алгоритмы: gradient boosting (XGBoost, LightGBM), логрег, нейросети. Для B2B обычно лучше всего бустинг — хорошо работает с табличными данными.

AI — не магия. Если в данных нет сигнала, алгоритм его не изобретёт. Если лиды одинаковые и конверсия случайна — модель выдаст всем одинаковый скор. Грязные данные — грязные прогнозы. Качество входа определяет качество выхода.

Какие данные нужны для обучения

Нужны два типа данных: признаки и целевая переменная. Признаки — всё, что знаете о лиде: фирмографика, поведение, история касаний. Целевая — исход: купил или нет.

Признаки обычно собрать проще — CRM, маркетинговая автоматизация, аналитика. Чем больше, тем лучше, но не все одинаково полезны. ML отсеивает шум, но при слишком большом количестве мусорных признаков качество падает.

Хорошие признаки для B2B: фирмографика (отрасль, размер, география, возраст, темп роста), данные контакта (должность, отдел, активность), поведение (визиты, открытия писем, скачивания), история продаж (звонки, встречи, длительность этапов).

С целевой переменной сложнее. «Купил» — понятно. А лиды в работе? Их нельзя пометить ни так, ни так. Обычно исключают из выборки или используют survival analysis. Ещё вопрос — горизонт: если не купил за 6 месяцев, считать его «не купившим»?

Этапы внедрения AI-скоринга

Внедрение — не кнопка «включить». Это проект. Вот типичный путь.

Аудит данных. Выгружаете CRM, смотрите качество. Сколько полей заполнено? Есть ли история сделок? На этом этапе обычно выясняется, что данных меньше и они грязнее, чем казалось.

Подготовка данных. Самая трудоёмкая часть. Очистка, заполнение пропусков, нормализация. Создание производных признаков: из дат касаний — «количество взаимодействий за 30 дней». Обогащение из внешних источников.

Разработка модели. Data scientist (или вендор) обучает несколько моделей, сравнивает качество, подбирает параметры. Критично — правильно разделить данные на обучающую и тестовую выборки. Переобучение — типичная ошибка.

Интеграция. Модель встраивается в процесс: регулярный расчёт скора, вывод в CRM, алерты, правила маршрутизации. Если скор в отдельной системе, куда никто не заходит — толку ноль.

Обучение команды. Менеджеры должны понимать, что скор значит, как использовать, каких ошибок избегать. Это управленческое обучение, не техническое: новые KPI, новый процесс, обратная связь для модели.

Мониторинг и переобучение. Модель — живой процесс, не артефакт. Нужно следить за качеством, ловить drift, переобучать на новых данных. Обычно раз в квартал или при крупных изменениях.

Как измерить качество скоринга

Как понять, что модель работает? Есть технические метрики (про модель) и бизнес-метрики (про результат).

Техническая метрика номер один — AUC-ROC. Показывает, насколько модель отделяет покупателей от остальных. 0.5 — случайное гадание, 1.0 — идеал. Хорошая модель для B2B — 0.70-0.85. Выше 0.85 — отлично, но подозрительно: возможна утечка данных.

Lift в первых децилях. Разбейте лиды на 10 групп по скору. Если в топ-10% конверсия в 5 раз выше среднего — lift 5x. Чем выше lift наверху, тем полезнее модель для приоритизации.

Бизнес-метрики важнее. Конверсия выросла при тех же усилиях? Время реакции на горячих сократилось? Win rate увеличился? Сравнивайте «до» и «после», в идеале — с контрольной группой.

Типичные ошибки и как их избежать

Редко проходит гладко. Вот что ломается чаще всего.

Недооценка данных. Увлекаются алгоритмами, забывают, что 80% работы — это подготовка данных. Мусор на входе — мусор на выходе.

Переобучение. Модель отлично работает на исторических данных, плохо — на новых. «Запоминает» выборку вместо поиска паттернов. Лечится валидацией (hold-out, cross-validation) и регуляризацией.

Игнорирование дисбаланса классов. В B2B конверсия 5-10% — то есть 90% лидов не покупают. Наивная модель всем предсказывает «не купит» и формально «точна» на 90%. Нужны техники: SMOTE, class weights, подбор порога.

Отсутствие интеграции. Модель есть, скор считается, но менеджеры не видят или игнорируют. Скоринг должен быть в CRM, влиять на маршрутизацию, быть частью KPI.

Нет обратной связи. Менеджеры знают, почему лид не купил, но информация не возвращается в модель. Нужен процесс сбора фидбека и переобучения.

AI-скоринг vs готовые решения

Готовых решений много: модули в CRM (Salesforce Einstein, HubSpot Scoring), отдельные сервисы (MadKudu, 6sense). Строить своё или брать готовое?

Готовые проще внедрить. Не нужен data scientist, модель обучена на данных тысяч компаний. Минусы: меньше контроля, ограниченная кастомизация, модель не знает вашу специфику. Работает для «среднего» B2B, но может не попадать в вашу нишу.

Кастомная модель требует инвестиций, но учитывает ваши паттерны, клиентов, продукт. Для стартапа с 50 лидами в месяц — избыточно. Для компании с 5000 лидами и сложным циклом — оправданно.

Разумный путь: начать с готового решения, понять, есть ли польза. Если есть — инвестировать в кастом, который даст +20-30% к качеству.

Что дальше: от скоринга к рекомендациям

Скоринг отвечает на вопрос «какова вероятность конверсии». Бизнесу нужно больше: что делать с лидом, какое предложение сделать, когда позвонить. Это уже территория рекомендательных систем и Next Best Action.

Хороший скоринг — фундамент для этого. Научились предсказывать конверсию — следующий шаг: какой канал работает для сегмента, какое сообщение резонирует, что предложить. Тема для отдельного разговора.

AI-скоринг — не конечная точка, а начало пути к data-driven продажам. Чем лучше освоите работу с данными на этом этапе, тем проще двигаться дальше.

Итог

AI-скоринг — задача не тривиальная, но и не высшая математика. Нужны качественные данные, правильная методология, интеграция в процессы. Если всё есть — результаты заметны: +20-40% к конверсии, меньше времени на мусорные лиды, лучшее использование ресурсов.

Главный сдвиг в мышлении: от «мы знаем, кто наш клиент» к «давайте проверим данными». Интуиция руководителей часто расходится с реальностью. Модель беспристрастна — показывает то, что есть, а не то, что хочется видеть. В этом её ценность.