В каждом отделе продаж работает негласное правило: все лиды равны, но некоторые равнее. Беда в том, что «равнее» определяется по настроению менеджера, громкости имени компании или просто порядку в списке. Lead scoring — попытка навести порядок. AI-скоринг — попытка сделать это нормально.
Раньше скоринг выглядел как Excel с формулой: «финансы = +10, скачал whitepaper = +5». Делалось за день, работало первую неделю — пока все помнили, что эти баллы значат. Потом веса устаревали, формулы переставали отражать реальность, менеджеры игнорировали скор и возвращались к интуиции.
AI-скоринг устроен иначе. Вы не угадываете, какие признаки важны. Алгоритм сам находит закономерности и пересчитывает веса по мере накопления данных. Но для этого ему нужны данные — и понимание, как с ними работать.
Чем плох ручной скоринг
Почему ручной скоринг не работает? Он построен на предположениях: «финансы покупают чаще», «демо-запрос = горячий лид», «если ЛПР — гендир, шанс выше». Может, это правда. Может, нет. Обычно никто не проверяет.
Пример из практики: в одной модели «посещение страницы с ценами» давало максимум баллов. Логично — смотрит цены, значит близок к покупке. Проанализировали данные — страница самая посещаемая на сайте. Заходят конкуренты, студенты с курсовыми, случайные люди из поиска. «Золотой» признак оказался почти бесполезным.
Ещё проблема — веса устаревают. Рынок меняется, ICP эволюционирует, поведение покупателей другое. Модель двухлетней давности выдаёт мусор. Кто её обновляет? Никто — требует времени и экспертизы.
И сложные зависимости. Человек учтёт десяток факторов. А если конверсия зависит от нелинейной комбинации размера, сезона, источника и количества касаний? Это не уловить руками. Машинное обучение — может.
Как работает AI-скоринг
Идея простая: вместо придумывания правил даём алгоритму историю. «Вот кто купил, вот кто нет — найди разницу». Алгоритм анализирует признаки и находит, что статистически отличает покупателей.
Технически — бинарная классификация. На входе признаки лида (отрасль, размер, поведение, история касаний), на выходе — вероятность конверсии. Алгоритмы: gradient boosting (XGBoost, LightGBM), логрег, нейросети. Для B2B обычно лучше всего бустинг — хорошо работает с табличными данными.
AI — не магия. Если в данных нет сигнала, алгоритм его не изобретёт. Если лиды одинаковые и конверсия случайна — модель выдаст всем одинаковый скор. Грязные данные — грязные прогнозы. Качество входа определяет качество выхода.
Какие данные нужны для обучения
Нужны два типа данных: признаки и целевая переменная. Признаки — всё, что знаете о лиде: фирмографика, поведение, история касаний. Целевая — исход: купил или нет.
Признаки обычно собрать проще — CRM, маркетинговая автоматизация, аналитика. Чем больше, тем лучше, но не все одинаково полезны. ML отсеивает шум, но при слишком большом количестве мусорных признаков качество падает.
Хорошие признаки для B2B: фирмографика (отрасль, размер, география, возраст, темп роста), данные контакта (должность, отдел, активность), поведение (визиты, открытия писем, скачивания), история продаж (звонки, встречи, длительность этапов).
С целевой переменной сложнее. «Купил» — понятно. А лиды в работе? Их нельзя пометить ни так, ни так. Обычно исключают из выборки или используют survival analysis. Ещё вопрос — горизонт: если не купил за 6 месяцев, считать его «не купившим»?
Этапы внедрения AI-скоринга
Внедрение — не кнопка «включить». Это проект. Вот типичный путь.
Аудит данных. Выгружаете CRM, смотрите качество. Сколько полей заполнено? Есть ли история сделок? На этом этапе обычно выясняется, что данных меньше и они грязнее, чем казалось.
Подготовка данных. Самая трудоёмкая часть. Очистка, заполнение пропусков, нормализация. Создание производных признаков: из дат касаний — «количество взаимодействий за 30 дней». Обогащение из внешних источников.
Разработка модели. Data scientist (или вендор) обучает несколько моделей, сравнивает качество, подбирает параметры. Критично — правильно разделить данные на обучающую и тестовую выборки. Переобучение — типичная ошибка.
Интеграция. Модель встраивается в процесс: регулярный расчёт скора, вывод в CRM, алерты, правила маршрутизации. Если скор в отдельной системе, куда никто не заходит — толку ноль.
Обучение команды. Менеджеры должны понимать, что скор значит, как использовать, каких ошибок избегать. Это управленческое обучение, не техническое: новые KPI, новый процесс, обратная связь для модели.
Мониторинг и переобучение. Модель — живой процесс, не артефакт. Нужно следить за качеством, ловить drift, переобучать на новых данных. Обычно раз в квартал или при крупных изменениях.
Как измерить качество скоринга
Как понять, что модель работает? Есть технические метрики (про модель) и бизнес-метрики (про результат).
Техническая метрика номер один — AUC-ROC. Показывает, насколько модель отделяет покупателей от остальных. 0.5 — случайное гадание, 1.0 — идеал. Хорошая модель для B2B — 0.70-0.85. Выше 0.85 — отлично, но подозрительно: возможна утечка данных.
Lift в первых децилях. Разбейте лиды на 10 групп по скору. Если в топ-10% конверсия в 5 раз выше среднего — lift 5x. Чем выше lift наверху, тем полезнее модель для приоритизации.
Бизнес-метрики важнее. Конверсия выросла при тех же усилиях? Время реакции на горячих сократилось? Win rate увеличился? Сравнивайте «до» и «после», в идеале — с контрольной группой.
Типичные ошибки и как их избежать
Редко проходит гладко. Вот что ломается чаще всего.
Недооценка данных. Увлекаются алгоритмами, забывают, что 80% работы — это подготовка данных. Мусор на входе — мусор на выходе.
Переобучение. Модель отлично работает на исторических данных, плохо — на новых. «Запоминает» выборку вместо поиска паттернов. Лечится валидацией (hold-out, cross-validation) и регуляризацией.
Игнорирование дисбаланса классов. В B2B конверсия 5-10% — то есть 90% лидов не покупают. Наивная модель всем предсказывает «не купит» и формально «точна» на 90%. Нужны техники: SMOTE, class weights, подбор порога.
Отсутствие интеграции. Модель есть, скор считается, но менеджеры не видят или игнорируют. Скоринг должен быть в CRM, влиять на маршрутизацию, быть частью KPI.
Нет обратной связи. Менеджеры знают, почему лид не купил, но информация не возвращается в модель. Нужен процесс сбора фидбека и переобучения.
Совет
Начните с простого: baseline-модель на имеющихся данных. Логрег на 10 признаках уже лучше, чем никакого скоринга. Потом улучшайте итерациями — признаки, алгоритмы, фидбек.
AI-скоринг vs готовые решения
Готовых решений много: модули в CRM (Salesforce Einstein, HubSpot Scoring), отдельные сервисы (MadKudu, 6sense). Строить своё или брать готовое?
Готовые проще внедрить. Не нужен data scientist, модель обучена на данных тысяч компаний. Минусы: меньше контроля, ограниченная кастомизация, модель не знает вашу специфику. Работает для «среднего» B2B, но может не попадать в вашу нишу.
Кастомная модель требует инвестиций, но учитывает ваши паттерны, клиентов, продукт. Для стартапа с 50 лидами в месяц — избыточно. Для компании с 5000 лидами и сложным циклом — оправданно.
Разумный путь: начать с готового решения, понять, есть ли польза. Если есть — инвестировать в кастом, который даст +20-30% к качеству.
Что дальше: от скоринга к рекомендациям
Скоринг отвечает на вопрос «какова вероятность конверсии». Бизнесу нужно больше: что делать с лидом, какое предложение сделать, когда позвонить. Это уже территория рекомендательных систем и Next Best Action.
Хороший скоринг — фундамент для этого. Научились предсказывать конверсию — следующий шаг: какой канал работает для сегмента, какое сообщение резонирует, что предложить. Тема для отдельного разговора.
AI-скоринг — не конечная точка, а начало пути к data-driven продажам. Чем лучше освоите работу с данными на этом этапе, тем проще двигаться дальше.
Итог
AI-скоринг — задача не тривиальная, но и не высшая математика. Нужны качественные данные, правильная методология, интеграция в процессы. Если всё есть — результаты заметны: +20-40% к конверсии, меньше времени на мусорные лиды, лучшее использование ресурсов.
Главный сдвиг в мышлении: от «мы знаем, кто наш клиент» к «давайте проверим данными». Интуиция руководителей часто расходится с реальностью. Модель беспристрастна — показывает то, что есть, а не то, что хочется видеть. В этом её ценность.