Знаю одного коммерческого директора — назовём его Аскар. Каждый понедельник он приезжает в офис к семи утра. Не потому что трудоголик — просто иначе не успеет собрать еженедельный отчёт. Сначала лезет в CRM, экспортирует сделки. Потом 1С — там продажи с суммами. Таблица маркетинга в Google Sheets — расходы на рекламу. Ещё одна таблица — логистика. К обеду у него файл на 15 вкладок и глаза квадратные.
На прошлой неделе директор спросил: «Какой ROI по клиентам из Instagram за последний квартал?» Казалось бы — простой вопрос. Но чтобы ответить, надо связать UTM-метки из CRM с покупками из 1С, учесть возвраты, вытащить расходы из рекламного кабинета... Аскар честно сказал: «Дайте пару дней». Директор посмотрел как-то нехорошо.
Это не про то, что Аскар плохой специалист. Это про архитектуру данных — вернее, про то, что её нет. Когда данные раскиданы по пяти системам в разных форматах — вы обречены на ручную работу. Но можно по-другому.
«Мы три года жили в режиме "ручная выгрузка каждый понедельник". Потратили месяц на настройку хранилища и дашбордов — теперь те же отчёты доступны в два клика. Я даже не представляю, как раньше терпел эту рутину. Директор получает данные в реальном времени, я занимаюсь аналитикой, а не копипастой.»
В любой нормальной CRM есть встроенные отчёты. Воронка, активность менеджеров, конверсия — всё на месте. Казалось бы, чего ещё надо? Зачем городить что-то отдельное?
А вот в чём загвоздка: CRM видит только себя. Она знает про лиды и сделки, но понятия не имеет про финансы, склад, логистику. А для принятия решений нужна полная картина, не кусочки.
Вот смотрите: в CRM у вас клиент с тремя закрытыми сделками за год. Красавчик, VIP! А копнёшь глубже — две сделки с маржой в 3%, по третьей был возврат, платит он с задержкой в два месяца, и ещё доставка к нему обходится вдвое дороже обычного. Это всё данные из 1С, склада, логистики — CRM их в упор не видит.
С учётом возвратов, скидок, стоимости обслуживания и привлечения.
Не по количеству лидов, а по чистой марже от клиентов.
Для cross-sell нужны данные о корзинах из учётной системы.
Не оборота, а маржи — с учётом скидок, которые они дают.
Связь CRM-клиента с дебиторкой из 1С.
Тренды за годы — нужна история, которую CRM редко хранит.
Собственно, для этого и нужен BI — Business Intelligence. Штука, которая тянет данные отовсюду, приводит их к одному виду и показывает в одном месте. CRM остаётся инструментом для работы с клиентами, но аналитику вы смотрите отдельно — там, где видно всё сразу.
«Хранилище данных», «ETL» — звучит как что-то из NASA. На деле для среднего бизнеса всё проще, чем кажется. Никакого rocket science — обычные базы данных и скрипты, которые перекладывают данные из одного места в другое.
Разберём по кусочкам — от того, откуда берутся данные, до красивой картинки на экране директора.
Это все системы, в которых живут данные вашего бизнеса. Типичный набор для казахстанской компании:
Каждый источник — это своя структура данных, свой формат, своя логика. В CRM клиент называется «Контрагент», в 1С — «Покупатель», в рекламе — это просто Client ID из cookie. Объединить всё это — задача следующих слоёв.
| Слой | Что делает | Инструменты |
|---|---|---|
| Источники | Хранят исходные данные | CRM, 1С, реклама, аналитика, Excel |
| ETL/ELT | Извлекают, трансформируют, загружают | Airbyte, Fivetran, n8n, Python-скрипты |
| Хранилище (DWH) | Хранит все данные в едином формате | PostgreSQL, ClickHouse, BigQuery |
| Витрины (Data Marts) | Готовые таблицы для отчётов | dbt, SQL-вьюхи, материализации |
| BI-инструмент | Визуализирует и показывает | Power BI, DataLens, Metabase, Looker |
Не обязательно использовать всё сразу. Для начала достаточно: источники → простой ETL → PostgreSQL → Power BI.
ETL — это Extract-Transform-Load. Забираем данные откуда-то, причёсываем их, складываем куда надо. Звучит элементарно, но на практике именно тут всё и ломается.
Что конкретно происходит:
Есть два подхода: классический ETL (трансформация до загрузки) и современный ELT (сначала грузим сырые данные, потом трансформируем в хранилище). Для большинства компаний ELT проще, потому что современные базы данных справляются с трансформациями быстро и дёшево.
Совет для старта: начните с Airbyte или n8n — они бесплатны и покрывают 80% задач. Облачные сервисы имеет смысл подключать, когда появится бюджет и понимание, что именно нужно автоматизировать.
DWH (Data Warehouse) — это база данных, оптимизированная для аналитики. В отличие от операционных баз (CRM, 1С), которые оптимизированы для записи и быстрого доступа к отдельным записям, хранилище оптимизировано для чтения больших объёмов и агрегаций.
Почему нельзя просто делать отчёты из CRM или 1С напрямую?
Хранилище решает все эти проблемы: данные копируются туда отдельно, с сохранением истории, в едином формате.
Для казахстанского бизнеса есть несколько практичных вариантов:
| Технология | Для кого | Плюсы | Минусы |
|---|---|---|---|
| PostgreSQL | Малый и средний бизнес, до 50 ГБ данных | Бесплатный, знакомый, легко найти специалистов | Медленнее на больших объёмах |
| ClickHouse | Средний бизнес, нужна скорость на больших данных | Очень быстрый для аналитики, бесплатный | Сложнее в настройке, нужен опыт |
| Google BigQuery | Облачные компании, быстрый старт | Serverless, масштабируется автоматически | Платный, данные в Google Cloud |
| Yandex ClickHouse Managed | Компании в экосистеме Яндекса | Настроенный ClickHouse, интеграция с DataLens | Платный, зависимость от Яндекса |
Для компании с оборотом до 5 млрд тенге в год PostgreSQL хватит с запасом. ClickHouse имеет смысл, когда данных много и нужны быстрые отчёты на лету — например, аналитика в реальном времени для e-commerce с миллионами транзакций.
Витрина — это готовая таблица с уже рассчитанными показателями, оптимизированная для конкретного отчёта или темы. Вместо того чтобы каждый раз считать LTV клиента на лету, вы один раз настраиваете расчёт — и он обновляется автоматически.
Типичные витрины для бизнеса:
Витрины — это не просто удобство. Они защищают BI-инструмент от сложных вычислений и делают отчёты быстрыми. А ещё обеспечивают единую логику: если LTV считается в витрине, то во всех отчётах он будет одинаковым.
Поможем спроектировать архитектуру, настроить хранилище и создать первые дашборды. Начнём с аудита ваших данных.
Получить консультациюКогда данные собраны в хранилище и витрины готовы — пора визуализировать. BI-инструмент подключается к хранилищу и позволяет строить дашборды, отчёты, графики.
На рынке десятки инструментов, но для казахстанских компаний реально актуальны несколько:
Продукт Microsoft, лидер рынка. Знакомый интерфейс для тех, кто работает с Excel. Мощный, гибкий, с хорошей документацией на русском.
Плюсы: много готовых визуализаций, отличная интеграция с Microsoft-стеком, большое сообщество. Можно публиковать отчёты в веб и мобильном приложении.
Минусы: платная подписка для командной работы (около 10$ на пользователя в месяц). Desktop-версия бесплатная, но без шаринга.
Бесплатный инструмент от Яндекса. Особенно хорош для компаний, которые уже используют Яндекс.Облако или Яндекс.Метрику — есть готовые коннекторы.
Плюсы: полностью бесплатный (без лимитов на пользователей), простой интерфейс, интеграция с ClickHouse и другими источниками, серверы в России/СНГ.
Минусы: меньше возможностей для сложной визуализации, чем у Power BI. Зависимость от Яндекса.
Open-source решение, которое можно развернуть у себя. Простой интерфейс, можно задавать вопросы на обычном языке (с оговорками).
Плюсы: бесплатный, можно развернуть на своём сервере, данные остаются у вас. Легко освоить без технического бэкграунда.
Минусы: для сложных отчётов придётся писать SQL. Меньше визуальных возможностей.
Looker Studio (бывший Data Studio) — бесплатный инструмент для базовых дашбордов, хорошо работает с Google Analytics и BigQuery. Looker — enterprise-решение для крупных компаний.
Плюсы: интеграция с Google-экосистемой, Looker Studio бесплатный.
Минусы: Looker очень дорогой. Looker Studio ограничен в возможностях.
| Критерий | Power BI | DataLens | Metabase |
|---|---|---|---|
| Стоимость | ~10$/user/мес | Бесплатно | Бесплатно (self-host) |
| Сложность освоения | Средняя | Низкая | Низкая |
| Визуализации | Богатые | Базовые | Базовые |
| Мобильное приложение | Да | Нет | Да |
| Self-hosted | Нет | Нет | Да |
| Интеграция с 1С | Через коннекторы | Через ClickHouse | Через PostgreSQL |
Рекомендация: Для начала — DataLens или Metabase. Когда появятся сложные требования и бюджет — Power BI.
Давайте разберём конкретный пример. Коммерческий директор хочет видеть на одном экране:
Для этого нужны данные из CRM (воронка, каналы привлечения), 1С (выручка, маржа, дебиторка) и рекламы (затраты). Как это реализуется:
Создаём три потока данных:
Ключевой момент — как связать клиента в CRM с покупателем в 1С. Варианты:
На практике обычно комбинируют: сначала точное сопоставление по телефону/email, потом ручная проверка остатка. Подробнее о качестве данных — в статье про единый источник правды (SSOT).
Для этого дашборда нужны витрины:
В Power BI или DataLens подключаемся к хранилищу и строим визуализации. Каждый виджет — это запрос к витрине. Благодаря витринам запросы простые и быстрые.
Принцип: на одном экране — ключевые показатели. Детали — по клику или в отдельных вкладках.
Отдельная тема, которую часто путают с BI — сквозная аналитика. Это частный случай, когда мы связываем рекламные расходы с реальными продажами и считаем ROI по каналам.
Почему это сложно? Потому что путь клиента запутанный. Человек увидел рекламу в Instagram, зашёл на сайт, ушёл. Через неделю вспомнил, загуглил название, позвонил. Заказал. Через месяц пришёл снова — уже напрямую. Какому каналу засчитать продажу?
Подробнее о том, как собрать всю цепочку — в статье про сквозную аналитику с Яндекс.Метрикой и CRM.
Есть несколько способов распределить заслугу между каналами:
| Модель | Логика | Когда использовать |
|---|---|---|
| Last Click | 100% заслуги последнему каналу | Простой анализ, короткий цикл сделки |
| First Click | 100% заслуги первому каналу | Фокус на привлечении новых клиентов |
| Linear | Поровну между всеми касаниями | Все каналы одинаково важны |
| Time Decay | Больше веса недавним касаниям | Важнее то, что ближе к покупке |
| Position Based | 40% первому, 40% последнему, 20% остальным | Компромисс между First и Last |
Для большинства B2B-компаний с длинным циклом продаж подходит Position Based или Time Decay. Для e-commerce с быстрыми покупками — Last Click достаточно.
Расскажу, что обычно идёт не так. Может, сэкономите себе пару месяцев нервов.
Типичная история: купили Power BI, подключили напрямую к CRM и 1С, за неделю накидали графиков. Директор доволен. Через месяц выясняется: цифры не бьются, отчёты висят по пять минут, один клиент показывается три раза. Почему? Потому что пропустили всю подготовку — ETL, хранилище, нормализацию.
Правильно: сначала наведите порядок в данных, потом визуализируйте.
«Давайте выгрузим все поля из всех таблиц — вдруг пригодится». Через полгода: 200 таблиц, в которых никто не разбирается, ETL работает по четыре часа, диск забит под завязку. А нужных данных всё равно нет, потому что про них забыли.
Правильно: начните с вопросов. Что хотите узнать? Какие данные для этого нужны? Всё остальное — потом, если реально понадобится.
Хранилище настроили, дашборды построили — а цифры какие-то левые. Начинаешь копать: в CRM у половины сделок нет источника, в 1С один контрагент записан пятью разными способами, телефоны где с +7, где с 8, где вообще через дефис.
Правильно: параллельно с BI запустите проект по качеству данных. Читайте про это в статье о очистке базы CRM от дубликатов.
Хотим, чтобы и директор смотрел, и менеджеры, и бухгалтерия. В итоге на экране 50 графиков, всё мелкое, никто ничего не понимает и не пользуется.
Правильно: разные люди — разные дашборды. Директору нужны три цифры и тренд. Менеджеру — его сделки. Маркетологу — воронка и ROI. Не надо всё сваливать в одну кучу.
ETL работает? Отлично, больше не трогаем. Через полгода в CRM добавили новые поля, в 1С поменяли структуру документов — и тишина. Данные грузятся наполовину, отчёты врут, а все думают, что всё в порядке.
Правильно: BI — это не проект, а процесс. Нужен кто-то, кто регулярно проверяет, что данные текут, чинит поломки, добавляет новое. Без присмотра всё развалится.
Если вы читаете эту статью и думаете «нам бы такое» — вот пошаговый план.
Честный ответ: зависит от масштаба. Но дам ориентиры.
Для компании с 1-3 источниками данных и базовыми потребностями:
Итого: ~5-10 тыс. тенге в месяц на инфраструктуру + время специалиста.
Для компании с 5+ источниками, требованием к скорости и надёжности:
Итого: 100-300 тыс. тенге в месяц + затраты на специалиста.
Для крупных компаний с большими объёмами данных, требованиями к безопасности, выделенной командой аналитики — бюджеты от миллиона тенге в месяц и выше. Но это отдельная история.
Проведём аудит ваших данных, спроектируем архитектуру и построим первый дашборд.
Обсудить проектАскар из начала статьи тратил целый день на отчёт, который всё равно содержал ошибки. Потому что данные в разных местах, форматы разные, цифры не сходятся. Это не его вина — это проблема архитектуры.
BI вокруг CRM — это способ перестать угадывать и начать видеть. Видеть, какие клиенты действительно прибыльны. Какие каналы работают. Какие менеджеры эффективны. Где теряются деньги. Без этого бизнес-решения принимаются на интуиции — а интуиция часто врёт.
Хорошая новость: для старта не нужны огромные бюджеты. PostgreSQL, Airbyte, DataLens — всё это бесплатно или почти бесплатно. Нужен один человек, который разбирается в данных, и желание навести порядок.
Начните с одного дашборда. С одного вопроса, на который не можете ответить. Постройте пайплайн для него. А потом — масштабируйте.
Потому что компании, которые принимают решения на данных, обыгрывают тех, кто полагается на интуицию. Это не теория — это практика, подтверждённая тысячами кейсов по всему миру. И Казахстан — не исключение.