Арман — владелец инжиниринговой компании в Астане. Его команда участвует в тендерах на поставку промышленного оборудования. Каждую неделю приходят документы: технические задания на 80 страниц, спецификации с сотнями позиций, требования к сертификации.
Раньше менеджер тратил два-три дня на анализ одного тендера. Нужно было сверить каждую позицию с каталогом, рассчитать логистику, проверить наличие сертификатов, оценить риски по срокам. И только потом — принять решение: участвуем или нет.
«Мы попробовали обычного GPT-бота, — рассказывает Арман. — Он неплохо суммировал документы, но когда дело доходило до расчётов... Ну, скажем так, его цифрам нельзя было доверять. Однажды он насчитал нам прибыль в 40%, а на деле там была отрицательная маржа после учёта всех расходов».
А потом появились reasoning-модели. И ситуация изменилась.
«Reasoning-модели — это не просто умные нейросети. Это системы, которые умеют останавливаться и думать. Они разбивают сложную задачу на шаги, проверяют свои промежуточные выводы и исправляют ошибки, прежде чем дать финальный ответ.»
Обычные языковые модели — GPT-4, Claude 3, Gemini — работают по принципу «вопрос-ответ». Они генерируют текст последовательно, слово за словом, ориентируясь на статистические закономерности. Это похоже на то, как опытный специалист отвечает на привычные вопросы — быстро и автоматически.
Но что происходит, когда задача нестандартная? Когда нужно не просто вспомнить информацию, а выстроить цепочку рассуждений? Человек-эксперт берёт паузу, рисует схему на салфетке, проверяет промежуточные результаты. Обычная LLM этого не делает — она продолжает генерировать текст, даже если логика начинает буксовать.
Reasoning-модели — OpenAI o1, Claude с extended thinking, Gemini 2.0 Flash Thinking — устроены иначе. Перед тем как дать ответ, они проходят этап внутренних рассуждений. Буквально: модель «думает вслух», хотя этот процесс обычно скрыт от пользователя.
Вопрос → Генерация ответа токен за токеном → Ответ
Вопрос → Цепочка рассуждений → Проверка → Ответ
Представьте разницу между калькулятором и бухгалтером. Калькулятор мгновенно выдаёт результат — но если вы ввели не ту формулу, он не скажет. Бухгалтер посмотрит на цифры, заметит «что-то не сходится», пересчитает, спросит уточнения. Reasoning-модель ближе ко второму варианту.
Технически это достигается через механизм «chain of thought» — цепочки рассуждений. Модель генерирует промежуточные шаги решения, анализирует их и может вернуться назад, если обнаружит противоречие. В случае OpenAI o1 этот процесс может занимать десятки тысяч токенов «внутренних рассуждений», которые пользователь не видит.
Подробнее о различных AI-моделях и их возможностях мы писали в статье Обзор AI-моделей 2025: ChatGPT, Claude, Gemini, Llama.
Первое, что нужно понять: reasoning-модели — не замена обычным LLM. Это специализированный инструмент для определённых задач. Использовать o1 для ответа «Какой у вас адрес офиса?» — всё равно что возить хлеб на самосвале. Технически можно, но зачем?
Давайте разберёмся, где reasoning-модели действительно оправданы.
Калькуляция себестоимости с учётом логистики, таможни, курса валют, наценок
Проверка соответствия спецификации требованиям ТЗ, поиск противоречий в контракте
Анализ причин сбоя в системе, пошаговое исключение гипотез
Составление графика поставок с учётом ограничений, оптимизация маршрутов
Режим работы, контакты, описание услуг — здесь не нужны сложные рассуждения
Написание писем, описаний товаров, постов — творческие задачи
Краткое изложение документа, выделение ключевых пунктов
Определение темы обращения, направление в нужный отдел
Есть простой тест: если задачу можно решить «интуитивно», без пошагового анализа — обычная LLM справится. Если нужно выстраивать логическую цепочку, проверять условия, сравнивать варианты — стоит подключить reasoning-модель.
И ещё важный момент: reasoning-модели медленнее. o1 может думать 30-60 секунд над сложным вопросом. Для чат-бота, отвечающего клиенту в WhatsApp, это неприемлемо. Для системы, анализирующей тендерную документацию в фоновом режиме — вполне нормально.
Теория — это хорошо, но давайте посмотрим, как reasoning-модели работают на практике. Вот реальные сценарии, которые мы реализовывали для казахстанских компаний.
Задача:
Компания получает техническое задание на 100+ страниц. Нужно за 2 часа понять: подходит ли тендер, какие позиции можем поставить, какие риски, какая ориентировочная маржа.
Как работает reasoning-модель:
Результат: Время анализа сократилось с 2 дней до 3 часов. Точность оценки маржинальности выросла на 35%.
Дистрибьютор промышленного оборудования получает запросы от клиентов с нестандартными конфигурациями. Каждый запрос — уникальная комбинация: базовый блок, модули, опции, услуги по монтажу, условия гарантии.
Разбор конфигурации на компоненты
Расчёт с учётом курса, скидок, истории клиента
Генерация КП с детализацией
Было: КП формировалось 4-6 часов с привлечением 2-3 специалистов. Стало: 15 минут, проверка одним менеджером.
IT-компания обслуживает сложные промышленные системы. Клиент присылает описание проблемы: «Система периодически зависает при обработке больших партий». Нужно понять причину и предложить решение.
Как рассуждает reasoning-модель:
Обычная LLM могла бы предложить «перезагрузите сервер» или дать список из 20 возможных причин без приоритизации. Reasoning-модель выстраивает логику как опытный инженер.
Ещё два сценария, которые мы видим на практике:
Юридическая служба получает проект договора от контрагента. Нужно проверить, не противоречит ли он внутренним политикам компании, нет ли невыгодных условий, все ли стандартные пункты включены. Reasoning-модель анализирует каждый пункт, сравнивает с шаблоном, выявляет отклонения и формирует список замечаний с обоснованием.
Инвестиционная компания оценивает потенциального партнёра. На входе — бухгалтерские отчёты за три года. На выходе — структурированный анализ: динамика выручки, рентабельность, долговая нагрузка, «красные флаги» (например, резкий рост дебиторки при падении продаж). Reasoning-модель не просто считает коэффициенты — она интерпретирует их в контексте бизнеса.
Подробнее о том, как AI помогает генерировать коммерческие предложения, читайте в нашей статье AI-генерация коммерческих предложений в CRM.
На рынке сейчас три основных reasoning-модели для бизнес-применений. У каждой свои особенности, и выбор зависит от вашей задачи.
| Параметр | OpenAI o1 | Claude 3.5 с Extended Thinking | Gemini 2.0 Flash Thinking |
|---|---|---|---|
| Сильные стороны | Математика, программирование, формальная логика | Анализ документов, рассуждения на естественном языке, безопасность | Мультимодальность, скорость, стоимость |
| Контекстное окно | 128K токенов | 200K токенов | 1M токенов |
| Время ответа | 10-60 сек (зависит от сложности) | 15-90 сек | 5-30 сек |
| Стоимость (примерно) | $15-60 / 1M токенов | $15-75 / 1M токенов | $0.35 / 1M токенов (Flash) |
| Видимость рассуждений | Скрыты (только финальный ответ) | Можно показать «thinking» блок | Частично видимы |
| Лучше всего подходит для | Сложные расчёты, код, точные ответы | Анализ контрактов, B2B-коммуникации, работа с политиками | Анализ больших документов, быстрые задачи |
На практике мы часто используем гибридный подход. Простые задачи обрабатывает быстрая и дешёвая модель. Сложные — перенаправляются на reasoning-модель. Это позволяет оптимизировать и стоимость, и время отклика.
Например, в системе анализа тендеров: первичная классификация (подходит тендер по отрасли или нет) делается обычным GPT-4 за секунду. А глубокий анализ с расчётами — отправляется на o1, который работает 2-3 минуты, но выдаёт детальный отчёт.
О том, как использовать несколько LLM в одном продукте, мы подробно писали в статье про Agentic AI: боты-агенты, которые сами принимают решения.
Давайте честно: reasoning-модели дорогие. o1 стоит в 10-15 раз дороже GPT-4 Turbo за те же объёмы текста. Плюс время — клиент или менеджер не готов ждать минуту на каждый ответ в чате.
Но есть ситуации, когда эти затраты окупаются с лихвой.
Экономия: 1,240,000 тенге в месяц. ROI за первый месяц: 344%
Но это ещё не всё. Есть косвенные эффекты, которые сложнее посчитать:
Простое правило: reasoning-модель оправдана там, где цена ошибки высока, а стоимость человеческого времени на решение задачи значительна. Анализ контракта на 50 миллионов? Определённо да. Ответ на вопрос «какой у вас график работы»? Очевидно нет.
Подробнее о расчёте окупаемости AI-решений читайте в нашей статье Окупаемость AI-бота за 14 дней: реальный расчёт.
Проведём аудит ваших B2B-процессов и покажем, где reasoning-AI принесёт максимальную пользу. Расчёт ROI — бесплатно.
Обсудить применениеТеперь практический вопрос: как интегрировать reasoning-модели в существующие системы? Это не так сложно, как может показаться, но есть нюансы.
Не пытайтесь автоматизировать всё сразу. Выберите 2-3 процесса, где есть чёткие критерии успеха и измеримый результат. Хорошие кандидаты: расчёт коммерческих предложений, анализ входящих документов, первичная диагностика технических проблем.
Reasoning-модели работают лучше, когда у них есть структурированный контекст. Если анализируете тендеры — подключите каталог продукции, ценовые матрицы, историю успешных сделок. Чем больше релевантных данных, тем точнее рассуждения.
Не все запросы должны идти на reasoning-модель. Настройте роутинг: простые задачи обрабатывает быстрая модель, сложные — отправляются на o1 или Claude Thinking. Это оптимизирует и стоимость, и время отклика.
Входящий запрос
Классификатор (быстрая LLM)
Простое → GPT-4
Сложное → o1
Результат в CRM
Reasoning-модели надёжнее обычных LLM, но не идеальны. На первом этапе пусть результаты проверяет человек. Собирайте случаи, когда модель ошиблась, и используйте их для улучшения промптов и добавления контекста.
Начните с одного типа задач. Убедитесь, что система работает стабильно, пользователи довольны, метрики в норме. Потом добавляйте следующий сценарий. Это снижает риски и позволяет учиться на ходу.
О том, как правильно интегрировать AI-ботов с бизнес-системами, читайте в статье Интеграция бота с ERP/CRM: 8 ошибок в ТЗ.
Было бы нечестно говорить только о преимуществах. У reasoning-моделей есть ограничения, и о них важно знать заранее.
10-60 секунд на ответ — неприемлемо для интерактивных чат-ботов. Используйте reasoning-модели для асинхронных задач или предупреждайте пользователя о времени ожидания.
В 10-15 раз дороже обычных LLM. При большом объёме запросов бюджет может вырасти неожиданно. Настройте лимиты и мониторинг расходов.
У o1 цепочка рассуждений скрыта. Вы получаете только финальный ответ, и не всегда понятно, как модель к нему пришла. Это затрудняет отладку и аудит.
Reasoning-модели могут выдавать неправильный ответ с высокой уверенностью. Всегда требуйте обоснование и проверяйте критичные выводы.
Ещё один момент — совместимость с существующими системами. Reasoning-модели требуют специфического промптинга. Простой подход «вот документ, проанализируй» работает хуже, чем структурированная инструкция с чётким описанием шагов.
И наконец — человеческий фактор. Некоторые сотрудники воспринимают AI как угрозу. Важно позиционировать reasoning-модели как инструмент усиления, а не замены. Эксперт тратит меньше времени на рутину и больше — на принятие решений.
О психологических аспектах внедрения AI читайте в статье Доверие к AI-боту: как сделать так, чтобы клиенты не боялись роботов.
Вернёмся к Арману из начала статьи. После внедрения reasoning-модели для анализа тендеров его компания изменила подход к работе.
Теперь документы загружаются в систему автоматически. Через 20-30 минут приходит структурированный отчёт: соответствие требованиям, предварительная калькуляция, список рисков, рекомендация участвовать или нет с обоснованием. Менеджер проверяет выводы, корректирует при необходимости и принимает решение.
«Мы стали участвовать в два раза больше тендеров, — говорит Арман. — И при этом качество заявок выросло. Меньше ошибок в ценообразовании, меньше "сюрпризов" на этапе исполнения. Ребятам сначала было непривычно доверять AI, но когда они увидели, как он ловит ошибки, которые они пропускали, — скептицизм ушёл».
Reasoning-модели — это не замена экспертам. Это инструмент, который берёт на себя рутинную аналитику и многошаговые расчёты, освобождая людей для стратегических решений. В B2B, где сделки сложные и цена ошибки высока, это может быть критически важным преимуществом.
Главное — понимать, где применять. Не для каждой задачи нужна модель, которая «думает» минуту. Но там, где нужна — она может сэкономить дни работы и миллионы тенге.
Покажем, как o1 и Claude Thinking могут ускорить ваши B2B-процессы: анализ документов, ценообразование, диагностика. Подготовим пилотный проект за 2 недели.
Запустить пилотСравнение ведущих LLM для бизнес-задач
Практические сценарии AI для B2B
Как автоматизировать создание КП
Автоматизация работы с тендерами