Почему корпоративный чат-бот не приносит денег

Заказчик поднял корпоративный ChatGPT для отдела поддержки и через три месяца пришел с цифрами: время ответа не изменилось, косты не упали. Мы посмотрели логи. Операторы копировали вопрос клиента, вставляли в бота, копировали ответ, правили галлюцинации и отправляли обратно. Дорогой калькулятор слов.

В MoranaLabs мы разворачиваем индустриальный ИИ на железе клиента, оптимизируем high-load инференс без облаков и учим RL-модели. Но когда бизнес приходит за автоматизацией, 80% компаний пытаются прикрутить LLM сбоку к старому хаосу. Это не работает. Жесткий факт: вот почему корпоративный чат-бот не приносит денег и что строить вместо него.

Текст вместо результата

«Сотрудник быстрее ищет информацию по регламентам. Это же экономит время, значит, мы эффективнее!»

Вы правы. Искать информацию стало быстрее. Но это не влияет на P&L. Если менеджер нашел ответ за 10 секунд вместо пяти минут, он не обработает больше заявок. Он пойдет пить кофе. Вы купили ему удобный поисковик за ваши деньги.

Фундаментальная разница: ответить на вопрос о статусе заказа — это генерация текста. Изменить статус, списать товар со склада, рассчитать неустойку и отправить закрывающие документы клиенту — это закрытая бизнес-операция. Чат-боты делают первое. Вашему бизнесу нужно второе.

«Тогда давайте научим бота ходить во внутренние системы. Пусть дергает API и сам все делает.»

Именно. Но это уже не чат-бот. Это AI-агент. Ему нужны права на чтение и запись, доступ к ERP и CRM, и главное — детерминированные инструменты. Агент не генерирует советы. Он парсит входящий запрос, классифицирует намерение, вызывает нужную функцию и рапортует о выполнении. Текст здесь — лишь интерфейс.

# Пример узла оркестрации агента (упрощенный пайплайн)  
def handle_refund_claim(claim_text: str, client_id: str) -> dict:
    # 1. Извлечь сущности и проверить policy через LLM
    analysis = llm.invoke(prompt_claim.format(text=claim_text))
    
    if analysis.is_fraud_suspected or analysis.confidence_score < 0.85:
        return {"status": "escalated_to_human", "reason": "low_confidence"}
        
    # 2. Жесткая бизнес-логика транзакции (строгий код, не нейросеть)
    erp_db.lock_record(client_id)
    try:
        refund_id = erp_db.execute_refund(
            amount=analysis.approved_amount, 
            contract=analysis.contract_id
        )
        crm.log_interaction(client_id, "Auto-refund executed via AI-Agent")
        return {"status": "resolved", "refund_id": refund_id}
    finally:
        erp_db.unlock_record(client_id)

Заметьте: нейросеть только извлекает параметры. Транзакция идет строгим кодом. Это ребро, на котором ломаются «умные» стартапы: они пытаются заставить LLM генерировать SQL-запросы в прод-базу напрямую. Это путь к катастрофе.

Ломать и строить вокруг ИИ

«Мы дали агенту права на API, но процесс все равно буксует. Лиды теряются, потому что агент ждет аппрува от старшего смены.»

Бинго. Вы натянули нейросеть на конвейер, который создавался для людей с их биологическими ограничениями.

Люди устают, ошибаются и требуют многоступенчатого контроля. Классический бизнес-процесс неизбежно обрастает промежуточными статусами и буферами. Когда вы ставите туда ИИ-агента, он отрабатывает инференс за миллисекунды, а потом часами висит в асинхронной очереди, дожидаясь, пока контролер нажмет кнопку. ROI летит в пол. Система всегда работает со скоростью самого медленного компонента.

Перестроить процесс вокруг ИИ — значит сломать этот конвейер. Агент должен работать end-to-end. Если мы разворачиваем систему on-premise, чтобы данные не покидали периметр, агент общается с ядром напрямую по gRPC. Модель укладывается в жесткие SLA, где критичен p99 инференса, а не средние значения. Человек выводится из петли исполнения (human-in-the-loop) и переводится на уровень мониторинга аномалий. Он разбирает только те 2-5% заявок, где confidence score модели упал ниже порога. Остальное летит мимо людей.

Где ИИ реально режет косты:

L1/L2 поддержка: Агент перезагружает ноды, сбрасывает пароли и проводит базовую диагностику по логам, а не только цитирует FAQ.
Документооборот: Извлечение данных из сканов, кросс-чек с базой, автоматическая маршрутизация счетов в оплату без участия бухгалтера.
Рутинные операции: Скоринг заявок и автоматическая выдача допусков в закрытых контурах.

Считать метрики, а не диалоги

«Звучит хорошо, но как мне доказать финдиректору, что это окупится?»

Забудьте метрики вроде «качество ответов» или «количество диалогов». Это мусор. Бизнес не платит за слова.

Вы мерите время цикла (Cycle Time) закрытия бизнес-операции: было 4 часа, стало 12 секунд. Вы мерите стоимость обработки одной транзакции. И главное — вы мерите высвобожденные FTE (Full-Time Equivalent).

Если ваш отдел из 50 человек после внедрения ИИ все еще требует 50 человек для обработки того же объема заявок — вы построили дорогую игрушку. Если вы смогли перевести 15 человек на более сложные задачи без найма новых — вы победили.

Автоматизация работает только когда она совершает действия. Генерация текста ради текста — убыток. Агент в замкнутом контуре — профит.

Почему корпоративный чат-бот не приносит денег и что строить вместо него

Текст вместо результата

Ломать и строить вокруг ИИ

Считать метрики, а не диалоги

Новые статьи — на почту

Edge AI или облако: когда тащить нейросеть на железо

Сверка двух документов: почему это не diff, а задача сопоставления

ИИ в 1С:ERP и УНФ: чем отличается внедрение на разных конфигурациях

Локальная LLM для 1С: когда нельзя в облако

Опишите задачу — ответим как инженеры.