Заказчик поднял корпоративный ChatGPT для отдела поддержки и через три месяца пришёл с цифрами: время ответа не изменилось, косты не упали. Мы посмотрели логи. Операторы копировали вопрос клиента, вставляли в бота, копировали ответ, правили галлюцинации и отправляли обратно. Дорогой калькулятор слов.
В Morana Labs мы разворачиваем индустриальный ИИ на железе клиента, оптимизируем high-load инференс без облаков и учим RL-модели. Но когда бизнес приходит за автоматизацией, 80% компаний пытаются прикрутить LLM сбоку к старому хаосу. Это не работает. Жёсткий факт: вот почему корпоративный чат-бот не приносит денег и что строить вместо него.
Текст вместо результата
«Сотрудник быстрее ищет информацию по регламентам. Это же экономит время, значит, мы эффективнее!»
Вы правы. Искать информацию стало быстрее. Но это не влияет на P&L. Если менеджер нашёл ответ за 10 секунд вместо пяти минут, он не обработает больше заявок. Он пойдёт пить кофе. Вы купили ему удобный поисковик за ваши деньги.
Фундаментальная разница: ответить на вопрос о статусе заказа — это генерация текста. Изменить статус, списать товар со склада, рассчитать неустойку и отправить закрывающие документы клиенту — это закрытая бизнес-операция. Чат-боты делают первое. Вашему бизнесу нужно второе.
«Тогда давайте научим бота ходить во внутренние системы. Пусть дёргает API и сам всё делает.»
Именно. Но это уже не чат-бот. Это AI-агент. Ему нужны права на чтение и запись, доступ к ERP и CRM, и главное — детерминированные инструменты. Агент не генерирует советы. Он парсит входящий запрос, классифицирует намерение, вызывает нужную функцию и рапортует о выполнении. Текст здесь — лишь интерфейс.
# Пример узла оркестрации агента (упрощенный пайплайн)
def handle_refund_claim(claim_text: str, client_id: str) -> dict:
# 1. Извлечь сущности и проверить policy через LLM
analysis = llm.invoke(prompt_claim.format(text=claim_text))
if analysis.is_fraud_suspected or analysis.confidence_score < 0.85:
return {"status": "escalated_to_human", "reason": "low_confidence"}
# 2. Жёсткая бизнес-логика транзакции (строгий код, не нейросеть)
erp_db.lock_record(client_id)
try:
refund_id = erp_db.execute_refund(
amount=analysis.approved_amount,
contract=analysis.contract_id
)
crm.log_interaction(client_id, "Auto-refund executed via AI-Agent")
return {"status": "resolved", "refund_id": refund_id}
finally:
erp_db.unlock_record(client_id)Заметьте: нейросеть только извлекает параметры. Транзакция идёт строгим кодом. Это ребро, на котором ломаются «умные» стартапы: они пытаются заставить LLM генерировать SQL-запросы в прод-базу напрямую. Это путь к катастрофе.
Ломать и строить вокруг ИИ
«Мы дали агенту права на API, но процесс всё равно буксует. Лиды теряются, потому что агент ждёт аппрува от старшего смены.»
Бинго. Вы натянули нейросеть на конвейер, который создавался для людей с их биологическими ограничениями.
Люди устают, ошибаются и требуют многоступенчатого контроля. Классический бизнес-процесс неизбежно обрастает промежуточными статусами и буферами. Когда вы ставите туда ИИ-агента, он отрабатывает инференс за миллисекунды, а потом часами висит в асинхронной очереди, дожидаясь, пока контролёр нажмёт кнопку. ROI летит в пол. Система всегда работает со скоростью самого медленного компонента.
Перестроить процесс вокруг ИИ — значит сломать этот конвейер. Агент должен работать end-to-end. Если мы разворачиваем систему on-premise, чтобы данные не покидали периметр, агент общается с ядром напрямую по gRPC. Модель укладывается в жёсткие SLA, где критичен p99 инференса, а не средние значения. Человек выводится из петли исполнения (human-in-the-loop) и переводится на уровень мониторинга аномалий. Он разбирает только те 2-5% заявок, где confidence score модели упал ниже порога. Остальное летит мимо людей.
Где ИИ реально режет косты:
L1/L2 поддержка: Агент перезагружает ноды, сбрасывает пароли и проводит базовую диагностику по логам, а не только цитирует FAQ.
Документооборот: Извлечение данных из сканов, кросс-чек с базой, автоматическая маршрутизация счетов в оплату без участия бухгалтера.
Рутинные операции: Скоринг заявок и автоматическая выдача допусков в закрытых контурах.
Считать метрики, а не диалоги
«Звучит хорошо, но как мне доказать финдиректору, что это окупится?»
Забудьте метрики вроде «качество ответов» или «количество диалогов». Это мусор. Бизнес не платит за слова.
Вы мерите время цикла (Cycle Time) закрытия бизнес-операции: было 4 часа, стало 12 секунд. Вы мерите стоимость обработки одной транзакции. И главное — вы мерите высвобожденные FTE (Full-Time Equivalent).
Если ваш отдел из 50 человек после внедрения ИИ всё ещё требует 50 человек для обработки того же объёма заявок — вы построили дорогую игрушку. Если вы смогли перевести 15 человек на более сложные задачи без найма новых — вы победили.
Автоматизация работает только когда она совершает действия. Генерация текста ради текста — убыток. Агент в замкнутом контуре — профит.