ROI от ИИ без самообмана: считаем окупаемость до старта

Девяносто процентов так называемых инноваций в энтерпрайзе — это просто легализованный способ сжечь бюджет, чтобы продакт-менеджер смог вписать модное слово себе в резюме. Заказчики приходят и просят прикрутить нейросеть, потому что конкуренты уже прикрутили, а совет директоров требует цифровой трансформации. И когда я спрашиваю, в чем бизнес-смысл, мне показывают презентацию с абстрактным повышением эффективности. Если вы пришли за этим, можете дальше не читать. Мы здесь обсуждаем ROI от ИИ без самообмана: как посчитать окупаемость до того, как потратил миллионы, а не как натянуть сову на глобус после того, как деньги уже закончились.

Финансовый директор и собственник живут в мире реальных цифр. Им абсолютно плевать на размер контекстного окна вашей языковой модели и на то, какую архитектуру вы используете под капотом — трансформер или старый добрый градиентный бустинг. Бизнес готов вкладываться только при понятном экономическом эффекте. Точка. Но что мы видим на практике? Эффект считают задним числом. Команда пилит MVP полгода, выкатывает его в прод, он ожидаемо не взлетает, и тут начинается магия бухгалтерии. Ищутся любые метрики, которые случайно выросли за этот период, и их рост гордо приписывается внедрению искусственного интеллекта. Это не инженерия, это подлог.

Задумайтесь, как продакты защищают бюджеты на машинное обучение. Они приносят красивый дашборд, где графики уходят вправо и вверх, и рассказывают сказки про то, как нейронные сети заменят целый отдел. Финдиректор смотрит на это и задает один простой вопрос: когда эти инвестиции вернутся в виде живого кэша на счетах компании? И в этот момент в переговорке повисает неловкая пауза. Потому что дата-саентисты мыслят категориями метрик качества, продакты — категориями фичей, а финдиректор — категориями EBITDA и стоимости капитала. И пока эти миры не пересекутся в одной жесткой финансовой модели, вы будете получать отказы.

Как оцифровать выгоду до старта? Выгода бывает только трех видов: мы либо экономим деньги прямо сейчас, либо зарабатываем новые деньги, которых раньше не было, либо снижаем риск катастрофических потерь в будущем. Все остальное — лирика для конференций. С экономией проще всего. Если у вас сидит двести человек и вручную сверяют накладные, а вы ставите систему распознавания, которая позволяет сократить штат до двадцати операторов-контролеров, вы просто умножаете сто восемьдесят высвобожденных зарплат со всеми налогами на двенадцать месяцев. Вот ваша грязная экономия. С выручкой сложнее. Выкатываете рекомендательную систему? Вам придется доказывать, что рост среднего чека произошел именно из-за нее, а не из-за сезонности или маркетинговой акции. Здесь работает только честное слепое тестирование с жестко изолированными контрольными группами.

Препарируем снижение рисков. Это самая скользкая тема, где проще всего обмануть самих себя. Допустим, мы делаем предсказательное обслуживание промышленных насосов. Как доказать, что алгоритм что-то экономит? Если насос не сломался, это заслуга модели или просто повезло? Вы должны поднять историческую статистику за последние пять лет. Выявить частоту внезапных отказов. Посчитать прямой ущерб от простоя: сгоревшее сырье в трубах, неустойки заказчикам, сверхурочные ремонтных бригад. Вы получаете математическое ожидание потерь, скажем, в сто миллионов рублей в год. Если ваша модель может заранее ловить аномалии в вибрации и снизить частоту аварий хотя бы на тридцать процентов — вот ваши тридцать миллионов гипотетической экономии. Но эту гипотезу придется защищать с цифрами в руках, доказывая, что модель не будет спамить ложными тревогами. Ложное срабатывание в промышленности, останавливающее конвейер, иногда стоит дороже, чем пропущенная авария.

Но здесь есть один критический момент, о который разбиваются самые красивые бизнес-кейсы. Это базовая линия. Бейзлайн. Если вы не знаете, как процесс работает сейчас, до внедрения алгоритмов, любой расчет окупаемости ИИ-проекта — это абсолютная фантазия. Сколько стоит обработка одного документа прямо сейчас, с учетом аренды офиса, больничных и текучки кадров? Сколько времени уходит на обнаружение дефекта на линии? Какова доля ложноположительных срабатываний у живого контролера? Вы удивитесь, но подавляющее большинство компаний понятия не имеют о своих текущих метриках. Они хотят улучшить то, что даже не удосужились измерить. Без базовой линии вам не с чем будет сравнивать результат. Вы выкатите систему с точностью девяносто пять процентов и будете праздновать победу, пока случайно не выяснится, что уставший оператор в конце ночной смены выдавал девяносто восемь процентов. И ваша хваленая автоматизация просто ухудшила процесс за огромные деньги.

Теперь смотрим в знаменатель нашей дроби. В затраты. И вот тут начинается тотальное слепое пятно. Прямые косты считать более-менее научились: зарплата команды разработки, стоимость аренды серверов в облаке или закупка железа в контур. Но прямые затраты — это верхушка айсберга. Основная масса денег тонет в косвенных затратах. Вам нужно собрать данные. Их нужно разметить. Если вы решаете специфическую бизнес-задачу, вам не поможет дешевый краудсорсинг. Вам нужны эксперты. Врачи, технологи, аудиторы, чье рабочее время стоит огромных денег. Они должны сесть и разметить вам десятки тысяч примеров. И они будут ошибаться, поэтому вам понадобится перекрестная разметка и дорогой арбитраж.

Дальше начинается интеграция. Когда мы в MoranaLabs катили систему компьютерного зрения для дефектоскопии на конвейере завода, клиент был абсолютно уверен, что главная статья расходов — это наши промышленные edge-серверы с мощными видеокартами. А по факту оказалось, что основная масса костов легла на их внутренних инженеров АСУ ТП, которые два месяца с кровью и потом интегрировали наше API в свои допотопные легаси-контроллеры, чтобы конвейер умел физически сбрасывать бракованную деталь в корзину. Интеграция почти всегда съедает больше ресурсов, чем обучение самой нейросети.

Вы думаете, на этом траты заканчиваются? Модель выкатили в прод, все выпили шампанского. А дальше начинается суровая операционная реальность. Машинное обучение — это не классический софт, который можно написать один раз и забыть. Нейросеть деградирует с первого дня после релиза. Оборудование на заводе изнашивается и начинает звучать иначе. Поставщик сменил дизайн упаковки, и алгоритм ослеп. Это дрейф данных. Чтобы система продолжала приносить те самые деньги, которые вы заложили в расчет окупаемости, ее нужно постоянно дообучать. Вам нужен непрерывный мониторинг на живом потоке. Вам нужны инженеры, которые будут расследовать инциденты. И эти операционные расходы будут сжирать вашу прибыль каждый месяц. Если вы не заложили их в финансовую модель на три года вперед, ваш ROI — это ложь.

Каков срок окупаемости здорового человека? В индустриальном сегменте, если проект не возвращает инвестиции за восемнадцать, максимум двадцать четыре месяца, его нужно убивать еще на этапе идеи. Технологии меняются слишком быстро. То, во что вы сегодня вбухиваете миллионы, через два года может стать бесплатной фичей в стандартном коробочном софте от вендора. Поэтому у каждого проекта должна быть точка невозврата. Килл-свитч. Вы запускаете пилот на строго ограниченном скоупе. Тратите заранее оговоренную сумму. Если по истечении трех месяцев пилот не показывает метрик, которые бьются с вашей финансовой моделью, вы закрываете проект. Безжалостно. Никаких уговоров про дообучение и закупку новых видеокарт. Не взлетело — режем. Это единственная рабочая стратегия защиты от бесконечного сжигания корпоративных денег.

Типовые ошибки в расчете всегда одни и те же. Первая — игнорирование стоимости ошибок самой модели. Искусственный интеллект не работает со стопроцентной точностью. Никогда. Если ваша нейросеть ошибается в пяти процентах случаев, кто будет разгребать эти ошибки руками? Сколько стоит час работы квалифицированного специалиста, который исправляет галлюцинации вашей системы? Иногда стоимость ручного разбора краевых случаев полностью перекрывает всю экономию от автоматизации. Вторая ошибка — недооценка железа. Все считают среднее потребление ресурсов, но забывают про пиковые нагрузки. Если вам нужно обрабатывать видеопоток в реалтайме без задержек, вам потребуется избыточный парк серверов, который большую часть времени будет простаивать, но за который вы заплатите полную цену. Третья ошибка — вера в то, что внедрение масштабируется линейно. Автоматизировать первые восемьдесят процентов процесса всегда дешевле и проще, чем дотягивать систему до последних пяти процентов сложных исключений.

Как выглядит рабочая модель расчета? Выкиньте сложные презентации, возьмите чистый лист. Шаг первый: фиксация текущих затрат на процесс до копейки. Это ваша точка А. Шаг второй: моделирование целевого процесса, закладывая реалистичную точность модели, а не академические бенчмарки из статей. Вы считаете, сколько денег останется в процессе после автоматизации с учетом ручной обработки ошибок. Разница — это ваш грязный профит. Шаг третий: сбор всех капитальных затрат. Исследования, разработка, железо, лицензии, интеграция в легаси, первичная разметка. Шаг четвертый: расчет ежегодных операционных затрат на поддержку и дообучение. Вычитаете все эти косты из грязного профита. И если то, что осталось на дне, не окупает первоначальные инвестиции за полтора года — вы просто не делаете этот проект. Вы идете и автоматизируете процесс скриптом на питоне или вообще ничего не трогаете. Инженерия — это про решение задач бизнеса, а не про удовлетворение собственного любопытства за чужой счет. Если система не приносит денег, это не инструмент. Это очень дорогая игрушка.

ROI от ИИ без самообмана: как посчитать окупаемость до того, как потратил миллионы

Новые статьи — на почту

Edge AI или облако: когда тащить нейросеть на железо

СБИС, Диадок, Контур или своя модель: чем отличается распознавание первички

Сколько стоит распознавание документов в 1С: считаем на 3000 накладных в месяц

Распознавание первичных документов в 1С: как перестать вбивать накладные руками

Опишите задачу — ответим как инженеры.