AI-readiness аудит: 12 вопросов от слива бюджета на ML

Купили кластер A100, наняли пятерых сеньоров, полгода пилили систему предсказания спроса. Выкатили в прод — а фиды для инференса обновляются раз в неделю ручным экспортом из базы в CSV на флешке. Проект сдох. Существует опасная секта свидетелей волшебной пилюли. Им кажется, что если у бизнеса накопились терабайты логов и выделен щедрый бюджет, достаточно просто натравить на это дело нейросеть, и польется золото. Это карго-культ. Настоящий AI-readiness аудит: 12 вопросов, которые отделяют готовую компанию от тех, кто сольет бюджет — это жестокое столкновение с реальностью, начинающееся с признания, что ваши сырые данные пока остаются просто цифровым мусором.

Готовность к внедрению ИИ измеряется по пяти жестким осям. Данные — это не про объем, а про качество и доступность в момент инференса. Инфраструктура — способность переварить деплой и отдавать предикты с нужным p99 latency под нагрузкой. Процессы — скорость доставки фичи от гипотезы до продакшена. Команда — баланс инженерии и науки: без дата-инженеров сайентисты превратят пайплайны в бесконечную SQL-лапшу. Культура решений — готовность бизнеса мириться с вероятностной природой метрик.

Уровни зрелости на этих осях варьируются радикально. От тотального хаоса, где телеметрию сводят руками в разрозненных эксельках, до промышленного ML, где MLOps вшит в ДНК продукта, а деградация пайплайнов дебажится только если экскаватор порвал оптику. Честно определить свою координату в этой системе координат — больно. Но необходимо.

AI-readiness аудит: 12 вопросов, которые отделяют готовую компанию от тех, кто сольет бюджет

Ниже чек-лист. Если половина ответов попадает в красный спектр, ваш проект гарантированно упрется в стену еще до стадии A/B-теста.

Как часто и в каком виде доступны данные для целевого процесса? Красный маркер: «Раз в день, выгружаем ночным скриптом». Для реалтайма вы уже мертвы.
Есть ли автоматический feedback loop? Красный маркер: «Эксперт посмотрит глазками». Без объективной разметки результатов в проде модель никогда не дообучится.
Готова ли целевая инфраструктура отдавать телеметрию наружу? Красный маркер: «У нас закрытый контур АСУ ТП, доступ запрещен политикой безопасности».
Тянет ли архитектура инференс по вычислительным ресурсам? Красный маркер: «Мы пока не считали потребление CPU/GPU на один запрос».
Сколько времени занимает выкатка одной фичи? Красный маркер: Релизные циклы по 3–6 месяцев. В ML вы будете итерироваться неделями, монолит вас сожрет.
Кто мониторит дрифт данных и деградацию модели после деплоя? Красный маркер: «Никто» или «Сами аналитики периодически заглядывают в дашборд».
Каков SLA на доступность сервиса? Красный маркер: «Система не должна падать никогда». ML падает. Вам нужен надежный fallback-сценарий из хардкодных правил.
Есть ли у заказчика толерантность к ошибкам алгоритма? Красный маркер: «Нам нужна стопроцентная точность». 100% бывает только в if-else. ИИ — это всегда вероятности.
Умеют ли ваши исследователи в софт-инженерию? Красный маркер: Команда состоит только из аналитиков, видевших код исключительно в Jupyter-ноутбуках.
Кто отвечает за пайплайны поставки фичей? Красный маркер: Отсутствие выделенных Data-инженеров на проекте.
Какова реальная экономика инференса? Красный маркер: Содержание железа под модель обойдется дороже, чем потенциальная экономия от ее внедрения за пару лет.
Кто конечный бизнес-заказчик метрики ROI? Красный маркер: «Отдел инноваций и трансформации». Если бизнесу не критичен результат, продукт сгниет в столе.

Когда мы в MoranaLabs катили edge-аналитику дефектов на заводском конвейере, мы уперлись именно в третью и четвертую оси. Камеры гнали 4K-поток в 60 FPS, разметка была идеальной, команда клиента — сверхумной. Но локальная сеть завода физически не тянула пересылку таких объемов в центральный кластер, лезли таймауты. Пришлось кардинально резать изначальную архитектуру: ставить тензорные вычислители прямо над лентой и делать инференс локально. Не проведи мы жесткий ассессмент сетевой инфры до старта — сожгли бы миллионы на мертвую систему.

Что чинить, когда все горит красным

Если аудит выдал россыпь красных флагов по трем и более осям, возникает классический менеджерский соблазн плюнуть на метрики и просто нанять ML-команду. Логика простая: придут умные парни с рынка и сами все починят. Остановитесь.

Чинить процессы нужно строго последовательно. Первым делом — базовая гигиена дата-инженерии. Вы не обучите трансформер на логах, которые собирает скрипт-самоделка раз в неделю с пропусками в 20% строк. По нашей статистике, до 70% всех ML-инициатив в энтерпрайзе с грохотом тонут именно на неготовности пайплайнов. Сделать proof of concept легко. Заставить данные течь в него бесперебойно под стрессовой нагрузкой — хардовая инфраструктурная задача.

Выравнивание гигиены занимает от 3 до 9 месяцев. Три. Девять. Месяцев. До первой попытки обучить хоть что-то, что пойдет в продакшен. Прыгнете через эту ступень — будете оплачивать дорогой простой крутых специалистов, пока они ковыряются в грязных дампах.

Здесь кроется главный трейд-офф индустриального ИИ. Высокий балл AI-readiness не гарантирует вам миллионные возвраты инвестиций. Он гарантирует только одно: вы не захлебнетесь в первые же недели. И иногда самый прибыльный итог честного аудита звучит жестоко: вам сейчас не нужен ML. Соберите нормальную аналитику, настройте витрины, автоматизируйте рутину простыми скриптами. Дешевле не начинать. Но если вы целитесь вдолгую, первый шаг — это ассессмент и пилот, где mlops-production-ml фундамент закладывается в систему до первой строчки кода. Все остальное — хайп.

AI-readiness аудит: 12 вопросов, спасающих от слива бюджета

AI-readiness аудит: 12 вопросов, которые отделяют готовую компанию от тех, кто сольет бюджет

Что чинить, когда все горит красным

Новые статьи — на почту

Edge AI или облако: когда тащить нейросеть на железо

Железо под нейросетевую видеоаналитику: камера, сервер, edge

Видеоаналитика и 152-ФЗ: что считается биометрией

Коробочная видеоаналитика или кастомная модель: считаем в лоб

Опишите задачу — ответим как инженеры.