Купили кластер A100, наняли пятерых сеньоров, полгода пилили систему предсказания спроса. Выкатили в прод — а фиды для инференса обновляются раз в неделю ручным экспортом из базы в CSV на флешке. Проект сдох. Существует опасная секта свидетелей волшебной пилюли. Им кажется, что если у бизнеса накопились терабайты логов и выделен щедрый бюджет, достаточно просто натравить на это дело нейросеть, и польётся золото. Это карго-культ. Настоящий AI-readiness аудит: 12 вопросов, которые отделяют готовую компанию от тех, кто сольёт бюджет — это жестокое столкновение с реальностью, начинающееся с признания, что ваши сырые данные пока остаются просто цифровым мусором.
Готовность к внедрению ИИ измеряется по пяти жёстким осям. Данные — это не про объём, а про качество и доступность в момент инференса. Инфраструктура — способность переварить деплой и отдавать предикты с нужным p99 latency под нагрузкой. Процессы — скорость доставки фичи от гипотезы до продакшена. Команда — баланс инженерии и науки: без дата-инженеров сайентисты превратят пайплайны в бесконечную SQL-лапшу. Культура решений — готовность бизнеса мириться с вероятностной природой метрик.
Уровни зрелости на этих осях варьируются радикально. От тотального хаоса, где телеметрию сводят руками в разрозненных эксельках, до промышленного ML, где MLOps вшит в ДНК продукта, а деградация пайплайнов дебажится только если экскаватор порвал оптику. Честно определить свою координату в этой системе координат — больно. Но необходимо.
AI-readiness аудит: 12 вопросов, которые отделяют готовую компанию от тех, кто сольёт бюджет
Ниже чек-лист. Если половина ответов попадает в красный спектр, ваш проект гарантированно упрётся в стену ещё до стадии A/B-теста.
- Как часто и в каком виде доступны данные для целевого процесса? Красный маркер: «Раз в день, выгружаем ночным скриптом». Для реалтайма вы уже мертвы.
- Есть ли автоматический feedback loop? Красный маркер: «Эксперт посмотрит глазками». Без объективной разметки результатов в проде модель никогда не дообучится.
- Готова ли целевая инфраструктура отдавать телеметрию наружу? Красный маркер: «У нас закрытый контур АСУ ТП, доступ запрещён политикой безопасности».
- Тянет ли архитектура инференс по вычислительным ресурсам? Красный маркер: «Мы пока не считали потребление CPU/GPU на один запрос».
- Сколько времени занимает выкатка одной фичи? Красный маркер: Релизные циклы по 3–6 месяцев. В ML вы будете итерироваться неделями, монолит вас сожрёт.
- Кто мониторит дрифт данных и деградацию модели после деплоя? Красный маркер: «Никто» или «Сами аналитики периодически заглядывают в дашборд».
- Каков SLA на доступность сервиса? Красный маркер: «Система не должна падать никогда». ML падает. Вам нужен надёжный fallback-сценарий из хардкодных правил.
- Есть ли у заказчика толерантность к ошибкам алгоритма? Красный маркер: «Нам нужна стопроцентная точность». 100% бывает только в if-else. ИИ — это всегда вероятности.
- Умеют ли ваши исследователи в софт-инженерию? Красный маркер: Команда состоит только из аналитиков, видевших код исключительно в Jupyter-ноутбуках.
- Кто отвечает за пайплайны поставки фичей? Красный маркер: Отсутствие выделенных Data-инженеров на проекте.
- Какова реальная экономика инференса? Красный маркер: Содержание железа под модель обойдётся дороже, чем потенциальная экономия от её внедрения за пару лет.
- Кто конечный бизнес-заказчик метрики ROI? Красный маркер: «Отдел инноваций и трансформации». Если бизнесу не критичен результат, продукт сгниёт в столе.
Когда мы в Morana Labs катили edge-аналитику дефектов на заводском конвейере, мы упёрлись именно в третью и четвёртую оси. Камеры гнали 4K-поток в 60 FPS, разметка была идеальной, команда клиента — сверхумной. Но локальная сеть завода физически не тянула пересылку таких объёмов в центральный кластер, лезли таймауты. Пришлось кардинально резать изначальную архитектуру: ставить тензорные вычислители прямо над лентой и делать инференс локально. Не проведи мы жёсткий ассессмент сетевой инфры до старта — сожгли бы миллионы на мёртвую систему.
Что чинить, когда всё горит красным
Если аудит выдал россыпь красных флагов по трём и более осям, возникает классический менеджерский соблазн плюнуть на метрики и просто нанять ML-команду. Логика простая: придут умные парни с рынка и сами всё починят. Остановитесь.
Чинить процессы нужно строго последовательно. Первым делом — базовая гигиена дата-инженерии. Вы не обучите трансформер на логах, которые собирает скрипт-самоделка раз в неделю с пропусками в 20% строк. По нашей статистике, до 70% всех ML-инициатив в энтерпрайзе с грохотом тонут именно на неготовности пайплайнов. Сделать proof of concept легко. Заставить данные течь в него бесперебойно под стрессовой нагрузкой — хардовая инфраструктурная задача.
Выравнивание гигиены занимает от 3 до 9 месяцев. Три. Девять. Месяцев. До первой попытки обучить хоть что-то, что пойдёт в продакшен. Прыгнете через эту ступень — будете оплачивать дорогой простой крутых специалистов, пока они ковыряются в грязных дампах.
Здесь кроется главный трейд-офф индустриального ИИ. Высокий балл AI-readiness не гарантирует вам миллионные возвраты инвестиций. Он гарантирует только одно: вы не захлебнётесь в первые же недели. И иногда самый прибыльный итог честного аудита звучит жестоко: вам сейчас не нужен ML. Соберите нормальную аналитику, настройте витрины, автоматизируйте рутину простыми скриптами. Дешевле не начинать. Но если вы целитесь вдолгую, первый шаг — это ассессмент и пилот, где mlops-production-ml фундамент закладывается в систему до первой строчки кода. Всё остальное — хайп.