Задача
Маркетплейс с гигантским каталогом: снимать каждый товар в студии — это сроки и бюджет, которые не закрываются никогда. Нужен конвейер, который генерирует и дорабатывает карточные изображения массово: единый фон, набор ракурсов, сцены под бренд-гайд — и держит поток в десятки тысяч в сутки.
Требование — в контуре заказчика: исходники товаров и пайплайн не уезжают во внешние сервисы. Плюс генерация не должна уплывать от бренд-гайда в красивую отсебятину.
Подход
Диффузионный пайплайн развернули on-prem, под бренд-гайд дообучили адаптеры (стиль, фон, композиция) — чтобы выход был предсказуемым и единообразным, а не случайным артом. Геометрию товара держим через conditioning: генерируем сцену вокруг реального предмета, не подменяя сам товар.
Инференс оптимизировали ради потока: батчинг, сниженная точность, дистилляция шагов сэмплинга — стоимость изображения упала в разы. На выходе — автоматическая отбраковка по качеству и соответствию гайду; спорное уходит на ревью человеку, а не в каталог.
Стек
diffusion + LoRA-адаптеры · ControlNet conditioning · step distillation · on-prem GPU · quality gate
Результат
- 38 тыс. товарных изображений в сутки на потоке.
- −82% стоимости изображения против студийной съёмки.
- 94% выхода проходят авто-контроль бренд-гайда без правок.
- Исходники и пайплайн остаются в контуре заказчика.