Пару лет назад мы залили тысячу фотографий убитых «вторичек» в сырой пайплайн на базе Stable Diffusion, чтобы сделать красивые интерьеры. Нейросеть превратила чугунные батареи в спящих лабрадоров, а несущую стену — в панорамное окно. Заказчик получил иск за недостоверную рекламу.
Сегодня генеративный ИИ в недвижимости: виртуальная меблировка и ремонт квартиры на фото для ускорения продаж — это жёсткий промышленный конвейер. Он вытаскивает конверсию из мёртвого бетона и экономит миллионы на физическом стейджинге.
Голые коробки новостроек и вторичка с оборванными обоями продаются отвратительно. Покупатель не мыслит квадратными метрами. Он мыслит сценариями жизни. Видя пустую комнату, человек банально не может понять, встанет ли сюда двуспальная кровать и шкаф. Физика восприятия играет против пустых пространств: без мебели комнаты всегда кажутся визуально меньше своих реальных размеров.
Сравнивать решения будем в лоб. Профиль нагрузки — федеральный классифайд или крупное агентство недвижимости: от 10 000 до 50 000 новых листингов в сутки, асинхронная очередь, жёсткий лимит времени на обработку одной карточки.
Подход А: Физический стейджинг и ручной 3D-рендер
Классика жанра. Логистический ад.
Физический стейджинг требует привезти реальную мебель, собрать её, нанять интерьерного фотографа, выставить свет, отснять, а потом разобрать и увезти всё обратно на склад. Смета стартует от сотен тысяч рублей на один объект. Цикл занимает недели. Это работает для элитного жилья, но абсолютно немасштабируемо на масс-маркет.
Ручной 3D-рендер пытается решить проблему логистики. Вы отдаёте фотографии и обмеры 3D-артистам. Они поднимают геометрию в 3ds Max или Blender, настраивают материалы, рендерят в V-Ray. Стоимость — 200–500 долларов за комнату. Время — от двух до пяти дней. Процесс сопровождается бесконечными итерациями правок: «сделайте диван чуть светлее», «уберите этот цветок». Когда в вашу систему ежедневно падают тысячи новых объектов, этот подход ломается мгновенно. Вам потребуется армия фрилансеров, которая утонет в согласованиях.
Классика не держит масштаб. Физика проигрывает.
Подход Б: Автоматизированный генеративный пайплайн
Здесь начинается инженерия. Мы не используем коробочные API вроде Midjourney или DALL-E. Они генерируют потрясающе красивые картинки, но абсолютно неуправляемы. Коробочная нейросеть снесёт вам несущую колонну ради эстетики кадра или превратит окно в картину.
Нам нужна строгая геометрия и предсказуемость. Базой выступает связка Stable Diffusion и архитектуры ControlNet. Когда мы в Morana Labs собирали инференс-кластер для одного крупного застройщика, именно автоматическое удержание пропорций и генерация масок стали главным узким горлышком пайплайна.
Анатомия конвейера выглядит так:
- Сегментация (SAM 2 / Mask2Former): Исходное фото прогоняется через модель сегментации. Мы автоматически вырезаем весь строительный мусор, старую мебель и бабушкины ковры, оставляя только голые стены, пол и потолок. Модель формирует точную инпейнт-маску.
- Захват геометрии (ControlNet MLSD + Depth): MLSD находит все прямые линии, углы, дверные косяки и плинтуса. Depth-модель строит карту глубины. Эта связка цементирует перспективу. Дверной проём жёстко фиксируется и не превратится в шкаф.
- Генерация (Stable Diffusion + LoRA): Диффузионная модель заполняет вырезанные участки новой мебелью и отделкой, строго опираясь на силовой каркас от ControlNet. LoRA-модули отвечают за целевой стиль: сканди, джапанди, лофт или минимализм.
Инференс такого пайплайна на одной видеокарте серверного класса (уровня NVIDIA L40s или A10g) занимает 4–6 секунд. Стоимость генерации падает до долей цента. Масштабирование решается добавлением узлов в Kubernetes-кластере и настройкой динамического батчинга (Dynamic Batching) через TensorRT, где инференс-сервер пакует по 16–32 изображения в один проход.
Разница между подходами катастрофическая. Дни против секунд. Сотни долларов против центов.
Сухие метрики: конверсия, CTR и время на карточке
Бизнесу не нужны красивые рендеры сами по себе. Бизнесу нужны метрики. Внедрение генеративной меблировки мощно бьёт по всей воронке Middle of the Funnel (MOFU).
Кликабельность (CTR) карточки объекта в общей выдаче классифайда вырастает на 40–60%. В бесконечной ленте одинаковых бетонных коробок глаз пользователя цепляется за уютный светлый интерьер. Алгоритмы площадок мгновенно считывают этот поведенческий паттерн и поднимают объявление выше в органической выдаче.
Время, проведённое на карточке, увеличивается в 2.5 раза. Секрет в UI: мы добавляем интерактивный ползунок «до/после». Пользователь залипает, переключая состояния квартиры из убитой вторички в неоклассику и обратно. Это чистый дофамин. Человек начинает мысленно примерять этот интерьер на себя.
Скорость подготовки объявления сокращается колоссально. Брокер фотографирует квартиру на телефон, загружает снимки в CRM, и через 15 секунд получает сет готовых интерьеров в трёх разных стилях. Объявление уходит в публикацию быстрее, чем брокер спустится на лифте на первый этаж.
Конверсия в офлайн-показ растёт. Клиент приходит на просмотр пустой квартиры, но в его голове уже стоит тот самый виртуальный диван. Возражение «тут как-то тесно» снимается ещё до его озвучивания, потому что ИИ уже доказал обратное.
Цифры не врут. Конвейер окупает железо за первые недели работы.
Честный трейд-офф: галлюцинации и правовые риски
Идеальных систем не существует. У генеративного пайплайна есть свои пределы прочности, о которых нужно знать до выкатки в продакшен.
Сложная геометрия ломает логику. Если у вас квартира с мансардной крышей, полукруглыми эркерами и нестандартными углами, MLSD начнёт сбоить. Алгоритм Хафа, лежащий в основе детекции линий, плохо переваривает кривые. Модель может дорисовать лишний прямой угол там, где стена плавно изгибается, или выпрямить арочное окно. Зеркала и сильные отражения на глянцевом полу ломают карту глубины (Depth). Это требует фоллбэка на ручную модерацию или использования альтернативных экстракторов признаков вроде Canny, которые более чувствительны к шуму.
Брендовая идентичность требует кастомного дообучения. Базовая модель знает, как выглядит абстрактный диван. Но она понятия не имеет, как выглядит конкретная модульная система из каталога мебельной фабрики, с которой у застройщика эксклюзивное партнёрство. Чтобы расставлять реальную мебель, придётся собирать датасет из 3D-моделей, рендерить их с разных ракурсов и обучать кастомные веса (LoRA). Это отдельный engineering overhead.
Но главный капкан — это пользовательский опыт и юридическая чистота.
Не обманывайте покупателя. Это золотое правило стейджинга.
Если вы выставите генеративные интерьеры под видом реального состояния квартиры, вы получите лавину негатива на офлайн-показах и судебные иски за введение в заблуждение. Покупатель придёт в бетонную коробку, ожидая увидеть готовый ремонт. На каждом сгенерированном изображении должен стоять крупный, неудаляемый водяной знак: «Виртуальная визуализация» или «Возможный вариант отделки». В интерфейсе карточки обязательно должен быть очевидный доступ к оригинальным фотографиям.
Генеративная сеть продаёт потенциал помещения, а не подменяет реальность. Те площадки, которые первыми автоматизируют этот процесс, заберут весь трафик у тех, кто продолжает публиковать унылые фотографии голых стен.