Оставьте имя и Telegram — остальное обсудим. Без брифов на 40 слайдов и звонков по три раза.
Сухо: задача, подход, стек, результат в числах. Без маркетингового шума.
Трекинг всех игроков и мяча по связке из 12 камер в прямом эфире: единая калибровка, сшивка ракурсов, графика поверх трансляции в пределах broadcast-задержки. Авто-хайлайты без оператора.
Семантический поиск по миллиардам эмбеддингов: одноузловой ANN упёрся и в память, и в latency. Распределённый индекс держит 3.4 млрд векторов с p99 в единицы миллисекунд и recall@10 около 96%.
Конвейер генерации и доработки карточных изображений на диффузии в контуре заказчика: единый фон, ракурсы, сцены под бренд-гайд. Десятки тысяч изображений в сутки без фотостудии на каждый SKU.
Локальный ассистент по тысячам внутренних регламентов и спеков. Отвечает строго со ссылкой на источник, отказывается, если основания в базе нет. Весь инференс on-prem — ни один токен не уходит наружу.
Онлайн-ранкинг витрины маркетплейса под пиковую нагрузку распродаж. Прежний стек ложился на пиках и показывал вчерашние рекомендации. Держим больше миллиона запросов в секунду с p99 около 8 мс.
Автоматический контроль касок и сигнальных жилетов по существующим IP-камерам стройплощадки. Инференс на edge-узле прямо на объекте, видео не покидает периметр. Ложные срабатывания снижены на 74%, алерт бригадиру за 0.8 с, 16 камер на узел.
Предобучение большой визуальной модели на кластере из 512 GPU. Наивный data-parallel упирался в коммуникации и падал на сбоях узлов. Свели цикл с недель к дням при линейном масштабировании.
Сегментация находок и приоритизация очереди КТ: критичные исследования всплывают первыми, рутина приходит к врачу с предразметкой. Всё on-prem — медданные не покидают контур больницы. Решение остаётся за врачом.
Потоковый ASR разговоров контакт-центра в реальном времени: подсказки оператору и контроль качества. Записи нельзя в облако (банковская тайна, 152-ФЗ) — развернули на собственной GPU-ноде. RTF 0.18, 40 параллельных каналов на ноду, ноль данных за периметром.
Обезличенная аналитика трафика для сети офлайн-магазинов: вход/выход, тепловые карты зон, длина очереди — без распознавания лиц. Весь инференс на дешёвом edge-узле в каждой точке, наружу уходят только агрегаты.
Детекция и сопровождение целей по тепловизору на edge-узле без облака. 48 камер на узел, стабильное реальное время.
Скоринг фрода прямо в платёжном потоке за десятки миллисекунд: миллионы транзакций в сутки, графовые признаки, онлайн-модель. Потери от фрода вдвое ниже, живых клиентов блокируем заметно реже.
БПЛА облетает поля и инфраструктуру, детекция очагов и повреждений идёт на борту. Квантованная INT8-модель на бортовом ускорителе уложилась в 3.8 Вт, термоконтроль в герметичном корпусе держит частоту, на землю уходят только находки — это дало +27% времени полёта.
Флот автономных мобильных роботов на складе: восприятие и объезд препятствий на борту, маршрутизация и развязка трафика — централизованно. Люди и погрузчики в общих проходах, без выделенных зон.
Адаптивный агент вместо каскада ПИД-регуляторов. Симуляция с доменной рандомизацией, перенос на реальное оборудование.
Пайплайн перевода живой речи речь→перевод→синтез с малой задержкой: спикер говорит — зал и стрим слышат перевод почти сразу, на восьми языках одновременно, без живого синхрониста.
Парк станков и насосов: ловим деградацию подшипников и дисбаланс по вибрации и акустике на edge-контроллере у станка. Наружу уходят только события, не сырой поток. Учились на норме — размеченных аварий почти нет.
Длинные последовательности там, где трансформер упирался в квадратичную сложность. Линейная сложность SSM + оптимизация инференса.
Автоматическое выявление изменений на спутниковых и аэроснимках: новая застройка, вырубки, разливы, подтопления. Регион размером с небольшую страну обрабатывается за сутки, находки — на карту с приоритетом.
Ежедневный прогноз спроса по сотням тысяч пар SKU×магазин с учётом промо и сезонности. Прежняя система считала медленно и грубо — отсюда дефицит и списания. Дефицит и излишки вместе срезали больше чем на четверть.
Визуальный контроль поверхности на скоростной линии: камера высокого разрешения, управляемая подсветка, инференс синхронно с тактом. Детерминированная задержка, recall 99.4% при удержании false-positive на 0.6%, отбраковка без участия оператора.
Пайплайн CV+OCR для бэк-офиса банка: восстановление геометрии скана, детекция таблиц, распознавание и извлечение полей с валидацией по справочникам. On-prem, без выноса персданных. Точность по ключевым полям 97.3%, 71% документов проходят без ручной доводки.
Детекция падений и опасных поз по скелету человека в пансионатах и производственных зонах. Без распознавания лиц и биометрии, видео не покидает периметр. Алерт персоналу за 1.4 секунды, recall по падениям 97.8%, около 0.7 ложных тревог в сутки на узел.
Переиндексация петабайтного видеоархива: детекция сцен, объекты, теги, дедуп. Прежний наивный прогон стоил как чугунный мост. Распределённый конвейер на спотах перемолол 4.8 ПБ и срезал цену часа обработки в разы.