Обычные трекеры — мусор, который в 2024 году защищает автопарк разве что от слива солярки через шланг. ИИ-телематика и видеоаналитика автопарка: как срезать ДТП, перерасход топлива и износ без замены машин — это не тема для глянцевых питчей, а суровая необходимость в логистике, где маржинальность болтается в зоне статистической погрешности. То, что бизнес привык называть «контролем водителя», опираясь на пики ускорений с CAN-шины, — это проктология пополам с аутопсией. Вы просто получаете график того, как фура за три секунды догнала отбойник.
У вас 20-тонная сцепка. Если водитель смотрит в Telegram три секунды на скорости 90 км/ч, он пролетает 75 метров вслепую. Датчик резкого торможения сработает, когда тапок ударит в пол. Тормозной путь груженой фуры — метров восемьдесят. Физику не обмануть. Нам нужно знать о телефоне в руке до того, как потребуется бить по тормозам.
Для этого внутрь ставят DMS (Driver Monitoring System) — камеру, направленную на лицо. В теории звучит красиво: нейросеть детектит усталость, отвлечение, телефон, непристегнутый ремень. На практике рынок завален коробочными китайскими поделками, которые не работают. Они пищат на всё. Водитель закурил — писк. Почесал ухо — писк. Солнце блеснуло в лобовом — писк. Знаете, что происходит через три дня? Динамик заливают суперклеем. На объектив лепят жвачку. Опускают солнцезащитный козырек так, чтобы перекрыть обзор. Это не «плохие водители», это естественная реакция на кривую инженерию с FPR (False Positive Rate) в районе сорока процентов.
Коробочные решения мертвы, потому что не умеют адаптироваться. Кабина Scania отличается от КАМАЗа. Фокусное расстояние, углы установки, геометрия стекол — всё разное. Модель, обученная на рафинированных датасетах с Kaggle, ломается о реальную жизнь с ее жестким контровым светом, грязью и инфракрасной подсветкой, пробивающейся через сигаретный дым.
Но главная беда — инфраструктура. Менеджеры верят в облака. Но 4G на трассе М11 или где-нибудь под Тюменью — это миф. Связь падает, пакеты теряются. Если ваш ИИ должен отправить кадр на сервер, чтобы понять, спит ли человек, у вас нет ИИ. У вас дорогой кусок пластика на стекле.
Инференс должен жить на борту. Это классический edge. Никакого постоянного интернета. Видеопоток 30 FPS обрабатывается локально. Нам нужен NPU с производительностью 5-6 TOPS, что-то уровня Rockchip RK3588 или Hailo. Модели квантуются до INT8. YOLOv8 для объектов (телефон, сигарета, ремень) и легкий кастомный ResNet для лицевых ориентиров, чтобы считать EAR (Eye Aspect Ratio) — соотношение сторон глаза, по которому мы определяем микросны.
Сам вычислитель — это отдельный пласт боли. Обычный промышленный ПК с кулером умирает в кабине тягача за пару месяцев: пыль забивает вентилятор, дальше перегрев и троттлинг. Нужен fanless-корпус и жесткий контроль теплопакета. NPU молотит два видеопотока непрерывно. Чтобы уложиться в температурный лимит и не спалить плату, тяжелые модели безжалостно прунятся (pruning). Проблема в том, что при слепом квантовании из FP32 в INT8 детекция лиц ночью рассыпается. Спасает только сбор специфичного калибровочного датасета: ночная трасса, лица, подсвеченные исключительно 850 нм инфракрасными диодами, блики от встречных фар. Только прогоняя алгоритмы Post-Training Quantization через эту грязь, мы восстанавливаем точность.
Внешняя камера (ADAS) тем временем смотрит на дорогу. Оценить дистанцию по монокуляру — задача математически некорректная. Размер bounding box'а легковой машины в пикселях не дает точной дистанции до сантиметра. Нейросеть предсказывает класс ТС и, опираясь на внутреннюю матрицу камеры (интринсики), считает Time to Collision (TTC). Мы склеиваем данные с обеих камер с телеметрией CAN-шины.
def process_edge_telemetry(frame_in, frame_out, can_bus, local_db):
can_data = can_bus.poll_latest()
# INT8 инференс на бортовом NPU, задержка ~12мс
faces, objects = dms_model.predict(frame_in)
vehicles = adas_model.predict(frame_out)
ear_score = calculate_eye_aspect_ratio(faces)
ttc = estimate_time_to_collision(vehicles, speed=can_data.speed)
# Детекция саботажа (закрытие камеры) или угрозы
camera_blinded = detect_occlusion(frame_in)
if ear_score < THRESHOLD_MICRO_SLEEP or ttc < THRESHOLD_CRITICAL or camera_blinded:
event = TelemetryEvent(
timestamp=time.time(),
type="CRITICAL_SAFETY",
video_buffer=get_ring_buffer(seconds_before=10, seconds_after=5),
telemetry=can_data
)
# Сбрасываем в SQLite, ждем 4G для асинхронного синка
local_db.store(event)
trigger_haptic_seat_vibration()Обратите внимание на последнюю строку. Никаких мерзких пищалок. Вибромотор в подушке сиденья будит водителя рефлекторно, на уровне спинного мозга, и не бесит его ложными срабатываниями так, как звуковая сирена. Биология работает безотказно.
Все эти игры в компьютерное зрение не имеют смысла, если они не бьются в P&L. Зачем платить за кастомный edge, если можно нанять больше диспетчеров? Потому что человек не может непрерывно смотреть в 500 камер. А перерасход дизеля — это не всегда воровство через врезки в бак. Чаще всего это стиль вождения.
Водитель, который постоянно «висит на хвосте» у легковых машин, вынужден ежеминутно подтормаживать. Груженая фура теряет инерцию. Каждое нажатие на тормоз — это сожженные литры солярки на последующий разгон до крейсерских 85 км/ч. Плюс сломанная аэродинамика: слишком близкая дистанция создает турбулентность. Экономика сходится только тогда, когда вы бьете по первопричине. ИИ-телематика связывает факт резкого торможения (следствие) с фактом опасного сближения (причина).
- Скрытый перерасход топлива: Рваный темп езды из-за залипания в мессенджеры сжигает на 10-15% больше дизеля, чем ровный ход. На автопарк из ста тягачей это миллионы рублей, улетающие в выхлопную трубу каждый год.
- Аварийность и страховые премии: Переход от реактивного разбора ДТП к проактивному (штрафуем за отвлечение ДО удара) режет мелкие инциденты на 60%. Страховая охотнее дает скидки на КАСКО автопарку с доказанной системой предиктивного контроля.
- Износ расходников: Плавное вождение увеличивает ресурс тормозных колодок и элементов трансмиссии в полтора-два раза. Механику не обманешь.
- Контроль режима труда: Тахографы элементарно обманываются чужими карточками. Биометрия лица на борту исключает подмену водителя и защищает от штрафов Ространснадзора за переработки.
Когда мы в Morana Labs раскатываем кастомную edge-видеоаналитику для транспорта — проекты, где стартовый билет за подбор железа, адаптацию моделей и софт начинается от 500 000 рублей, — логисты всегда задают один и тот же вопрос: «А водители не разбегутся?»
Уйдут те, кто генерирует вам убытки. Хронически опасные драйверы, из-за которых машина ложится на бок на зимнике, обнуляя груз на десятки миллионов. Адекватные водители адаптируются за пару недель, при условии, что вы вложились в инженерию и свели ложные срабатывания почти к нулю. Настоящая работа здесь — не скачать веса из опенсорса, а дотюнить сетку на вибрирующей, засвеченной реальности грузовой кабины так, чтобы она уверенно отличала почесывание носа от сна с открытыми глазами.
Телематика прошлого десятилетия мертва. Вы либо переносите инференс на борт и меняете привычки за рулем железобетонными фактами, либо продолжаете списывать разбитые тягачи и жечь лишнее топливо, оплачивая чужую безответственность из своей чистой прибыли.