ИИ для удержания абонентов телекома: предсказать отток за недели

Около 78% скидок на удержание абонентов достаются тем, кто никуда уходить не собирался. Вы просто берете свою маржу и отдаете ее обратно. Классический пайплайн «предсказать отток → насыпать 30% скидки» — это финансовая катастрофа. Реальный ИИ для удержания абонентов телекома: предсказать уход за недели и не слить маржу на скидки — это задача из области uplift-моделирования и предиктивной аналитики, а не просто бинарная классификация на табличках из биллинга.

ИИ для удержания абонентов телекома: предсказать уход за недели и не слить маржу на скидки

— «У нас давно работает антиотток. Мы смотрим в биллинг: если абонент не платит три недели и за последний месяц дважды звонил в саппорт — он в зоне риска».

Это не предсказание. Это вскрытие.

Когда биллинг показывает нуль на балансе, роутер клиента уже отключен, а в квартиру заведен кабель другого провайдера ШПД. Биллинг — это запаздывающий сигнал. Чтобы предсказывать уход за 3–4 недели, нужны метрики, которые отражают реальный пользовательский опыт (QoE). Сетевая телеметрия.

Падение соотношения upstream/downstream трафика. Резкий рост числа TCP-ретрансмиссий. Джиттер на портах доступа. Скачки пинга до пулов IP-адресов популярных игровых серверов или CDN ОТТ-платформ. Если у абонента каждый вечер сыплется картинка в Netflix или лагает Discord, он уйдет. Даже если он еще ни разу не звонил в техподдержку. Предиктивная аналитика начинается там, где модель переваривает логи DPI и метрики с коммутаторов, выявляя деградацию сервиса до того, как клиент осознал свое раздражение.

Скидочный карт-бланш и почему обычный ML убивает маржу

— «Окей, мы скормили дампы DPI, историю тарифов и логи саппорта в LightGBM. Модель нашла 10 000 человек с вероятностью оттока выше 80%. Мы шлем им пуш с предложением полгода платить за полцены. База спасена!»

Вы только что выстрелили себе в EBITDA из дробовика.

Классическая ML-модель предсказывает исключительно вероятность того, что клиент отвалится. Она понятия не имеет, как этот клиент отреагирует на ваши действия. Аудитория в контексте оттока всегда делится на четыре жестких сегмента:

Persuadables (Склоняемые): Уйдут, если ничего не делать. Останутся, если дать оффер. Наша единственная реальная цель.
Sure Things (Верные): И так останутся. Дадите им скидку — просто сожжете деньги, понизив их ARPU.
Lost Causes (Потерянные): Точно уйдут. Скидка не поможет. Возможно, они переезжают в другой город или тотально разочарованы качеством линии.
Sleeping Dogs (Спящие собаки): Не собирались уходить, пока вы не прислали им SMS: «Останьтесь с нами, вот вам скидка!». В этот момент абонент вспоминает, что интернет-то дороговат, лезет сравнивать тарифы конкурентов и уходит. Ваша кампания спровоцировала отток.

Удержание стоит дороже, чем привлечение. Бьете ковровой бомбардировкой по топ-10% склонных к оттоку — заливаете деньгами Sure Things и будите Sleeping Dogs.

Решение — uplift-моделирование. Мы предсказываем не сам отток, а инкрементальный эффект от воздействия: останется ли абонент, если мы дадим ему оффер, минус вероятность того, что он останется, если мы его не тронем.

import numpy as np

def get_uplift_deciles(model_treatment, model_control, X_infer):
    # Оцениваем вероятность оттока при воздействии (дали оффер)
    p_churn_treatment = model_treatment.predict_proba(X_infer)[:, 1]
    
    # И вероятность оттока без вмешательства
    p_churn_control = model_control.predict_proba(X_infer)[:, 1]
    
    # Uplift: насколько воздействие СНИЖАЕТ вероятность оттока
    uplift_score = p_churn_control - p_churn_treatment
    
    # Если uplift_score < 0 — это Sleeping Dog. Не трогаем.
    # Если ~ 0 — Sure Thing или Lost Cause. Игнорируем.
    # Сортируем базу от максимального положительного эффекта
    return np.argsort(uplift_score)[::-1]

Треш-ток с метриками: Churn rate против ROI

— «Но у нашей новой нейросети AUC-ROC 0.94!»

Всем плевать на ваш AUC-ROC, если ROI кампании по удержанию ушел в минус. Главные метрики здесь — это доля впустую розданных скидок и реальный ARPU сохраненной базы через три месяца. Иногда правильный шаг для удержания — это не минус 30% к абонентской плате, а бесплатный выезд мастера для замены старого роутера, который режет Wi-Fi. Или предложение статического IP-адреса. Система должна выдавать NBA (Next Best Action) на основе профиля нагрузки конкретного домохозяйства.

Знать не значит удержать. Железо и 152-ФЗ

— «Звучит логично. Выгружаем данные абонентов в облако, дергаем API облачной LLM для генерации персонализированных офферов, все летает».

Нет. Вы телеком.

Телеметрия, DPI, история платежей, мак-адреса устройств абонентов — это чувствительные данные. 152-ФЗ не терпит компромиссов. Никаких публичных облаков и SaaS-решений, где данные покидают периметр оператора связи. Весь пайплайн предиктивной аналитики, от подготовки фичей до инференса тяжелых моделей, обязан крутиться on-premise, на голом железе.

И крутиться быстро.

Паттерны деградации связи возникают спонтанно. Если у вас батчевый инференс раз в неделю — вы опоздали. Выгрузили предсказания в CSV и отдали контакт-центру? Уставший оператор позвонит абоненту, прочитает стандартный скрипт по бумажке и сольет «склоняемого» клиента в категорию «потерянных».

Интеграция решает все. ИИ должен напрямую дергать системы провижининга и выводить в CRM оператора не абстрактную «вероятность оттока 82%», а жесткую директиву: «У абонента просадки на линии по вечерам из-за зашумленности Wi-Fi канала, предложите гигабитный двухдиапазонный роутер в рассрочку».

У нас в MoranaLabs архитектура таких edge-систем всегда строится вокруг uplift и строго внутри контура заказчика. Мы не пытаемся угадать всех, кто уйдет. Мы ищем тех, кого математически выгодно спасать, и даем бизнесу в руки рычаг управления маржинальностью, а не просто красивые графики падения базы.

ИИ для удержания абонентов телекома: предсказать уход за недели и не слить маржу на скидки

ИИ для удержания абонентов телекома: предсказать уход за недели и не слить маржу на скидки

Скидочный карт-бланш и почему обычный ML убивает маржу

Треш-ток с метриками: Churn rate против ROI

Знать не значит удержать. Железо и 152-ФЗ

Новые статьи — на почту

Edge AI или облако: когда тащить нейросеть на железо

СБИС, Диадок, Контур или своя модель: чем отличается распознавание первички

Сколько стоит распознавание документов в 1С: считаем на 3000 накладных в месяц

Распознавание первичных документов в 1С: как перестать вбивать накладные руками

Опишите задачу — ответим как инженеры.