Около 78% скидок на удержание абонентов достаются тем, кто никуда уходить не собирался. Вы просто берете свою маржу и отдаете ее обратно. Классический пайплайн «предсказать отток → насыпать 30% скидки» — это финансовая катастрофа. Реальный ИИ для удержания абонентов телекома: предсказать уход за недели и не слить маржу на скидки — это задача из области uplift-моделирования и предиктивной аналитики, а не просто бинарная классификация на табличках из биллинга.
ИИ для удержания абонентов телекома: предсказать уход за недели и не слить маржу на скидки
— «У нас давно работает антиотток. Мы смотрим в биллинг: если абонент не платит три недели и за последний месяц дважды звонил в саппорт — он в зоне риска».
Это не предсказание. Это вскрытие.
Когда биллинг показывает нуль на балансе, роутер клиента уже отключен, а в квартиру заведен кабель другого провайдера ШПД. Биллинг — это запаздывающий сигнал. Чтобы предсказывать уход за 3–4 недели, нужны метрики, которые отражают реальный пользовательский опыт (QoE). Сетевая телеметрия.
Падение соотношения upstream/downstream трафика. Резкий рост числа TCP-ретрансмиссий. Джиттер на портах доступа. Скачки пинга до пулов IP-адресов популярных игровых серверов или CDN ОТТ-платформ. Если у абонента каждый вечер сыплется картинка в Netflix или лагает Discord, он уйдёт. Даже если он ещё ни разу не звонил в техподдержку. Предиктивная аналитика начинается там, где модель переваривает логи DPI и метрики с коммутаторов, выявляя деградацию сервиса до того, как клиент осознал свое раздражение.
Скидочный карт-бланш и почему обычный ML убивает маржу
— «Окей, мы скормили дампы DPI, историю тарифов и логи саппорта в LightGBM. Модель нашла 10 000 человек с вероятностью оттока выше 80%. Мы шлём им пуш с предложением полгода платить за полцены. База спасена!»
Вы только что выстрелили себе в EBITDA из дробовика.
Классическая ML-модель предсказывает исключительно вероятность того, что клиент отвалится. Она понятия не имеет, как этот клиент отреагирует на ваши действия. Аудитория в контексте оттока всегда делится на четыре жестких сегмента:
- Persuadables (Склоняемые): Уйдут, если ничего не делать. Останутся, если дать оффер. Наша единственная реальная цель.
- Sure Things (Верные): И так останутся. Дадите им скидку — просто сожжете деньги, понизив их ARPU.
- Lost Causes (Потерянные): Точно уйдут. Скидка не поможет. Возможно, они переезжают в другой город или тотально разочарованы качеством линии.
- Sleeping Dogs (Спящие собаки): Не собирались уходить, пока вы не прислали им SMS: «Останьтесь с нами, вот вам скидка!». В этот момент абонент вспоминает, что интернет-то дороговат, лезет сравнивать тарифы конкурентов и уходит. Ваша кампания спровоцировала отток.
Удержание стоит дороже, чем привлечение. Бьете ковровой бомбардировкой по топ-10% склонных к оттоку — заливаете деньгами Sure Things и будите Sleeping Dogs.
Решение — uplift-моделирование. Мы предсказываем не сам отток, а инкрементальный эффект от воздействия: останется ли абонент, если мы дадим ему оффер, минус вероятность того, что он останется, если мы его не тронем.
import numpy as np
def get_uplift_deciles(model_treatment, model_control, X_infer):
# Оцениваем вероятность оттока при воздействии (дали оффер)
p_churn_treatment = model_treatment.predict_proba(X_infer)[:, 1]
# И вероятность оттока без вмешательства
p_churn_control = model_control.predict_proba(X_infer)[:, 1]
# Uplift: насколько воздействие СНИЖАЕТ вероятность оттока
uplift_score = p_churn_control - p_churn_treatment
# Если uplift_score < 0 — это Sleeping Dog. Не трогаем.
# Если ~ 0 — Sure Thing или Lost Cause. Игнорируем.
# Сортируем базу от максимального положительного эффекта
return np.argsort(uplift_score)[::-1]
Треш-ток с метриками: Churn rate против ROI
— «Но у нашей новой нейросети AUC-ROC 0.94!»
Всем плевать на ваш AUC-ROC, если ROI кампании по удержанию ушел в минус. Главные метрики здесь — это доля впустую розданных скидок и реальный ARPU сохраненной базы через три месяца. Иногда правильный шаг для удержания — это не минус 30% к абонентской плате, а бесплатный выезд мастера для замены старого роутера, который режет Wi-Fi. Или предложение статического IP-адреса. Система должна выдавать NBA (Next Best Action) на основе профиля нагрузки конкретного домохозяйства.
Знать не значит удержать. Железо и 152-ФЗ
— «Звучит логично. Выгружаем данные абонентов в облако, дёргаем API облачной LLM для генерации персонализированных офферов, всё летает».
Нет. Вы телеком.
Телеметрия, DPI, история платежей, мак-адреса устройств абонентов — это чувствительные данные. 152-ФЗ не терпит компромиссов. Никаких публичных облаков и SaaS-решений, где данные покидают периметр оператора связи. Весь пайплайн предиктивной аналитики, от подготовки фичей до инференса тяжелых моделей, обязан крутиться on-premise, на голом железе.
И крутиться быстро.
Паттерны деградации связи возникают спонтанно. Если у вас батчевый инференс раз в неделю — вы опоздали. Выгрузили предсказания в CSV и отдали контакт-центру? Уставший оператор позвонит абоненту, прочитает стандартный скрипт по бумажке и сольет «склоняемого» клиента в категорию «потерянных».
Интеграция решает всё. ИИ должен напрямую дергать системы провижининга и выводить в CRM оператора не абстрактную «вероятность оттока 82%», а жесткую директиву: «У абонента просадки на линии по вечерам из-за зашумленности Wi-Fi канала, предложите гигабитный двухдиапазонный роутер в рассрочку».
У нас в Morana Labs архитектура таких edge-систем всегда строится вокруг uplift и строго внутри контура заказчика. Мы не пытаемся угадать всех, кто уйдёт. Мы ищем тех, кого математически выгодно спасать, и даем бизнесу в руки рычаг управления маржинальностью, а не просто красивые графики падения базы.