Качество рекламного трафика в Казахстане: как BYYD использует ИИ для борьбы с фродом

67

08.06.2026

BYYD разработала антифрод-систему с применением ИИ. Рассказываем, как она работает в Казахстане и какой результат дает.

Интернетом в Казахстане пользуются 19,5 млн человек, а уровень его проникновения составляет 93,4%. При этом мобильная среда остается одной из ключевых точек контакта с аудиторией: в стране насчитывается 27,3 млн мобильных подключений.

На фоне роста цифрового потребления увеличивается и конкуренция за внимание пользователя. Для брендов это означает, что digital-реклама становится не просто каналом охвата, а важным инструментом привлечения трафика.

Но чем активнее растет рынок, тем выше требования к прозрачности закупки и качеству рекламных контактов. По глобальной статистике, 8,51% всех платных рекламных кликов относятся к невалидному трафику. Это эквивалентно примерно $63 млрд потерь рекламных бюджетов. 

Современный фрод — это уже не только простые боты или случайные клики. Мошеннические схемы становятся сложнее: имитируют поведение реальных пользователей, генерируют показы, клики и даже базовые конверсии. В результате рекламодатель может видеть формально хорошие метрики, но не получать реального роста аудитории.

Поэтому для рынка Казахстана, где digital и mobile уже стали массовыми каналами коммуникации, контроль качества трафика становится критически важным. Мобильная платформа BYYD использует AI-антифрод-систему, которая помогает выявлять подозрительную активность, фильтровать невалидный трафик и повышать эффективность рекламных инвестиций.

Рассказываем, как это работает и приводим аналитику.

Интеллектуальная система защиты рекламного трафика

BYYD AI Антифрод — это комплексная система защиты рекламных кампаний от фрода. Построена на собственной модели машинного обучения. Она обрабатывает более 1,5 миллиардов аукционных запросов (bid request) в сутки.

Что делает платформа в режиме реального времени:

  • Анализирует входящий трафик
  • Формирует цифровой профиль пользователя (fingerprint)
  • Принимает решение об участии в аукционе всего за ~0,4 миллисекунды (с момента получения bid request до решения)

На текущий момент архитектура развернута на выделенном сервере антифрода — 48 CPU / 256 GB RAM. На каждом сервере с биддером (участником аукциона по покупке рекламных показов) запущен процесс антифрод-сервиса, потребляющий ~2 CPU.

Таким образом, система эффективно масштабируется и практически не влияет на производительность основного биддера (участника аукциона).

Архитектура системы

1. Машинное обучение в реальном времени

ML-модель (модель машинного обучения CatBoost) обрабатывает массив данных с широким спектром поведенческих характеристик трафика. Обучение проводится на реальных данных пользовательской активности. Датасет (набор данных) формируется так, чтобы включать максимальное разнообразие паттернов — как относящихся к фроду, так и легитимных.

После завершения обучения модель выводится в рабочую среду, где в режиме реального времени:

  • Обрабатывает каждый входящий запрос
  • Рассчитывает необходимые поведенческие и технические признаки
  • Присваивает запросу числовой показатель — fraud score, который принимает значение в диапазоне от 0 до 1. Порог может быть адаптирован в зависимости от требуемого баланса между агрессивностью фильтрации и сохранением охвата

Метрики качества модели

Чтобы оценить эффективность, используются ключевые метрики бинарной классификации: precision (точность) и recall (полнота).

– Precision (точность). Отражает долю корректных срабатываний среди всех случаев, когда модель классифицировала трафик как фрод.

Формула: Precision (точность) = TP / (TP + FP), где:

  • TP (True Positive) — корректно выявленный фрод
  • FP (False Positive) — легитимный трафик, ошибочно классифицированный как фрод

— Recall (полнота). Отражает долю обнаруженного фрода от общего объема фактически невалидного трафика.

Формула: Recall (полнота) = TP / (TP + FN), где:

  • TP (True Positive) — корректно выявленный фрод
  • FN (False Negative) — фрод, который модель не обнаружила

Текущие показатели модели при оффлайн валидации

  • Precision (точность) = 0.92
  • Recall (полнота) = 0.95

Это означает, что система выявляет 95% фродового трафика, при этом сохраняет высокую точность классификации и минимизирует ошибочные блокировки легитимных пользователей.

2. Fingerprint: цифровой профиль пользователя

По каждому пользователю формируется уникальный fingerprint – его цифровой профиль.

Если идентификатор устройства Device ID присутствует, профиль привязывается к нему (IFA/GAID).

Если отсутствует, создаётся уникальный платформенный ID на основе совокупности параметров. Некоторые из них:

  • device_ip
  • device_make
  • device_model
  • device_os
  • device_osv
  • device_ua_core

Таким образом система может вероятностно идентифицировать устройство даже при отсутствии рекламного идентификатора.

3. Работа с динамичными изменениями

В реальной среде пользователи часто:

  • Меняют IP (динамические сети)
  • Получают обновления ОС
  • Меняют User-Agent (информация о пользователе, которую отправляет браузер или приложение на сервер при запросе веб-страницы)
  • Используют мобильный и проводной интернет поочередно

Если создается новый цифровой профиль (fingerprint), например, из-за смены IP или UA, показ будет возможен только после повторной проверки — во втором и последующих аукционах с теми же параметрами.

Это позволяет:

  • Корректно объединять одного пользователя
  • Минимизировать false positive (легитимный трафик, ошибочно классифицированный как фрод)
  • Эффективно бороться с попытками маскировки фрод-трафика

4. Базовые фильтры трафика

Перед оценкой с использованием машинного обучения система применяет базовую фильтрацию:

  • Список заблокированных доменов
  • Домены из API запрещённых ресурсов РКН
  • IP-адреса всех известных облачных сервисов
  • Известные прокси и дата-центры

Это позволяет отсекать очевидный фрод ещё до сложной аналитики.

Как проводится поведенческая и техническая оценка: 20+ параметров

После первичной фильтрации каждый аукционный запрос (bid request) проходит многоуровневую оценку по более чем 20 параметрам. 

1. Размер устройства и рекламного окна

Минимальная высота или ширина рекламного блока должна превышать установленный порог (X пикселей). Это отсеивает невидимые или технические размещения.

2. Наличие оператора при сотовом соединении

Отсутствие корректных данных об операторе — потенциальный индикатор аномального трафика.

3. Корректность User-Agent –  идентификационной строки клиентского приложения

Проверяется:

  • Минимальная длина
  • Соответствие модели устройства
  • Совпадение с ОС
  • Согласованность данных аукционного запроса (bid request)

4. VPN и прокси-трафик

Блокировка осуществляется по:

  • Информации о сети
  • Названию приложения
  • По идентификатору приложения в системе (bundle name)
  • Сигнатурам (характеристикам) VPN-сервисов

5. Средняя пауза между запросами

Анализируется интервал между аукционным запросом (bid request) от одного цифрового профиля (fingerprint). Слишком частые или слишком регулярные интервалы — маркер автоматизированного поведения.

6. Максимальное количество запросов

При превышении установленного лимита цифровой профиль блокируется на уровне системы с возможностью пересмотра при изменении поведенческого профиля.

7. Изменение IFA/GAID

Резкая смена рекламного идентификатора внутри одного диджитал-профиля — признак манипуляции.

8. Рывки активности (burst detection)

Сравнивается количество запросов от одного профиля с медианой по аналогичным устройствам в том же идентификаторе приложения (bundle name). Резкие отклонения сигнализируют о бот-поведении.

Cкриншоты статистики реальных рекламных кампаний

Эффективность кампании в сегменте ритейла демонстрирует высокий уровень качества рекламного трафика. Показатель Viewable Rate на уровне 96% значительно превышает рыночные бенчмарки, что говорит о высокой видимости рекламных размещений. При этом доля невалидного трафика составила всего 0,03%, а показы вне целевой географии не были зафиксированы. Это подтверждает точность таргетинга и эффективность механизмов предотвращения фрода. 

FMCG-кампания также показала высокий уровень качества рекламного трафика. Viewable Rate составил 94%, что говорит о высокой видимости размещений и превышает стандартные рыночные ожидания. Кроме того, общий уровень невалидного трафика IVT составил всего 0,06%, что является приемлемым показателем для масштабных рекламных кампаний с учетом размера аудитории.

Дополнительно не было зафиксировано показов вне целевой географии — 0,00%. 

Результаты верификации FMCG-кампании с использованием трекера DoubleVerify демонстрируют высокий уровень качества размещений. 96% показов были видимыми, а доля показов без сложного невалидного трафика SIVT превышает 99%, что указывает на практически полное отсутствие фрода.

Кроме того, более 99% показов были доставлены в рамках целевой географии и соответствовали требованиям Brand Suitability. Это подтверждает корректную настройку кампании и размещение рекламы в brand-safe среде.

Ключевые преимущества BYYD AI Антифрод

  • Обработка 1+ млрд запросов в сутки
  • Постоянно дообучаемая модель
  • Решение в реальном времени без потери аукционной скорости
  • Устойчивый цифровой профиль (fingerprint) даже без идентификатора устройства (Device ID)
  • Поведенческий анализ, а не только статические фильтры
  • Гибкая система блокировок и перманентных ограничений

BYYD AI Антифрод — это не просто набор фильтров, а интеллектуальная система динамической оценки трафика. Она способна выявлять сложные схемы фрода в режиме реального времени.

Благодаря сочетанию аналитики модели машинного обучения, поведенческих паттернов и строгих технических критериев, система обеспечивает максимальную прозрачность и качество рекламных кампаний в Казахстане.