Стратегия антифрода: почему нельзя обучать AI-модели на всем трафике Google Display Network
Ключевые факты
- 1 Трафик GDN содержит слишком много шума и мошеннических паттернов.
- 2 Обучение антифрод-моделей на всей GDN приводит к ошибочному принятию фрода за норму.
- 3 Необходимо использовать только "трастовые паблишеры" (например, Google Search) для обучения ИИ.
- 4 Это позволяет ИИ создать "золотой стандарт" человеческого поведения для точной фильтрации трафика.
Google Display Network (GDN) является источником большого объема некачественного и мошеннического трафика. Обучение моделей машинного обучения для обнаружения фрода на таком "зашумленном" массиве данных приводит к тому, что ИИ начинает принимать мошеннические паттерны за норму, снижая точность фильтрации. Это явление называется "отравлением" модели. Решение состоит в изоляции "трастовых паблишеров" — источников, которые гарантированно приносят реальные конверсии (например, Google Search). Обучение модели на этом "золотом стандарте" человеческого поведения позволяет ИИ точно определить, как выглядит чистый трафик, и с высокой точностью отсеивать аномалии и мошенничество во всем остальном потоке.