Opis metodologii Anty Fraud DOM

Specyfikacja Techniczna Rozwiązania • TrafficWatchDog

Opis funkcjonalności TwD
Opis funkcjonalności TwD
Architektura techniczna
Działanie kodów TwD
Implementacja techniczna
Wpływ na stronę
Bezpieczeństwo IT
Kategorie parametrów
Parametry – Benchmark
Metodyka audytu kliknięć
Raportowanie i klasyfikacja
Pliki do pobrania

1. System TrafficWatchDog (TwD) – opis realizowanych funkcjonalności

TrafficWatchDog (TwD) – system działający w zakresie wykrywania oszustw oraz nadużyć marketingowych online/mobile dla form reklamowych typu: KLIK oraz LEAD. TwD zbiera i analizuje parametry klika i/lub leada (dane bezosobowe) z poszczególnych płatnych źródeł i na podstawie zebranych parametrów dokonuje oceny klika/leada:

  • CLICK Scanner – identyfikacja 'nieprawidłowych klików' zgodnie ze standardami IAB - Interactive Advertising Bureau Click Measurement Guidelines:
    "Invalid Clicks arising from suspected “click fraud” are a sub-component of Invalid Clicks and originate from a user, program or automated agent (e.g., Internet robot or spider) that accesses a URL for the purpose of manipulating click measurement activity or click-based advertising payments, having no intention of legitimately browsing site content, making a purchase or performing any other type of legitimate conversion action. Suspected click fraud can arise from both human-initiated and application-initiated automated activity; also, suspected click fraud can arise from invalid Ad Impression activity. Click Fraud also includes situations where a user is unwillingly, or tricked into, accessing information(for example, user “virus” infected activity, or auto-clicking functions)."
  • GOOGLE ADS Scanner – identyfikacja 'nieprawidłowych klików' w kampanii Google Ads, zgodnie ze standardami IAB.

    System Google Ads Scanner - dodatkowo pozwala automatycznie blokować wyklikiwanie reklam Google Ads Klienta przez tych samych użytkowników oraz blokować nieprawidłowe kliki w kampaniach Google Ads Klienta.

  • LEAD Scanner – identyfikacja ‘nieprawidłowych leadów’ zgodnie ze standardami IAB - Interactive Advertising Bureau Online Lead Generation:
    "Lead fraud occurs when leads are submitted with malicious intent or simply for financial gain. These leads should be deemed invalid, and advertisers and agencies should not pay for these leads. Although uncommon, there have been cases when offers are filled out by an artificial, automated system to generate a large quantity of leads. Consumers or companies may also fraudulently fill out offers."

Główne realizowane funkcjonalności:

  • Pełny monitoring 24/7 wszystkich źródeł dostarczających płatne kliki/leady dla Klienta.
  • Automatyczna analiza reklam i klików w Google Ads.
  • Wykrywanie i analiza urządzenia użytkownika – na podstawie tzw. wirtualnego odcisku urządzenia (DEVICE FINGERPRINT).
  • Identyfikacja kraju pochodzenia klika/leada i dostawców IP.
  • Automatyczne blokowanie wyklikiwania reklam w Google Ads przez podejrzane/fraudowe adresy IP.
  • Automatyczne blokowanie wyklikiwania reklam w Google Ads przez podejrzane/fraudowe urządzenia (identyfikacja DEVICE FINGERPRINT).
  • Automatyczne blokowanie wyklikiwania reklam w Google Ads przez podejrzane/fraudowe ‘cookie’.
  • Możliwość ustawienia i dopasowania indywidualnych reguł automatycznego blokowania wyklikiwania kampanii Google Ads.
  • Raporty reklamacyjne nieprawidłowych klików oraz leadów dla źródeł dostarczających płatne kliki/leady.
  • Raport reklamacyjny nieprawidłowych klików dla Google Ads.
  • Cykliczne raporty wysyłane na wskazany adres e-mail.
  • Informacje szczegółowe dla każdego zweryfikowanego klika/leada – w tym analiza zachowania potencjalnego użytkownika/bota na monitorowanej stronie.
  • Dostęp online do Panelu Klienta.

2. Architektura techniczna rozwiązania TwD

System składa się z następujących komponentów:

  • Skrypt trackingowy TwD – aplikacja odpowiedzialna za zbieranie parametrów służących ocenie w zakresie klików/leadów.
  • Webservice – aplikacja instalowana na serwerze TwD, do której będą przesyłane dane zebrane przez skrypt.
  • Baza danych
  • Serwer
  • AI - sieć neuronowa dokonująca analizy danych.
  • Panel Klienta – front-end Klienta prezentujący wyniki działania systemu TwD.

3. Sposób działania kodów TwD

Działanie dedykowanych kodów trackingowych jest dopasowane do struktury docelowej monitorowanej strony www Klienta - na której implementowane są przygotowane odpowiednie fragmenty kodów HTML zawierające skrypty Javascript oraz pixele, które optymalnie, jeżeli umieszczone będą we wskazanych miejscach docelowych monitorowanego serwisu – bezpośrednio w kodzie monitorowanej strony (tzw. ‘body’ strony). Skrypty are wykonywane tylko i wyłącznie po stronie usera w jego przeglądarce.

Implementacja przygotowanego kodu trackingowego Javascript/pixeli na docelowej monitorowanej stronie Klienta, może odbywać się również poprzez system GTM (Google Tag Manager). Skrypty are wykonywane tylko i wyłącznie po stronie usera w jego przeglądarce. W przypadku implementacji kodów TwD za pomocą GTM - wczytanie kodów TwD będzie uzależnione od obsługi przez przeglądarkę usera GTMa (niektóre wersje przeglądarek - blokują GTMa). Może to oznaczać 'straty' w zakresie liczby monitorowanych klików/leadów.

Skrypty i elementy kodu TwD uruchamiają się w trakcie ładowania strony www. Działają również w tle, w trakcie pracy usera na stronie www korzystając z obsługi zdarzeń, generowanych przez elementy strony www. Dane wysyłane przy wysyłaniu wypełnionego formularza (lead) metodą POST lub metodą GET w przypadku zamieszczenia obrazka na stronie.

Dane przesyłane są na docelowy serwer, gdzie poddawane są analizie. Wyniki analizy are dostępne w dedykowanym panelu Klienta serwisu TrafficWatchDog.

4. Techniczna implementacja kodów TwD

Na proces wdrożenia i architekturę systemową składają się poniższe elementy:

Po stronie TrafficWatchDog:

  • Dewelopment docelowego kodu TwD (pliku Javascript/pixele) - odpowiedzialnego za zbieranie danych, dopasowanego do specyfikacji monitorowanej strony www.
  • Webservice – uruchomienie aplikacji instalowanej na serwerze TrafficWatchDog, do której będą przesyłane za pomocą protokołu HTTPS zebrane informacje przez kod TwD.
  • Serwer – zapis zebranych parametrów oceny.
  • Sieć neuronowa - kalibracja modelu i algorytmów analizy danych i oceny rekordów.
  • Wystawienie dedykowanego panelu Klienta - w którym można analizować w trybie online wyniki analizy/tworzyć raporty reklamacyjne.

Po stronie Klienta (właściciela monitorowanej strony):

  • Wklejenie dedykowanego kodu TwD (Javascript/pixele) na docelową stronę www.
  • Do decyzji Klienta pozostaje, na które serwisy zostanie zaimplementowany kod TwD - kod może zostać umieszczony tylko i wyłącznie na wybranych stronach/tzw. landing page'ach (mikro-witrynach marketingowych). Strony traktowane specjalnie ze względów bezpieczeństwa, takie jak panel administracyjny Klienta, strony zakupowe lub transakcyjne mogą być wyłączone z analizy (brak wpiętych kodów TwD).
  • W zależności od decyzji Klienta – korzystanie ze skryptu JavaScript znajdującego się na serwerze TrafficWatchDog lub umieszczenie pliku Javascript na własnym serwerze monitorowanej strony.

5. Wpływ kodów TwD na architekturę monitorowanej strony docelowej

Zaimplementowane kody TwD nie mają wpływu na architekturę docelowej monitorowanej strony www. Skrypty JavaScript/pixele are wykonywane tylko i wyłącznie po stronie użytkownika w jego przeglądarce. Brak wpływu na User Experience w zakresie szybkości ładowania strony (weryfikowane testami w narzędziu Lighthouse).

Zamieszczone skrypty w żaden sposób nie mają wpływu na ścieżkę logowania do systemów transakcyjnych Klienta ani procesy autoryzacyjne.

6. IT Security

Zamieszczone kody TwD na docelowej stronie www Klienta zbierają parametry generowane podczas korzystania ze strony www. Należy zaznaczyć, że dane are zbierane anonimowo – nie jest możliwe skojarzenie ich z konkretną osobą fizyczną po stronie dostawcy aplikacji TwD.

Wszelkie dane are przekazywane i przechowywane na wewnętrznych serwerach TwD – stosowane are wielopoziomowe zabezpieczenia. Między uruchomionym skryptem w przeglądarce użytkownika a serwerem zbierającym dane, komunikacja odbywa się szyfrowanym kanałem HTTPS (SSL/TLS 1.2 z 2048-bitowym kluczem). Następnie dane are przetwarzane na serwerze aplikacyjnym, który jako jedyny ma bezpośrednie połączenie z publiczną siecią Internet. Jest on zabezpieczony firewallem Stateful Packet Inspection (SPI) z systemem Login/Intrusion Detection i zabezpieczeniem przed atakami typu Brute Force.

Po przetworzeniu dane are składowane w wewnętrznej bazie danych, do której dostęp jest możliwy wyłącznie z wewnętrznej sieci. Logowanie do wszystkich serwerów odbywa się wyłącznie przy użyciu indywidualnych, 4096-bitowych kluczy RSA.

Zastosowano standardy wdrożeń zgodne z normą dotyczącą technik bezpieczeństwa PN-ISO/IEC 27002:2014-12 w zakresie organizacji bezpieczeństwa informacji, kontroli dostępu, kryptografii oraz bezpieczeństwa komunikacji.

7. Analizowane kategorie parametrów

System analizuje 10 głównych kategorii parametrów technicznych:

  • Dane URL
  • Dane wizyty
  • Parametry IP
  • Parametry przeglądarki + Fingerprint przeglądarki
  • Parametry systemu operacyjnego
  • Parametry urządzenia + Fingerprint urządzenia
  • Parametry zachowania użytkownika (User Behavioral)
  • Obsługa i rendering skryptu na stronie (Site Rendering)
  • Parametry Google reCaptcha v3 (opcjonalnie)
  • Dane sesyjne

8. Analizowane parametry – benchmark

Poniżej przedstawiono przykładowe parametry pobierane przez kody monitorujące TwD. W celu zapewnienia najwyższego stopnia ochrony przed próbami obejścia systemów monitoringu TwD, pełna lista parametrów nie jest upubliczniana.

Dane URL, strony i wizyty

  • URL strony
  • Elementy struktury DOM
  • Czas wczytywania zasobów
  • Obsługa plików cookies
  • Liczba i identyfikatory wizyt
  • Czas przesyłania pakietów
  • Odświeżenia strony

Analiza adresu IP

  • Dostawca Internetu (ISP)
  • Geolokalizacja
  • Typ połączenia (Proxy, VPN, TOR, Data Center)
  • Dostawca GSM
  • Lokalne adresy IP via WebRTC

Parametry przeglądarki

  • Nazwa, wersja, silnik renderujący
  • User Agent string
  • Rozmiar okna i rozdzielczość
  • Zainstalowane wtyczki i fonty
  • Audio Context & Canvas Fingerprint

Zachowanie Użytkownika (UBA)

  • Współrzędne i ruch kursora myszy
  • Dynamika i kierunek scrollowania
  • Klawiatura (liczba, tempo, czas kliknięć)
  • Czas spędzony w formularzach
  • Interakcje z obiektami

9. Metodyka audytu kliknięć

Metodyka przeprowadzania audytu kliknięć przez system TwD opiera się na wytycznych organizacji IAB (dokument „Click Measurement Guidelines”, Version 1.0, Final Release).

Opis procesu audytu klików

W ramach audytu klików oraz leadów, system TwD realizuje usługi CLICK SCANNER, GOOGLE ADS SCANNER oraz LEAD SCANNER, dokonując weryfikacji i oceny każdego rekordu pod kątem potencjalnych anomalii. System działa w oparciu o:

  • Analizę atrybutów systemowych i sygnatur przeglądarek w celu identyfikacji botów/scraperów.
  • Identyfikację zaawansowanych mechanizmów automatyzacji (np. Selenium, PhantomJS).
  • Wykorzystanie Device & Canvas Fingerprinting.
  • Algorytmy Machine Learning do zaawansowanej klasyfikacji.
  • Bot 'honeypots' – niewidoczne dla ludzi pułapki na boty.
  • User Behavioral Analysis (UBA) – behawioralną ocenę ruchu.
  • Analizę sieci IP i czarnych list.
  • Integrację z Google reCAPTCHA v3 API.
  • Tamper proofing – testy "Proof of Work" uruchamiane w przeglądarce.

System TwD mierzy kliknięcia typu Resolved Click – tj. takie, które skutkują załadowaniem docelowej strony Klienta w przeglądarce użytkownika i umożliwiają nawiązanie rzeczywistej interakcji.

Ważne: Podczas audytu kliknięć nie są gromadzone żadne dane osobowe – system nie analizuje treści wpisywanej w pola tekstowe ani poufnych informacji użytkowników.

10. Klasyfikacja klików i raportowanie

Metodologia klasyfikacji

Klasyfikacja ma na celu wykluczenie nieprawidłowych interakcji (Invalid Clicks), których celem jest wyłącznie wygenerowanie kosztów reklamowych bez realnego zamiaru dokonania zakupu czy zapoznania się z ofertą. Ostateczna ocena klika składa się z sumarycznego wyniku z 10 obszarów badawczych. Wykrycie anomalii w co najmniej jednym obszarze kwalifikuje klik jako nieprawidłowy.

Obszary oceny:

  • Sposób renderowania strony - detekcja honeypots i sprawdzanie integralności zasobów.
  • Parametry systemowe - zgodność nagłówków HTTP z deklarowaną przeglądarką.
  • Parametry przeglądarki - testy 'proof of work' i weryfikacja automatyzacji.
  • User Behavioral (Zachowanie Użytkownika) - wykrywanie nienaturalnych i automatycznych interakcji.
  • Parametry urządzenia - audio context, WebGL, WebRTC i canvas.
  • Analiza IP - geolokalizacja, VPN, proxy, TOR i centra danych.
  • Fingerprint urządzenia - stabilny, niezależny od ciasteczek unikalny identyfikator sprzętowy.
  • Fingerprint przeglądarki - parametry konfiguracyjne przeglądarki.
  • Ocena Google Score - analiza behawioralna Google reCaptcha v3.
  • Dane sesyjne - częstotliwość, wolumen i wzorce powtarzania wizyt.

Raportowanie

Zebrane i sklasyfikowane dane are prezentowane w czasie rzeczywistym w Panelu Klienta. Raporty te zawierają m.in.: czas wizyty, klasyfikację kliknięcia, adres IP wraz z dostawcą ISP i lokalizacją, unikalny fingerprint urządzenia, wizualizację ruchu na stronie oraz statystyki kampanii.

Gromadzone dane historyczne are przechowywane na bezpiecznych serwerach przez okres minimum 3 miesięcy.

Pobierz dokumentację

Specyfikacja techniczna - Opis metodologii (PDF)