Jak na neznámé referral v Google Analytics 4

Jak na neznámé referral v Google Analytics 4

Marek Wiener

Marek Wiener

Publikováno 2. 2. 2026  |  Čtení na 6 min.

Neznámé referral bývají při analýze reportů v Google Analytics 4 stále častější problém a výskyt neznámých referral nebo podezřelých domén v roli zdroje návštěvnosti u klientů roste. Tyto domény se objevují v přehledech jako referral traffic, přestože k nim neexistuje žádná reálná spolupráce, mediální výstup ani zpětný odkaz. Pro analytiky a SEO specialisty je klíčové správně rozlišit, zda se jedná o legitimní zdroj návštěvnosti, nebo o analytický šum, který zkresluje data.

V drtivé většině případů se jedná o tzv. referral spam, případně jeho modernější variantu označovanou jako ghost spam. Tento problém obvykle neevidujeme jen u jedné konkrétní domény – podobných zdrojů bývají desítky a v čase se obměňují.

Co je referral spam a ghost spam v kontextu GA4

Referral spam označuje uměle generovanou návštěvnost, která se v analytických nástrojích tváří jako příchod uživatelů z externích webů. Motivací je zpravidla snaha upoutat pozornost správců webů, přimět je ke kliknutí na neznámé domény, případně cíleně znečistit analytická data.

Specifickou kategorií je ghost spam, který je pro GA4 obzvlášť typický. V tomto případě se žádný návštěvník na web reálně nedostane. Útočníci odesílají data přímo do Google Analytics prostřednictvím Measurement Protocolu, tedy bez jakékoli interakce s webem, serverem nebo Google Tag Managerem. Právě proto se tyto záznamy objevují i u webů s velmi přísným nastavením zabezpečení. Více o této problematice najdete i v kurzech Analytics mania.

Dopad spamových zdrojů na analytiku a SEO rozhodování

Neznámé referral domény mohou na první pohled působit jako drobný problém, ve skutečnosti však mají výrazný dopad na interpretaci dat. Dochází ke zkreslení akvizičních přehledů, nárůstu nereálných session, zhoršení engagement rate nebo falešným změnám v atribučních modelech.

Z pohledu SEO a výkonnostního marketingu je to zásadní problém. Rozhodnutí o investicích, úpravách obsahu nebo vyhodnocování kanálů by měla vycházet z reálného chování uživatelů, nikoliv z uměle generovaných událostí. Pokud spamová data nejsou systematicky řešena, snižuje se důvěryhodnost celé analytiky.

Proč samotné vyloučení referral domén nestačí

Google Analytics 4 nabízí možnost vyloučit nežádoucí referral domény přímo v nastavení datového streamu. Tento krok je užitečný, ale nelze jej považovat za plnohodnotné řešení. V některých případech totiž nedochází k úplnému odstranění dat, ale pouze ke změně atribuční logiky, kdy se návštěvnost přepíše například na direct traffic.

Navíc u ghost spamu často neexistuje žádný skutečný referrer v klasickém smyslu, takže jednoduché vyloučení domény nemusí mít žádný efekt. Z dlouhodobého hlediska je proto nutné pracovat s obecnějšími principy ochrany dat.

Validní hostname jako základ čistých dat

Za nejspolehlivější přístup se dnes považuje omezení měření pouze na validní hostname, tedy domény, na kterých skutečně běží váš web nebo aplikace. Ghost spam se velmi často prozradí právě tím, že používá neexistující nebo nesmyslné hostname, které s projektem nijak nesouvisí.

Filtrování na základě hostname lze řešit už při sběru dat pomocí Google Tag Manageru, případně při následném zpracování dat v BigQuery. Tento přístup má výhodu v tom, že je dlouhodobě udržitelný a není závislý na neustálém doplňování blacklistu nových spamových domén. Zajímavé technické tipy najdete také na blogu Simo Ahava.

Role Google Tag Manageru a pokročilého nastavení

Google Tag Manager výrazně zpřesňuje kontrolu nad tím, jaká data odesíláte do GA4. Pomocí podmínek založených na hostname nebo referreru lze zabránit odesílání měření v případech, kdy návštěva nepochází z očekávaného prostředí. Tento přístup je velmi efektivní zejména proti jednodušším formám referral spamu.

Je však nutné si uvědomit, že u ghost spamu, který obchází GTM i server, zůstává GTM pouze jednou z vrstev ochrany.. Proto dává smysl kombinovat jej s dalšími metodami, zejména s kontrolou dat při reportingu.

Práce s historickými daty a reportingem

Jednou z nevýhod GA4 je nemožnost zpětně mazat nebo upravovat již naměřená data. Pokud se spamové zdroje objevují delší dobu, je nutné s nimi pracovat na úrovni reportů. Typickým řešením je využití segmentů v exploracích GA4, filtrace dat v Looker Studiu nebo kompletní čištění datasetů v BigQuery.

Jak k problému přistupovat dlouhodobě

Referral spam není jednorázový incident, ale dlouhodobý jev. Konkrétní domény se mění, princip ale zůstává stejný. Místo reaktivního přidávání jednotlivých zdrojů na blacklist se vyplatí nastavit systémovou ochranu dat, pravidelně kontrolovat hostname, sledovat anomálie v akvizičních reportech a pracovat s daty kriticky.

Čistá analytika v MarkMedia rozhodně není o tom, že v GA4 nic nepřekáží, ale o tom, že rozumíme tomu, co v datech vidíme a proč. A právě v tom spočívá rozdíl mezi pouhým sběrem dat a skutečně kvalitní analytickou prací.

Vzbudilo u vás toto téma zájem? Budeme rádi, když článek nasdílíte dál, aby se dostal i k dalším lidem, kterým mohou podobné problémy s GA4 komplikovat práci. Děkujeme.