Spam w Google Analytics – jak sobie z nim poradzić [wtyczka WordPress]
Chyba każdy, kto korzysta z Google Analytics zauważył, że od dłuższego czasu w różnych raportach pojawiają się bardzo dziwne witryny i dane. Na pierwszy rzut oka wygląda na to, że na jakiejś witrynie pojawił się link do naszej strony, z którego na dodatek czerpiemy ruch. Nie zastanawiając się długo wchodzimy na dany adres i… zostajemy przekierowani na zupełnie inną stronę, najczęściej poprzez link afiliacyjny. Właśnie w ten sposób spamerzy zdobywają ruch z wykorzystaniem narzędzia Google.
Na dodatek ruch z rzekomo odsyłających domen wygląda nawet przyzwoicie, co jeszcze mocniej zaciekawia zaatakowanego webmastera. Poniżej przykładowe dane z jednej z zaatakowanych witryn.
Otóż tę sprytną metodę wymyślił pewien Rosjanin – Vitaly Popov, który wykorzystując lukę w Google Analytics postanowił się nieco wzbogacić. Niby Pan Popov nie robi nic złego, a jednak fałszywy ruch potrafi mocno zaburzyć statystyki serwisu. Poza tym jest on naprawdę mocno irytujący na dłuższą metę. Jak widać afiliacja bywa i matką wynalazku… nie koniecznie pożądanego przez większość ludzi.
Tego typu ruch został nazwany w sieci jako Referral Spam lub Ghost Refferer Spam. Różni specjaliści opracowali różne techniki radzenia sobie ze spamem w Google Analytics. Od filtrów blokujących rosyjskie IP, poprzez filtry blokujące konkretne domeny odsyłające, po modyfikację pliku .htaccess. Mimo wszystko każda z tych metod działa z reguły na krótką metę. Dlaczego? Dlatego, że spamerzy zaczynają wykorzystywać nowe domeny i nowe adresy IP.
Dlatego też ucieszyłem się widząc nową wtyczkę do systemu WordPress, która automatycznie odfiltrowuje spamerski ruch. Wtyczka nazywa się Analytics Spam Blocker i odfiltrowuje ruch z poziomu pliku .htaccess. Na dodatek wtyczka będzie prawdopodobnie na bieżąco aktualizowana, dzięki czemu w przypadku pojawienia się nowych spamerskich botów i adresów, nie będziemy musieli się martwić o aktualizację filtrów.
Na dodatek zamieszczam obecny fragment pliku .htaccess wygenerowany przez wtyczkę, specjalnie dla osób, których strony nie są oparte o WordPressa. Plik do pobrania TUTAJ.
Obecnie wtyczka blokuje takie witryny jak:
- semalt.com
- buttons-for-website.com
- buttons-for-your-website.com
- best-seo-solution.com
- best-seo-offer.com
- darodar.com
- anticrawler.org
- googlsucks.com
- 7makemoneyonline.com
- social-buttons.com
- youporn-forum.ga
- domination.ml
- get-free-traffic-now.com
- pornhub-forum.ga
- depositfiles-porn.ga
- rapidgator-porn.ga
- buy-cheap-online.info
- generalporn.org
- search.tb.ask.com
- gotovim-doma.ru
- depositfiles-porn.ga
- pornhubforum.tk
- hulfingtonpost.com
- torture.ml
- pornhub-forum.uni.me
- free-share-buttons.com
- windowssearch.com
- theguardlan.com
- supb.ro
- econom.com
- ilovevitaly.com
- ilovevitaly.ru
- ilovevitaly.info
- myftpupload.com
- iskalko.ru
- lomb.co
- lombia.co
- blackhatworth.com
- priceg.com
- bestwebsitesawards.com
Jakby Pan Popov nie zatruł życia wszystkim webmasterom, to na pewno nie można zarzucić mu braku pomysłowości. Ciekaw jestem jak opłacalna okazała się nowa forma spamu.
Dodatkowo niektórzy spamerzy zaczęli rozwijać metodę spamu, generując np. fałszywe zdarzenia w Google Analytics, co wymaga już nieco innej formy filtru. Fakt faktem, najbardziej zainteresowana usunięciem tego typu spamu powinna być firma Google, której to produkt został „zaatakowany”. Miejmy nadzieję, że w najbliższym czasie uda im się zrobić coś z tym problemem.
Ojj, ktoś nie wyłączył debugowania ;-))) Standardowe prefixy, stare PHP, pewnie boty już się pewnie szykują z serią pytań 😀
BTW „<!– W3 Total Cache: Db cache debug info: Engine: disk" jak to shared to radzę wyłączyć bo użycie I/O zapewne duże.
Dziękuję za monitoring witryny 🙂