Przy okazji ostatnich zmian w serwisie Pupile.com, zmieniłem także sposób adresowania stron. Dla osób, które tego serwisu nie znają wspomnę, że w serwisie tym od 2003 roku użytkownicy mogą założyć własnę "stronę pupila", z jego opisem, zdjęciami i możliwością komentowania. Strony te mają osobne adresy w subdomenach, typu "imię.pupile.com".
Oznacza to, że w sumie powstało kilkadziesiąt tysięcy subdomen, na których były treści, które były linkowane wzajemnie z domeną główną serwisu http://www.pupile.com/. Kilka dni temu zmieniłem sposób adresowania i "strony pupili" mają teraz adresy typu http://www.pupile.com/psy/imię a subdomeny są tylko przekierowaniami HTTP 301. Co ta zmiana dała? Formalnie teraz każdy pupil stanowi podstronę serwisu pupile.com, a nie osobną małą stronę.
Zmiana ta znacznie odbiła się na wynikach w Google Analytics. Oto co ciekawsze screeny z GA:
Ten spadek odwiedzin wcale nie oznacza mniejszego ruchu na stronie, co potwierdzają logi serwera. Dotychczas, gdy użytkownik przemieszczał się pomiedzy subdomenami, każde takie przejście GA traktowało jako nową odwiedzinę (prawdopodobnie przez konieczność ustawiania nowego Cookie dla nowej domeny). Czyli tylko i wyłącznie serwisy działające na jednej domenie mają szanse na dobre zliczanie.

Jak widzimy, GA nie zliczało sztucznie tylko odsłon, ale także użytkowników. Różnica miesięczna pomiędzy unikalnymi użytkownikami prezentowanymi przez GA a przez logi serwera wynosiła 500%. Wydawało mi się, że UU powinno być zliczane po IP a nie po Cookie?

Zmiana wskaźnika odrzuceń także wydaje się oczywista. Jeśli użytkownik wszedł na www.pupile.com i następnie przeszedł na markus.pupile.com, to według GA nastąpiło odrzucenie. A w rzeczywistości użytkownik nadal przeglądał nasz serwis.

Poprawne przeliczanie wszystkich podstron, analogicznie jak powyżej poprawiło wskaźnik strony/odwiedziny.
Podsumowanie
Google Analytics nie radzi sobie ze zmianami subdomen przez użytkowników. W naszym przypadku znacząco zawyżało dane o oglądalności serwisu. Oznacza to też, że nie mogą być wiarygodnym źródłem informacji, bo istnieje ryzyko zawyżania danych. Błędy takie w naszym przypadku nie występują przy AWstats, który analizuje logi serwera, czy nawet w Megapanelu Gemiusa, który co najwyżej zaniża wyniki.
Jeśli chcemy mieć wiarygodne dane z GA, musimy zadbać, aby cały serwis funkcjonował tylko i wyłącznie na jednej domenie:
- Zdecydujmy, czy serwis ma działać z "www." czy bez "www.", bo każde przełączenie użytkownika przekłamie nam statystyki.
- Jeśli mamy kilka domen (np. domena.pl, .com.pl i .net) to także zdecydujmy się na uruchomienie serwisu na tylko jednej z nich, a resztę przekierujmy na tę jedną.
- Jeśli korzystamy z protokołu HTTPS, to przełączenie pomiedzy nim a HTTP także powoduje utworzenie Cookie i przekłamie statystyk.