Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июль 2020  
пн вт ср чт пт сб вс
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

Максим Зотов об интернет-счетчиках

Вебпланета
| архивная статья | 13.04.2005 18:35

«Вебпланета» публикует интервью с программистом Максимом Зотовым, создателем таких популярных сервисов статистики, как Top.Mail.Ru и LiveInternet.Ru.

Максим, вопрос простой, но в тоже время сложный: какой счетчик считает «правильно» — Top.Mail.Ru или Rambler`s Top100? Когда заходит речь о том, почему статистические данные, скажем, Lenta.Ru, в Top.Mail.Ru показывают одно значение, а в Rambler`s Top100 — совершенно другое, в Mail.Ru говорят: счетчик «Рамблера» считает неправильно; тоже самое говорят в «Рамблере» — это в Mail.Ru кривой счетчик. В чем причина?

Как правило, основная причина в том, что делается некорректное сравнение. Обычно же при равных условиях показатели разных систем приблизительно совпадают. А вот если отличия большие, то дело тут скорее всего не в «кривости» какого-то счетчика, а в ошибках пользователя. Наиболее вероятная причина несовпадений — коды счетчиков разных систем установлены на разных наборах страниц, либо в разных местах страницы: код одного счетчика установлен в начале страницы, а второго — в конце (например, в случае с lenta.ru — ситуация именно такая, счетчик Rambler’s Top100 в начале страницы, а счетчик Top.Mail.Ru — в самом конце, и, конечно, до счетчика Top.Mail.Ru загрузка может иногда не доходить).

Также нужно не забывать сравнивать одни и те же параметры, например, в случае с Rambler’s Top100 нужно смотреть статистику по всему сайту, а не по главной странице, поскольку остальные системы статистики ведут учет посещаемости всего сайта. Бывает, что некоторые системы используют одинаковые названия для немного разных параметров, например, в Top.Mail.Ru при учете «хостов» учитываются адреса посетителей за прокси-серверами, в других системах — нет, поэтому хостов по Top.Mail.Ru обычно больше процентов на 10–20, чем хостов по другим системам.

При сравнении разных систем прежде всего следует обращать внимание на самый простой для измерения параметр: просмотры страницы («хиты» или «визиты» в разных терминологиях). Потому что это всего лишь факт загрузки счетчика, и разночтения тут обычно непринципиальны и минимальны. Если отличия существенны, значит, нужно искать разницу в установке кодов счетчиков на страницах.

Разночтения в учете уникальных посетителей связаны, в основном, с тем, что учет делается с помощью механизма cookies, а этот механизм может быть иногда выключен в браузере. В этом случае каждая из систем может по-своему определять уникальность пользователя, но все равно отличия будут незначительны: в пределах 2–5%. Например, LiveInternet и Top.Mail.Ru игнорируют таких посетителей (от них засчитываются только просмотры/визиты), а Rambler’s Top100 или SpyLog используют IP-адреса для оценки уникальности таких браузеров, и у них количество посетителей может быть больше на пару процентов. В отчете «Подробная статистика» Rambler выводит показатель «в том числе посетителей с cookie», вот это число должно совпадать с количеством посетителей по LiveInternet или Top.Mail.Ru.

Средние дневные показатели по данным пяти последних рабочих дней в статистике «Яндекса» показывают 2,7 млн. посетителей при 716 тыс хостах. Как такое может быть? По-моему, да и не только по-моему, это просто нереально.

Да, количество выглядит существенно завышенным. Например, возьмем статистику Rambler’s Top100 по своему же поиску. Смотрим подробную статистику за вчера, 12 апреля:

— уникальных адресов по всему сайту: 552 380 
— уникальных посетителей: 1 378 087 
— соотношение 1 к 2.5.

При более менее одинаковых по порядку объемах аудиторий это соотношение должно быть справедливо и для посетителей «Яндекса». Поэтому более реальным выглядит число уникальных посетителей около 1,8 млн. Максимум — 2 миллиона. Впрочем, есть одно предположение, почему такое может быть.

Какое?

По данным статистики LiveInternet, в браузерах 1,8–2% посетителей выключена поддержка cookies. Допустим, страницу «Яндекса» загружает посетитель с таким браузером. Сервер «Яндекса» видит, что cookie у браузера нет, и пытается ее установить. Из-за особенностей http-протокола сразу же проверить, установилась ли cookie, сервер не может (только при следующем запросе к сайту браузер пошлет серверу установленную cookie). Поэтому он просто пишет в свой лог, что пришел новый посетитель и ему выдана такая-то кука.

Теперь этот же посетитель загружает еще одну страницу «Яндекса» (допустим, результаты поиска), сервер видит, что куки нет, опять считает посетителя новым и выдает новую куку. То есть каждый просмотр страницы «Яндекса» таким посетителем считается просмотром от нового посетителя.

По статистике «Яндекса» видим, что в среднем делается 37,9 млн просмотров страниц в день (хитов). Если 2% просмотров от этих миллионов сделаны браузерами без поддержки cookies, то получаем (37,8*0,02=0,76) как раз те лишние 760 тыс посетителей.

То есть, когда Аркадий Волож, или кто-то еще из «Яндекса», говорит, что у нас столько-то посетителей в неделю, на самом деле это не так? Или как?

Если мое предположение о способе учета посетителей верно (то есть уникальность оценивается по выданной куке, а не по принятой), то да, на самом деле не так. И что касается недельной аудитории, то доля лишних посетителей еще больше.

разделы:

Другие

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost