Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июль 2020  
пн вт ср чт пт сб вс
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

Рейтинг прозрачности категорий Рунета

Леонид Делицын
| архивная статья | 27.08.2002 15:02

Получить статистику прозрачности категорий Рунета побуждает неудовольствие ситуации со статистикой в целом ряде категорий Рунета. Скажем, понять, что происходит в туристическом секторе или в секторе электронной коммерции сложно, поскольку больше половины сайтов скрывают свою статистику. Поэтому доверие к результатам исследования развития таких категорий будет заведомо низким.

Целью предлагаемого рейтинга и стала попытка разобраться, о каких секторах Рунета можно получить сведения в открытом доступе, а о каких — нельзя.

Разумеется, фирмы скрывают сведения о себе не только в онлайне. Некоторые весьма крупные фирмы держат втайне даже собственный устав. Поэтому рейтинги прозрачности, составляемые рейтинговыми агентствами, используются игроками фондового рынка для оценки рисков, связанных с покупкой акций. Оценивают прозрачность отдельных компаний, оффшорных зон и целых стран. Скажем, Россия занимает второе с конца место в рейтинге прозрачности экономики и законодательств 35 стран, построенном экспертами PWC (уступая пальму непрозрачности Китаю).

Рейтинг "проз-ти"

Кат-ия

Прозр-сть 100 лидеров

Прозр-сть 500 лидеров (%)

Груп. категорий

1

СМИ и периодика

89

76

СМИ

2

Политика

83

75

обшество и политика

3

Игры

80

73

увлечения и отдых

4-5

Бизнес и финансы

79

67

бизнес и карьера

Театр

79

78

культура и искусство

6-7

Литература

77

74

культура и искусство

Образование

77

69

наука и техника

8-9

Администрации

76

75

общество и политика

История

76

77

общество и политика

10

Спорт

75

69

увлечения и отдых

11-12

Сервисы

74

70

компьютеры и интернет

Радио

74

75

СМИ

13

Аналитика

73

66

общество и политика

14-19

Работа

72

66

бизнес и карьера

Увлечения и хобби

72

69

увлечения и отдых

Медицина

72

70

медицина

Электроника

72

68

наука и техника

Дети

72

76

увлечения и отдых

Наука

72

76

наука и техника

20-21

Классификаторы

71

67

компьютеры и интернет

Города и регионы

71

69

места и люди

22

Провайдеры

70

66

компьютеры и интернет

23-25

Музыка

69

68

культура и искусство

Железо

69

71

компьютеры и интернет

Телевидение

69

71

СМИ

26-28

Технологии

68

67

компьютеры и интернет

Религия

68

71

общество и политика

Экспертиза

68

71

товары и услуги

29-30

Авто и мото

67

68

увлечения и отдых

Прочее

67

75

прочее

31-32

Развлечения

65

57

увлечения и отдых

Программы

65

69

компьютеры и интернет

33

Природа

64

65

увлечения и отдых

34-37

Компьютеры

63

61

компьютеры и интернет

Юмор

63

64

увлечения и отдых

Кино

63

69

культура и искусство

Искусство

63

71

культура и искусство

38

Недвижимость

61

57

товары и услуги

39

Безопасность

61

65

компьютеры и интернет

40

Отдых

60

61

увлечения и отдых

41-44

Дизайн

59

62

культура и искусство

Законы

59

60

общество и политика

Реклама

59

64

товары и услуги

Продукты питания

59

58

товары и услуги

45

Банки

58

61

бизнес и карьера

46-48

МР3

56

69

культура и искусство

Транспорт

56

64

места и люди

Техника

56

59

наука и техника

49

Фото

55

61

культура и искусство

50

Страхование

52

54

бизнес и карьера

51

Компании

51

56

бизнес и карьера

52-53

Связь

50

56

товары и услуги

Фармацевтика

50

58

медицина

54-55

Товары и услуги

46

53

товары и услуги

Электронная коммерция

46

54

товары и услуги

56

Путешествия

41

60

места и люди

57

Строительство

40

53

товары и услуги

По предложению журнала Adverus мы попытались оценить прозрачность категорий Рунета. К счастью, манипуляции с экспертными оценками в этом случае не потребовались – мы ограничились простым подсчётом процента сайтов с открытой статистикой в различных категориях рейтинга Rambler’s Top 100.

Сперва мы рассмотрели лидирующую сотню сайтов в каждой из 57 категорий счётчика Rambler’s Top100. В сумме составило 5700 сайтов. Оказалось, что 1978 из них, то есть 35% сравнительно крупных сайтов Рунета «закрывают» свою детальную статистику от посторонних глаз. Наблюдателю доступны только позиции таких сайтов в рейтингах, дневной охват аудитории и соответствующее число вызовов страниц. Прозрачность каждой категории, т.е. процент сайтов с открытой статистикой, указан в третьем столбце нашей таблицы.

Потом мы проделали те же вычисления для первых 500 сайтов в каждой категории. Под прозрачностью категории опять же подразумевается процент сайтов с открытой статистикой. Он указан в четвёртой колонке таблицы. Заметим, что не все категории насчитывают 500 сайтов (менее 500 сайтов рейтингуется в категориях «Аналитика», «Администрации», «Банки», «Классификаторы», «Радио», «Страхование», «Фармацевтика» и «Экспертиза»). В таких категориях пришлось ограничиться тем числом сайтов, которое было в наличии.

Проинтерпретируем для начала рейтинг, полученный по сотне крупных сайтов каждой категории. Как следует из таблицы, наиболее «прозрачной» оказалась категория СМИ/Периодика — 89% сайтов здесь открывают детальную статистику. За этой категорией в рейтинге прозрачности следует «дочерняя» категория «Политика», где доминируют политические разделы сайтов онлайновых газет. Высокая прозрачность не вызывает удивления, поскольку главный, а зачастую — и единственный источник доходов СМИ в Рунете — размещение рекламы. Поэтому они и стремятся подтвердить величину своей аудитории у своеобразных «аудиторов» Рунета — счётчиков и рейтингов и предоставить наиболее полные данные рекламодателю.

Напротив, cамый высокий процент сайтов, закрывающих статистику, наблюдается в категориях группы «Товары и услуги», то есть там, где пытаются что-либо продавать конечному потребителю. В шести таких категориях статистику закрывают более половины сайтов из первой сотни. А в четырёх категориях этой группы: «Строительство», «Товары и услуги», «Электронная коммерция» и «Связь» статистику прячут не менее 50% участников. В тот же своего рода виртуальный масонский клуб входят категории «Путешествия», где в основном продают путёвки турагентства, и «Фармацевтика», где преобладают сайты аптек.

Таким образом, можно более или менее уверенно делать выводы о поведении сайтов группы «СМИ и Периодика», но вот «Строительство» и «Путешествия» — это практически «чёрные дыры».

С чем может быть связана «непрозрачность» категорий Рунета? «Качественный» ответ очевиден. Непрозрачность вызвана, во-первых, понятным стремлением скрыть статистику от конкурентов. С таким объяснением соглашаются наши коллеги с сайта Оборот.Ru: «Объясняются факты сокрытия информации просто: торговые ресурсы не желают рассказывать конкурентам о способах привлечения клиентов и периодах проведения рекламных кампаний».

Вторая причина заключается в стремлении сайтов, торгующих товарами и услугами, занять как можно более высокие позиции в популярном рейтинге Rambler’s Top100. Чем популярнее (авторитетнее, и вообще полезнее) рейтинг, не важно, в интернете или в офлайне, тем сильнее искушение его сфальсифицировать. Инструментами завышения посещаемости могут быть как простые накрутки программными способами (которые счётчик старается отлавливать), так и популярный метод т.н. «визитинга», когда по сайтам за небольшую плату с утра до ночи бродят студенты, школьники и домохозяйки. Такой способ позволяет сайтам улучшить позиции в рейтингах за счёт этих достаточно бесполезных посетителей, а уже с рейтингов на сайты приходят уже пользователи, действительно заинтересованные в продукте. Впрочем, как признавались на недавнем семинаре РОЦИТ представители туристических агентств и операторов, накрутки считаются малопочтенным занятием в профессиональной среде, поэтому компании, дорожащие репутацией, их избегают.

В попытке объяснить рейтинг прозрачности, мы рассчитали коэффициенты корреляции прозрачности с другими параметрами категорий Рунета. Достаточно сильно прозрачность коррелирует с суммарным трафиком категории. Достаточно высока (40%) антикорреляция прозрачности с долей москвичей в категории (данные взяты из географических распределений трафика по категориям Rambler’s Top100). Чем выше индекс соответствия москвичей, т.е. чем больше их в категории по сравнению с их средней доле по Рунету, тем больше сайтов скрывают свою статистику. Это легко понять, если учесть, что москвичи — основные клиенты магазинов Рунета.

Кроме того, непрозрачность коррелирует с фрагментированностью категории (39%). Скажем, в категории «Классификаторы», где 2 сайта делают 80% трафика, скрывают статистику только 29 сайтов из ста (действительно, что толку скрывать статистику, если ближайший конкурент больше в три раза). Зато в категории «Строительство», где 80% трафика делится уже на 129 ведущих сайта, скрывает статистику уже 60 сайтов из ста.

Прозрачность, измеренная по 500 ведущим сайтам каждой категории, приведена в четвёртой колонке таблицы. Она незначительно отличается от измеренной по сотне сайтов, поэтому мы не будет её обсуждать подробно. Рассматривая таблицу можно обратить внимание на то, что в верхней половине таблицы значения в третьей колонке, как правило, выше, чем в четвёртой, а в нижней — наоборот. Значит, в «прозрачных» категориях лидеры, как правило, «прозрачнее» основной массы сайтов, в «непрозрачных» — «непрозрачнее». В обоих случаях лидеры категорий «задают тон» для остальных игроков и перетягивают их к себе со среднего уровня. Такая закономерность подтверждается и вычислениями.

С нашей точки зрения полученный рейтинг прозрачности будет отражать ситуацию и в будущем. Правда, число сайтов с закрытой статистикой, всё-таки меняется во времени, причём довольно быстро, хотя и не сильно. Это неизбежная случайная погрешность рейтинга. Дело в том, что разница в трафике между 100-м и, скажем, 120-м сайтом не так уж велика. Оценить точность рейтинга для измерений по 100 сайтам можно следующим образом. Допустим, 36 из 100 сайтов категории закрывают свою статистику. Тогда стандартную ошибку этой величины можно оценить квадратным корнем из среднего значения, то есть ошибка составляет плюс/минус 6%. Соответственно, разнице между 30 и 36 или 36 и 42 не следует придавать слишком большое значение. А вот более существенные различия уже являются неслучайными.

разделы:

Другие

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost