Текст: Юрий Ильин
В пятницу в "Независимой Газете" была опубликована статья "Большая Двадцатка" российского Интернета", подготовленная Иваном Засурским, заместителем генерального директора Rambler. В статье рассказывалось о проведенном холдингом Rambler совместно с Mail.Ru исследовании с целью показать, у каких сайтов охват аудитории наибольший. Иначе говоря, учитывалась не посещаемость того или иного ресурса, а размеры его аудитории относительно общего количества пользователей Рунета. Результаты, впрочем, в "НГ" опубликованы не были.
Рейтинг BiG20 выглядит следующим образом:
| 1. Anekdot - Сервер анектодов на Anekdot.ru 2. Aport - Поисковая система Aport 3. Chat - Интернет-портал Chat.ru 4. Dialup.mtu - Интернет-провайдер МТУ 5. Dni - Ежедневное информационное издание 6. Fomenko - Развлекательный портал 7. Gazeta - Первая газета российского интернета 8. Freeware - Сервер бесплатных компьютерных программ 9. Fobos - Погода от МэпМейкерс 10. Hotbox - Бесплатная почта | 11. IXBT - Статьи, новости компьютерной тематики 12. Lenta - Лидирующий информационный ресурс Рунета 13. List (Catalog@Mail) - Интернет-каталог (с 15 октября Catalog@Mail) 14. Mail - Почтовый портал @Mail.ru 15. Omen - Развлекательный портал 16. Rambler - Информационно-поисковая система Рамблер 17. Referat - Сервер рефератов (принадлежит России-Он-Лайн) 18. Rbc - Росбизнесконсалтинг 19. Rol - Интернет-провайдер Россия-Он-Лайн 20. Top100.rambler - Рамблер Топ 100 ? каталог ресурсов российского интернета |
Иван Засурский ответил на вопросы "Компьюленты".
- Какие методики использовались в этом исследовании? Вы ограничиваетесь лишь теми сайтам, на которых стоит счетчик Rambler's Top 100?
- Да. Сейчас зарегистрировано 286 323 ресурсов, из них активных - 72 с чем-то тысячи.
- То есть охват получается не таким уж полным?
- Идея Топ100, за счет чего он стал популярен - это его гибридность - это и классификатор (или каталог) и рейтинг (или счетчик) посещаемости ресурсов одновременно. Его каталожная ипостась интересна всем пользователям Рунета, которые хотят быстро найти "живой" и популярный ресурс по интересующей их теме. Его рейтинговая ипостась интересна тем владельцам ресурсов, которые хотят понять, где их место на рынке, опрережают они конкурентов или отстают от них, а посетители приходящие на их ресурсы с Топ100, дают им бесплатный трафик. Именно поэтому Топ100 так популярен. Пожалуй, единственный не вошедший туда ресурс - это Яндекс. Мы им сделали предложение войти в Топ100, потому что мы хотим, чтобы они тоже "считались". Мы знаем, что это крупный ресурс и он наверняка войдет в двадацатку, но суть нашего метода такова, что мы не можем просто вставить ресурс не имея данных о нем из Топ100. Появление Яндекса в Двадцатке может изменить всю ситуацию - какие-то ресурсы могут оказаться тесно связанными с ним по аудитории и выпадут, их место займут другие. Но это только предположения - для алгоритма же отбора Двадцатки нужны точные сухие данные Топ100 и именно поэтому мы и обратились еще раз к Яндексу с таким предложением.
- Как Яndex отреагировал на это предложение?
- Они пока думают, предложение было сделано буквально только что.
- А как с помощью этого исследования определить, кто является посетителями тех или иных сайтов?
- По кукам. Только мы считаем не посетителей, а их программы. Это важное уточнение, особенно когда компьютером пользуется несколько человек. Но это самый точный метод из всех имеющихся.
- А как определить, например, профессию человека? Это вообще возможно?
- У нас есть выборка, основанная на определенном количестве заполненных анкет в почтовой службе, и по ней мы можем составить общее представление. Из миллиона заполненных при регистрации в почту Рамблера анкет нами было отобрано около 400 тысяч, без явных противоречий (например девочка семи лет, служащая в армии или мужчина 1972 лет от роду). При этом нас не интересует профессия того или иного конкретного посетителя, нам интересно знать, каков общий соц-дем состав аудитории Интернет.
Конечно, когда человек заполняет анкету на "нейтральном" ресурсе (как, например, почта) у него меньше желания придумывать себе "виртуальную личность", чем когда он отвечает на опрос на конкретном ресурсе. Кроме того, мы применяли достаточно комплексную систему верификации как исходных данных так и методики нашегно исследования. Во-первых, мы выбрали из них анкеты без явных противоречий. Затем мы сравнили получающиеся результаты с оффлайновыми опросами - и они оказались достаточно близки друг к другу: у нас и в оффлайне получается, что отношение мужчин и женщин - 2/1, примерно одинаковые распределения по возрастам и социальному статусу. И наконец, мы сделали расчеты для случаев, которые легко проверить с точки зрения человеческой логики - например, на сайты рефератов ходят больше студентов, чем в среднем по Интернету, а на сайты тематики безопасности - существенно больше мужчин, чем в среднем.
- А как определяется охват аудитории?
- Очень просто: из всех "ярлычков" посетителей, которые были замечены на ресурсах Топ100 мы отбираем куки только тех, которые приходили из России и встречались нам в течение хотя бы двух дней за последний месяц. Их, оказывается, два с половиной миллиона в месяц. Из них 2,2 миллиона бывали хотя бы на одном из ресурсов "Большой Двадцатки".
- Вы можете рассказать о тенденциях "Большой Двадцатки"?
- Доля аудитории, приходящаяся на ресурсы БД гораздо выше, чем доля просмотров страниц. Другими словами, если охват аудитории "BiG 20" составляет 88% от всего Рунета, то хитов у нее - всего лишь четверть от общего числа. Число хитов несколько выросло после терактов, когда появилось много новых пользователей, и они пошли на брэнды.
- А какой-либо долгосрочный прогноз вы можете дать? Кто может выйти из "Большой Двадцатки", кто, наоборот, войти?
- Я вам скажу совершенно серьезно: мы не знаем. Я видел, как это делали наши программисты. Мы просто сидели перед машиной и смотрели, что она "выплевывает". Ясно, что летом рефератный сайт уйдет. По нашим летним данным, сайт рефератов не входил в двадцатку - сезон нестуденческий. А все остальное - достаточно сложно сказать. Очень много будет зависить от рекламных кампаний сайтов, тенденций баннерообмена и, соответственно, обмена аудиторией.
