Персонажи

Поисковик русского "Лайкоса" - лучший в Рунете?

10 августа 2001 года, 10:37 | Текст: Кирилл Тихонов

Девятого августа открылась русская версия крупного международного портала Lycos (подробнее о приуроченной к этому событию пресс-конференции можно прочитать здесь). Центральной частью почти любого портала является поисковая система. "Лайкос" - не исключение. Как рассказывал в своё время генеральный продюсер русского "Лайкоса" Андрей Себрант, портал "начинался с искалки, которая была очень хорошо сопряжена с каталогом", а все дополнительные сервисы возникли потом. Качество поисковой системы будет играть не последнюю роль в его успехе.

Картинка к новости 'Поисковик русского
Картинка к новости 'Поисковик русского "Лайкоса" - лучший в Рунете?'

Русский "Лайкос" использует поисковик, разработанный своим давним партнёром - норвежской компанией FAST Search & Transfer. В настоящее время он используется в 14 европейских странах, а всего с ним работает больше четырёх десятков порталов, использующих брэнд Lycos. Кроме того, у него есть и свой собственный, независимый от Lycos сайт - alltheweb.com. (Подробнее о нём "Компьюлента" рассказала сегодня в новости ""Новые возможности поисковой системы AllTheWeb").

Впрочем, механическим переносом на русскую почву поисковика, разрабатывавшегося без учёта особенностей русского языка, обойтись бы не удалось. Поэтому ещё задолго до открытия сайта "Лайкоса" в России FAST начал работу по адаптированию системы. И это оказалось не таким уж простым делом. По словам технического директора FAST Джона Лервика, русский язык оказался особенно труден для индексации из-за своей сложной синтетической структуры - у каждого слова имеются многочисленные парадигмы, т.е словарные формы, отличающиеся в зависимости от падежа, склонения, рода, числа.

И с этой задачей, как было сообщено на прошедшей сегодня в Москве пресс-конференции, им удалось справиться. По утверждению руководителей русского Лайкоса, используемая сейчас поисковая система учитывает все особенности русского языка. Более того, при создании русской версии поисковика была разработана технология лемматизации - разложения сложных слов на простые формы. Такого, по сведениям FAST, до них не делала ни одна неспециализированная поисковая машина.

Как утверждает FAST, за время подготовки к открытию русского "Лайкоса" ими была создана база данных, содержащая информацию о более чем 13 миллионах страниц на русском языке. Если это действительно так, то им всего за несколько месяцев удалось обогнать создававшийся много лет "Рамблер", поисковая система которого содержит информацию всего о 12 миллионах страниц. Обновление базы будет происходить раз в 9-12 дней.

Тем не менее, пока поисковик не лишён недостатков. Даже простая (и не претендующая на полноту) проверка обнаруживает недостатки в механизме определения релевантности ссылок, из-за которых на первые позиции попадают ссылки на страницы, имеющие достаточно мало связи с запросом. Так, например, в ответ на запрос об известном криптологе Филе Циммермане (интервью с ним "Компьюлента опубликовала на днях) "Лайкос" предлагает отправиться на сайт "Акустического фестиваля Посолонь", а на запрос материалов о "собаках" почему-то находит сайт почтовых рассылок Citicat (эмблемой которого, по курьёзному совпадению, является кошка). Яндекс в ответ и на тот, и на другой запрос выдаёт несравнимо более точные результаты: в первом случае - ссылку на личный сайт Циммермана, во втором - многочисленные сайты о собаках и собаководстве. Причина этого, судя по всему, в том, что FAST не учитывает близость слов.

Впрочем, такие огрехи естественны для сайта, который делает только первые шаги в России. В конце концов, поисковик будет исправлен, тем более, многие ошибки, мешавшие работе с сайтом, были устранены за считанные дни до открытия. Как сообщили на пресс-конференции, буквально перед открытием специалисты "Лайкоса" устранили ошибку, из-за которой даже регистрация в почтовой системе портала оказывалась не самым простым делом: для многих она заканчивалась сообщением об ошибке 500 (некорректная работа серверного программного обеспечения).

С завидной оперативностью европейский Lycos справился и с опасной ошибкой, о которой "Компьюлента" сообщала недавно. Как сообщили нам в немецкой фирме Sentry-Labs, обнаружившей эту ошибку, из-за недоработки в системе сканирования Интернета (crawling engine), заполняющей используемую поисковиком базу данных, злоумышленник мог встроить в результаты, которые показывает поисковик, код HTML. Если на сервере используется php или SSI, это может оказаться очень опасно. Sentry-Labs написала в Lycos.com дважды; первое сообщение осталось без ответа, ответ на второе последовал лишь через месяц. Ещё на прошлой неделе на Lycos.com по-прежнему можно было наблюдать страницы, испорченные этой ошибкой (см. скриншот). К этому времени на русском "Лайкосе" она была уже устранена.

В то же время, по сведениям Sentry-Labs, пока остаются небольшие недочёты в системе вывода результатов поиска. Они имеют ту же природу, что и уже исправленная ошибка, но причинить кому-то вред уже не способны. Худшее, к чему они могут привести - это не совсем правильное отображение результатов вывода (например, название сайта на скриншоте справа звучит как W&LT). Очевидно, это ошибка тоже будет скоро исправлена.

Хотя официальное открытие lycos.ru уже состоялось, портал ещё будет подвергаться доработке, причём достаточно крупной - по некоторым сведениям, уже в этом году даже внешний вид его может радикально измениться, когда во всём европейском "Лайкосе" будет введён новый дизайн. И только после этого раскрутка портала пойдёт на полную.

Последние новости по теме:

Архив материалов
  «   Июль 2008   »  
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031