Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« май 2012  
пн вт ср чт пт сб вс
  3 4 5
8 9 10 12
14 18 20
22 24 25 26 27
28 29 30 31      

Робот для Невидимой сети

Вебпланета
| архивная статья | 18.08.2005 17:58

Как известно, открытая часть веба, доступная для роботов поисковых систем, составляет не более 25% от общего объема Сети. По некоторым оценкам — не более 1%. Индексация так называемой «невидимой» части — сложная проблема.

Всемирная сеть состоит из сотен миллиардов документов, что гораздо больше 8 или 20 млрд, входящих в индекс Yahoo и Google. Но основная их часть недоступна для поисковых роботов, потому что находится в запароленых частях сайтов и базах данных с динамически генерируемым контентом. Примеры таких БД — телефонные справочники, «желтые страницы», юридические базы данных, библиотечные каталоги и другие ресурсы с огромным количеством информации.

Небольшая американская компания Glenbrook Networks заявила о том, что нашла частичное решение этой проблемы. Они сейчас работают над программой, которая могла бы проникать в закрытые части сайтов и «доставать» оттуда недоступную информацию. Интеллектуальный поисковый робот Glenbrook Networks может автоматически заполнять анкеты, формы и поля запросов к базам данных, после чего способен принять информацию, полученную в ответ.

Возможности программы можно посмотреть на экспериментальном сайте Glendor, посвященном поиску работу. Для этого сайта робот собирает информацию в крупнейших американских базах по трудоустройству, а также с закрытых частей корпоративных сайтов. Для большего эффекта, все листинги наложены на географические карты Google Maps.

Компанию Glenbrook Networks основали студент университета Беркли Юлия Комиссарчик вместе со своим отцом — профессором математики Эдвардом Комиссарчиком, эмигрировавшие из России в 1990 г.

разделы:
Материалы по теме

Google и MSN меряются индексами

Другие

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2012 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost