|
РАЗДЕЛЫ
Архив
|
"Яндекс" научился искать "в реальном времени""Яндекс" о запуске робота "Orange Crawler" и "Real-Time поиска". По заверениям разработчиков, новинки дают возможность индексировать новые документы в считанные минуты. Однако, как оказалось, на практике это не совсем так. Собственно, так называемый "быстрый робот" работал у "Яндекса" уже несколько лет, но минимальная задержка все равно составляла более 20 минут и была неустранимой. С "Orange Crawler" и "Real-Time поиском", разработанными в калифорнийском отделении компании, подобные задержки как бы должны кануть в Лету. "Orange познает ссылочную структуру интернета. Для этого ему достаточно скачивать и переобходить только часть "старых" страниц — хоть и достаточно большую, - поясняют разработчики. - Полученные знания позволяют Orange обнаруживать почти все новые страницы, выбирать из огромного их количества все хоть сколько-нибудь интересные и мгновенно рассчитывать для них ссылочные факторы ранжирования. Вслед за роботом Orange документы обрабатывает Real-Time поиск — он подхватывает выбранные документы, индексирует их и за секунды выкладывает на поиск." Поскольку рунетчики уже давно выработали стойкое критическое отношение к любой громкой презентации такого плана, "разоблачения черной магии" не пришлось ждать долго. Блогеры "Хабрахабра" просто-напросто попытались воспользоваться поиском "Яндекса", чтобы найти хотя бы тот же пресс-релиз о "поиске в реальном времени". Однако в выдаче ни оригинального пресс-релиза, ни его копии на "Хабрахабре" (и то, и другое сообщение появились в результатах поиска лишь через 40-50 минут). А вот в результатах поиска "Google" эти публикации почти моментально. Впрочем, в официальной публикации о новинке есть небезынтересная оговорка: "Новый апельсиновый робот не прокачивает все страницы интернета, а извлекает из него свежий и сочный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией". Из чего следует, что страницы с никому не нужной информацией индексируются в последнюю очередь, что, по-видимому, и объясняет, почему пресс-релиз о "поиске в реальном времени" попал в выдачу с опозданием. комментарии(1) | Материалы по теме "Яндекс" и "Рамблер" показали детям кисок Другие новости |
Последние комментарии
Гость про Free-lance.ru: "Крупные заказчики созрели" (9)
Гость про Принцип Питера 2.0 (72)
Некропостер про Навальный дискредитирует себя контролерами (63)
Гость про Детское порно не умрет без стукачей (124)
Гость про "Вконтакте" три раза за месяц отказался от инвестиций (65)
Корочун про "Флибусту" закрыли копирасты (39)
Гость про Рунет урезали на 250 детских порно-сайтов (2)
Гость про "Газета.Ру" получила дизайн от Лебедева (17)
все комментарии Гость отвечает: Мамба - мошенники?! Гость отвечает: Что за формат ДВД-дисков xgd3? Боргин отвечает: Как создать браузерную игру? Гость отвечает: Как создать онлайн игру? Милая Мила отвечает: Как вконтакте можно ограничить доступ к своей странице? Гость отвечает: я не могу зайти на сайт в контакте и одноклассники Гость отвечает: Что нужно для создания торрент-сервера? Гость отвечает: Почему Gmail пишет Bad Request? akram4018 отвечает: Не могу зайти в однокласники выдает-Валидация аккаунта Гость отвечает: Нужна ли отдельная социальная сеть города? Пример www.navoi.net |
Copyright © 2001-2012 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.