Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июнь 2020  
пн вт ср чт пт сб вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
17.05.2005 13:50 | пишет лавренко | ссылка

вот это да. настоящая, качественная работа журналиста. денис, как вам удалось рамблер уговорить данные опубликовать? :-)

17.05.2005 20:27 | пишет Гость | ссылка

troff - сергей трофимовский? ;-)

17.05.2005 16:53 | пишет шутка | ссылка

предлагаю команде начать разработку дополнительных уникальных алгоритмов, которые сделают новый поисковик помимо самого умного и самого красивого еще и самым скромным :)

17.05.2005 18:26 | пишет лавренко | ссылка

шутка=troff? ;-)

17.05.2005 20:38 | пишет лавренко | ссылка

ну конечно :-) он мне всегда напоминает, что бы я не забывал всем напоминать, что я являюсь самым скромным на свете :-)

17.05.2005 22:20 | пишет sekir | ссылка

Именно 1’052’227’229 страницы. Не 1’052’227’228 и даже не 1’052’227’230.

На ВМК доверительные интервалы проходят? Погрешности измерения считать участники научного проекта умеют?

Виктор, не ходите в диссертационный совет с такими результатами. Выгнать могут.

17.05.2005 23:04 | пишет лавренко | ссылка

sekir, проходят, проходят :-) но мы же написали "примерно". а гугл и того не делает, пишет: Поиск среди 8 058 044 651 страниц -- не 8 058 044 650 и не 8 058 044 652 :-) хотя там при каждом поиске различные индексы задействуются (они там сильно задублированны и обновляются постепенно, а не все сразу), так что точное количество документов, по которым идет поиск, не просто постоянно меняется и никому, в т.ч. самим гугловцам, не известно, но и меняется от запроса к запросу. но ведь пишут с точностью до последнего знака! а мы чем хуже? :-)

18.05.2005 03:28 | пишет sheller | ссылка

рамблер считает нигма.ру конкуренцией?

18.05.2005 07:54 | пишет sekir | ссылка

Я читал их статьи и примерно знаю, как устроен google. Уверен, что число документов на момент времени t они в своей же собственной базе могут посчитать, а не примерно оценить.

nigma это примерно то же самое, что и google, тоже умный поисковик, но посчитать не может в принципе, так как базы нету.

Скажите заодно, откуда оценка в 20-30% документов, которые ни один поисковик не индексировал? Поисковики нашли для вас N, а вы знаете, сколько _на_самом_деле_ должны были найти? Вы ведь даже поленились скачать найденные поисковиками результаты.

18.05.2005 09:51 | пишет Игорь | ссылка

Как они могли бы скачать - миллиард документов? Для этого нужен кластер на десятки серверов. И инженеры поопытнее, чем студенты ВМиК. А если уж его построить, не нужен будет метапоиск, проще будет свою базу иметь и по ней искать. На своей базе гораздо больше "умных" штук можно сделать.

Ну что тут разоблачать Лавренко? Да, этот подсчет - это явная чушь, потолочная оценка. Прикинули хрен к носу, да и написали.
Но и цели не ставилось получить абсолютное знание. Это же чистый пиар, информационный повод, чтобы Нигму еще раз упомянули в прессе. Будьте снисходительны. Когда-то и Пунто так себя вел.

18.05.2005 09:56 | пишет Гугл | ссылка

> но ведь пишут с точностью до последнего знака! а мы чем хуже? :-)

Да пока всем хуже, в общем-то.

18.05.2005 10:19 | пишет Roofcat | ссылка

Гугель в своем праве - он искал среди 8 058 044 651 страниц, о чем пользователю и сообщил. Сделал измерение, данные с прибора считал и в табличку написал... А ваша-то публикация претендует на исследование, обработку эксприментальных данных. Не знаю как на ВмиК, а по соседству у физиков с такими результатами первокурсников с физпрака отправляют результаты переделывать :)

Так что насчет совета sekir прав.

18.05.2005 13:57 | пишет лавренко | ссылка

Roofcat, ну слушайте, мы ж не на диссертационном совете все-таки :-)

18.05.2005 14:00 | пишет лавренко | ссылка

> на момент времени t

вот именно -- на некоторый момент времени они *могут* остановить всю переиндексацию, обновление и проч. и посчитать точное число. но вот в момент, когда вы действительно что-то ищете, поиск происходит не по тому количеству страниц, о котором они пишут на главной странице.

18.05.2005 14:10 | пишет Seventh Son | ссылка

Не знаю точно, хотя догадываюсь, как устроены алгоритмы в нигмы, но Шабанову верю. Метапоиск может приблизительно оценить размер объединения документов из баз поисковых систем и вычесть пересечения, но погрешности вычислений будут достаточно большими (зеркала, неполная выборка из баз, ошибки в алгоритмах etc).

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost