troff - сергей трофимовский? ;-)
РАЗДЕЛЫ
Архив
|
17.05.2005 20:27 | пишет Гость | ссылка
troff - сергей трофимовский? ;-) 17.05.2005 16:53 | пишет шутка | ссылка
предлагаю команде начать разработку дополнительных уникальных алгоритмов, которые сделают новый поисковик помимо самого умного и самого красивого еще и самым скромным :) 17.05.2005 18:26 | пишет лавренко | ссылка
шутка=troff? ;-) 17.05.2005 20:38 | пишет лавренко | ссылка
ну конечно :-) он мне всегда напоминает, что бы я не забывал всем напоминать, что я являюсь самым скромным на свете :-) 17.05.2005 22:20 | пишет sekir | ссылка
Именно 1’052’227’229 страницы. Не 1’052’227’228 и даже не 1’052’227’230. На ВМК доверительные интервалы проходят? Погрешности измерения считать участники научного проекта умеют? Виктор, не ходите в диссертационный совет с такими результатами. Выгнать могут. 17.05.2005 23:04 | пишет лавренко | ссылка
sekir, проходят, проходят :-) но мы же написали "примерно". а гугл и того не делает, пишет: Поиск среди 8 058 044 651 страниц -- не 8 058 044 650 и не 8 058 044 652 :-) хотя там при каждом поиске различные индексы задействуются (они там сильно задублированны и обновляются постепенно, а не все сразу), так что точное количество документов, по которым идет поиск, не просто постоянно меняется и никому, в т.ч. самим гугловцам, не известно, но и меняется от запроса к запросу. но ведь пишут с точностью до последнего знака! а мы чем хуже? :-) 18.05.2005 03:28 | пишет sheller | ссылка
рамблер считает нигма.ру конкуренцией? 18.05.2005 07:54 | пишет sekir | ссылка
Я читал их статьи и примерно знаю, как устроен google. Уверен, что число документов на момент времени t они в своей же собственной базе могут посчитать, а не примерно оценить. nigma это примерно то же самое, что и google, тоже умный поисковик, но посчитать не может в принципе, так как базы нету. Скажите заодно, откуда оценка в 20-30% документов, которые ни один поисковик не индексировал? Поисковики нашли для вас N, а вы знаете, сколько _на_самом_деле_ должны были найти? Вы ведь даже поленились скачать найденные поисковиками результаты. 18.05.2005 09:51 | пишет Игорь | ссылка
Как они могли бы скачать - миллиард документов? Для этого нужен кластер на десятки серверов. И инженеры поопытнее, чем студенты ВМиК. А если уж его построить, не нужен будет метапоиск, проще будет свою базу иметь и по ней искать. На своей базе гораздо больше "умных" штук можно сделать. Ну что тут разоблачать Лавренко? Да, этот подсчет - это явная чушь, потолочная оценка. Прикинули хрен к носу, да и написали. 18.05.2005 09:56 | пишет Гугл | ссылка
> но ведь пишут с точностью до последнего знака! а мы чем хуже? :-) Да пока всем хуже, в общем-то. 18.05.2005 10:19 | пишет Roofcat | ссылка
Гугель в своем праве - он искал среди 8 058 044 651 страниц, о чем пользователю и сообщил. Сделал измерение, данные с прибора считал и в табличку написал... А ваша-то публикация претендует на исследование, обработку эксприментальных данных. Не знаю как на ВмиК, а по соседству у физиков с такими результатами первокурсников с физпрака отправляют результаты переделывать :) Так что насчет совета sekir прав. 18.05.2005 13:57 | пишет лавренко | ссылка
Roofcat, ну слушайте, мы ж не на диссертационном совете все-таки :-) 18.05.2005 14:00 | пишет лавренко | ссылка
> на момент времени t вот именно -- на некоторый момент времени они *могут* остановить всю переиндексацию, обновление и проч. и посчитать точное число. но вот в момент, когда вы действительно что-то ищете, поиск происходит не по тому количеству страниц, о котором они пишут на главной странице. 18.05.2005 14:10 | пишет Seventh Son | ссылка
Не знаю точно, хотя догадываюсь, как устроены алгоритмы в нигмы, но Шабанову верю. Метапоиск может приблизительно оценить размер объединения документов из баз поисковых систем и вычесть пересечения, но погрешности вычислений будут достаточно большими (зеркала, неполная выборка из баз, ошибки в алгоритмах etc). |
Последние комментарии
Гость про Суд велел "Твиттеру" сдать сторонников WikiLeaks (12)
Гость про Книгоиздатели начали судиться с торрентами (2)
l_e_x_a про "ВКонтакте" принудительно протестирует пользователей (35)
andrey_kadetov про Google назвал Facebook "ловушкой без выхода" (6)
volv про День папуасского робошахтёра (14)
l_e_x_a про Русские кликботы признаны самыми активными (11)
looli спрашивает: Земля вампиров смотреть онлайн в HD качестве looli спрашивает: Зеленый Фонарь смотреть онлайн в HD качестве looli спрашивает: Защитник смотреть онлайн в HD качестве looli спрашивает: Запретная зона смотреть онлайн в HD качестве looli спрашивает: Закон доблести смотреть онлайн в HD качестве looli спрашивает: Вышибала смотреть онлайн в HD качестве looli спрашивает: Встречный ветер смотреть онлайн в HD качестве looli спрашивает: Все любят китов смотреть онлайн в HD качестве |
Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.
вот это да. настоящая, качественная работа журналиста. денис, как вам удалось рамблер уговорить данные опубликовать? :-)