Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июнь 2020  
пн вт ср чт пт сб вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
10.05.2006 12:11 | пишет Sergey Rudnyaev | ссылка

Игорь,
спасибо за замечания, обязательно учтем )))

кстати, редактора получают зарплату, и все вопросы касательно регламента можно обсудить на форуме.

10.05.2006 13:27 | пишет qq | ссылка

радакторА, может, и получают, а вот редакторЫ...

10.05.2006 13:41 | пишет mihun | ссылка

Дельный комментарий.

У Ашманова, как мне кажется, более интересная и перспективная модель. По той простой причине, что им есть что предложить своим партнерам.

В принципе, и в том и другом проекте значительная роль отводится редакторам. Но мне кажется, что модель Ашманова более "партнерская", скажем так. Во всяком случае, рулить собственным поисковичком намного интереснее, чем редактировать еще один каталог.

Я вполне себе представляю, как будет развиваться поиск АиП и не сомневаюсь, в данном случае, что Ашманов двигается в правильном направлении. imho.
А вот как будет развиваться adre, что в нем такого интересного, кроме как подтверждения того факта, что можно запустить собственный поиск с никаким бюджетом, я совсем не вижу. imho.

Единственное конкурентное преимущество adre.ru могло бы заключаться в открытых алгоритмах, в прозрачном ранжировании - это, собственно, и есть основная идея Nutch. Но они эту возможность сознательно отключили.

10.05.2006 14:05 | пишет Борис М | ссылка

Игорь спасибо за слова поддержки.

"Проект поисковика Тропа.ру вроде бы, по заявлению создателя Б.Моисеева, также должен опираться на сообщество экспертов, но пока посмотреть нечего."

Мне, при создании экспертно-поисковой системы tropa.ws (tropa.ru – это тестовый сайт), хотелось бы делать упор не на сообщество экспертов, а на свойства человеческого организма. Свойствах восприятия информации отдельными пользователями, Свойствах самоорганизующихся систем.
Эксперты это условное обозначение информационной единицы способной генерировать информацию и устанавливать связи. Если будет заложен механизм, в котором можно хранить информацию и устанавливать связи, то сообщество достаточно быстро самоорганизуется. Если пользователь сможет быстро и эффективно решить возникшую передним задачу с помощью Тропы, то он не сможет пользоваться существующими поисковыми машинами, поняв всю неэффективность их.
Я ставлю задачу по быстрому и эффективному нахождению решения проблем, возникающих в процессе жизни. Если я добьюсь этой задачи, то мой 1001 вариант поисковой машины будет № 1.
В том варианте, который выложен на tropa.ru я могу собирать информацию, хранить ее в удобном для меня виде и работать с нею.
То над чем я работаю в настоящий момент это написание второй части ТЗ, в которой я планирую заложить различные варианты существования сообществ, поиск по сообществам, и интеграцию новых сообществ в существующие.
И основным сдерживающим фактором моей работы это отсутствие финансирования. Если есть инвесторы, которым интересно данное направление, то добро пожаловать!!!!
Только представьте себе, что я имею шанс стать ведущей мировой информационной площадкой, что с помощью Тропы любые вызовы, брошенные человечеству, будут эффективно преодолеваться.
:) Теоретически будет заложен механизм, используя который прилетевшие инопланетяне смогут интегрироваться сообщество землян. И т.д.
Если данная тема интересна Планете веб, то могу с картинками рассказать, что и как будет.
Еще раз спасибо Игорю за упоминания моей работы!

10.05.2006 14:16 | пишет Юрка | ссылка

2Борис М
че курим? )

10.05.2006 14:21 | пишет Заур | ссылка

Вот объясните мне, тупому (или отошлите к статье соответствующей), почему поисковики не реализуют объектный поиск? Вот скажем пишу я в поле запроса "ООН", в 1-м выпадающем списке выбираю, что это "Название организации", а 2-м списке выбираю, что хочу найти "Сайт этой организации". И мне выдает на 1-м месте сайт ООН. Неужели это так сложно организовавать?

10.05.2006 14:47 | пишет Андрей Пасюнин | ссылка

Туго, очень туго... Такой поиск будет напрягать... Но реализовать его, как "улучшенный поиск" можно было бы..

10.05.2006 15:41 | пишет andy | ссылка

Поддержку социальных сетей нужно встраивать в браузер.
Браузер должен собирать небольшую статистику о посещаемых сайтах (время просмотра, глубина и тп.) и ананимно в зашифрованном виде передавать в открытую базу данных в свободный доступ.

10.05.2006 17:15 | пишет Михаил Маслов | ссылка

> Стоимость работы редакторов в конце концов влетает в копеечку. А если они - неоплачиваемые добровольцы, то встает острый вопрос о контроле и качестве их работы

Пока редакторы adre.ru не очень-то напрягаются -- существенная часть описаний ресурсов заимствованы из dmoz.org и yaca.yandex.ru. Что является прямым нарушением лицензий этих обоих ресурсов.

См. также комментарий Ильи Сегаловича в соседнем топике http://www.webplanet.ru/forum/news.html?news=10994

10.05.2006 17:24 | пишет Roman | ссылка

2 Борис М. помоему Ашманов Ваш проект не поддержал, а просто упомянул. и я Вам советуб почитать правила Ашманова -управление проектами . там есть Правило 5, которое гласит

"Правило 5. Программист испытывает страсть к обобщению.

Программист всегда всеми силами стремится сделать работу наиболее общим способом, чтобы потом только настраивать и прилаживать готовую систему. В этом - суть программирования и его сила.

И в этом же - серьезная угроза бизнесу. Если дать разработчику волю, разработка общей платформы отнимет 100% времени и денег, и продукт никогда не выйдет на рынок.

Поэтому программирование в наиболее общем виде нужно категорически запрещать. Верным признаком страсти к обобщению является планирование создания мощных ядер и наиболее общих платформ со сроками исполнения больше года.

Баланс между обобщением и текущими требованиями рынка достигается опытом и соображениями бизнеса. Программистам доверять здесь абсолютно бессмысленно, как бессмысленно обсуждать с пьяницей семейный бюджет."

Я думаю что ваш проект сверх обобщен, если вы планируете делать интеграцию для инопланетян :).

10.05.2006 17:48 | пишет Roman | ссылка

У dmoz.org в верхнем правом углу написано "In partneship with AOL.Search", такчто да же толпа бесплатных редакторов не спасает от нехватки финансирования, а если за это еще и платить, то вообще непонятно откуда взять денег на содержание? а ведь самое дорогое это распеарить проект. гугл с его мегаресурсами пока не может победить яндекс в рунете, а вот adre шапками похоже всех закидать решил :).

10.05.2006 18:44 | пишет Jack | ссылка

Есть идеи, есть концепции, есть некоторые попытки хоть что-то сделать.

Но пока нет главного - хотя бы одного реального готового проекта, которым все могли бы с удовольствием пользоваться.

Хотя есть надежда, что рано или поздно, кто-то все равно в этом деле добьётся успеха.

10.05.2006 19:11 | пишет Борис М | ссылка

2 Юрка

че курим? )

:) я не курю!

2 Roman, любое упоминание это уже событие. За него и спасибо!

"Я думаю что ваш проект сверх обобщен, если вы планируете делать интеграцию для инопланетян :)."

:) речь идет о системе, к которой могут подключиться любые сообщества. Представь себе проект "Территория" со встроенным поисковиком! Там сообщества делятся на гильдии. У каждой свои ценности, лидеры и аутсайдеры. Им важно иметь на первых местах в результатах выдачи те ссылки, которыми они дорожат, в моем это организовать не проблема!.

А насчет програмистов на 100% согласен. Вторую часть пока сам торможу... есть причины.
А первой сам пользуюсь... правда ее подправить немного нужно...

10.05.2006 19:12 | пишет uni | ссылка

Кстати Игорь, я попробовал Ваш персональный поиск, запросы выполняются за неприемлимое время в принципе.

Пробовал искать на разных поисковиках и разное, в среднем около 10 секунд.

В общем никуда не годится.

10.05.2006 19:36 | пишет Ашманов | ссылка

Ну, это же бета, всё ж таки.
Да, там есть проблема. Но это не проблема скорости поиска, это проблема загрузки, то есть скорости первого запроса.
Вы ведь давали запрос, переходили к следующему поисковику, снова давали запрос и так далее, верно?
Первый раз всё поисковое хозяйство грузится для конкретного поисковика долго, над этим работаем, скоро поправим.
Если тут же тому же поиску давать второй и третий запрос (тот же или любые другие запросы), то должно быть уже быстро.
Замечу, что у клиента этого, конечно, не должно быть видно, если поисков хотя бы несколько десятков в день.

P.S. А их может быть много, кстати. Мы ещё не выкатили статистику для всех авторов поисковиков (сделаем в июне, надеюсь), но я видел, как тут для кого-то по запросу высылали её почтой, там за месяц 13,000 запросов. Это довольно много для одного из рядовых поисковиков, только что сделанных. Им всем не больше месяца, по сути.

10.05.2006 20:01 | пишет uni | ссылка

Пошел специально загрузил отдельный поисковик (его уже сегодня пробовал) ввел 3 запроса подряд дожидаясь ответа полного от каждого. Результат - 10-15 секунд. При том, что я искал даже не сложный запрос.

А какой объем документов которые вы проиндексировали?

10.05.2006 20:37 | пишет Ашманов | ссылка

А объём не имеет отношения к делу - ведь на каждый сайт свой отдельный индекс, он же всегда не больше 1 Гбайта.
Там проблема, видимо, не в этом. Я такого эффекта почему-то не могу увидеть. Грузится действительно долго, но потом летает. А на каком поисковике тормозит?

10.05.2006 21:11 | пишет uni | ссылка

http://public.novoteka.ru/medequip?query=%EA%E0%F2%E0%EB%EE%E3

вот тут. вообще такое ощущение что вы используется ммапнутые деревья для каждого поисковика свои и в этом и кроется проблема.

10.05.2006 21:57 | пишет Alex Tutubalin | ссылка

mmap-нутых деревьев мы точно не используем.

Продемонстрирована проблема с индексацией обвязки сайта - этот несчастный "каталог" вылез из левого меню, а пользователь снял галку "группировать по
сайтам"

Аналогичный результат достигается, если поискать слово из обвязки по одному сайту любым поисковиком:
http://www.webalta.ru/search?q=nginx+site%3Awww.lexa.ru
http://www.yandex.ru/yandsearch?text=nginx-ru&pag=u&surl=lexa.ru

Проблема нам известна, мы в-общем знаем как ее побороть (автоматически удалить навигацию при индексировании), но пока только в виде работающего прототипа.

10.05.2006 22:21 | пишет Дятелл | ссылка

2 Заур - я реализовал объектный поиск, пока только по "тэгам", довольно ресурсоёмкая штука, и к ней очень трудно сделать удобный и одновремемнно понятный интерфейс. В принципе, к "не совсем понятному" пользователи довольно быстро привыкают...

Работает как раз по принципу уточнения запроса, Заодно объектная модель закрыла проблему с рубрикатором.

10.05.2006 23:40 | пишет Гость | ссылка

Скоро один такой экспертный поиск всех сделает. Тихо, мирно, вы и сами не заметите.

10.05.2006 23:46 | пишет Заур | ссылка

А это где-то посмотреть можно?

10.05.2006 23:51 | пишет Roman | ссылка

2 Jack "Но пока нет главного - хотя бы одного реального готового проекта, которым все могли бы с удовольствием пользоваться."
Это происходит сплошь и рядом. как говорил товарищь Суворов : гладко было на бумаге, да забыли про овраги.
По моему в поисковом бизнеси, как и на войне, сила за танковыми дивизиями тоесть за количеством серверов, количеством рекламы, количеством девелоперов, количеством манагерв разного звена, если у вас конечно нет атомной бомбы :) (когда я пишу про количество я не забываю и про качество конечно)

10.05.2006 23:57 | пишет Roman | ссылка

Какойто аноним готовит атомноую бомбу в поиске :). если ничего не выйдет то никто и не вспмнит его слова, а если выйдет то он скажет - вот я же говори я же говорил.

2Заур если бы это можно было посмотреть то уважаемый аноним уже бы скинул сылочку.

11.05.2006 02:05 | пишет alex | ссылка

Не работает..

Fatal error: Call to undefined function: mb_convert_encoding() in /home/adreru/public_html/poisk.php on line 9

11.05.2006 10:31 | пишет Дятелл | ссылка

2 Roman: какая бомба, что вы... это весьма давно известная штука, масса народу копает в этом направлении. Ссылку не оставил т.к. сайт не поисковый а коммерческий - это же реклама будет, не знаю, разрешено это здесь или нет. Обращайтесь в почту, пожалуйста.

11.05.2006 10:40 | пишет AlexA | ссылка

2Ашманов
> ...на каждый сайт свой отдельный индекс, он же всегда не больше 1 Гбайта.
Игорь, может, все-таки не на каждый сайт, а на каждый поиск?
И потом, неужто у вас нет глобального индекса? Вроде проще все слить и побить по серверам. Тогда проблемы с первым запуском не будет. А удаленные из поиска сайты просто ставить во временный стоп-лист, убирая при переиндексации.

11.05.2006 11:27 | пишет Считай, что тестер | ссылка

Fatal error: Call to undefined function: mb_convert_encoding() in /home/adreru/public_html/poisk.php on line 9

11.05.2006 11:36 | пишет uni | ссылка

Alex Tutubalin честно говоря не совсем понял Вашу фразу. Нам вообще говоря все равно как схлопывать и расхлопывать, тоесть это в любом случае делается менее чем за секунду или около того.

Просто сложилось впечатление, что когда идет первое обращение к какому-то поисковику у Вас, то Вы подчитываете для него список с диска, поэтому и получается долго. Вот собственно вопрос был в том, то почему бы не создать общий список и там задавать уже критерии выборки. Ведь даже в персональном поиске люди могут задавать пересекающиеся сайты и придется делать двойную работу.

Если я ошибаюсь, то извините, это моя догадка :)

11.05.2006 14:17 | пишет Алексей Иванов | ссылка

Да, торможения бывают, но связаны они главным образом с внутренней инфраструктурой проекта: бывают наплывы нагрузки: как поисковой так и индексно-построительной, бывают и проблемы с коннективити датацентра.

Как справедливо написал Игорь - на то и бета, чтобы все эти инфраструктурные вопросы аккуратно порешать. Вот сегодня я особых проблем с повторными поисками не вижу, в том числе и по упомянутому запросу.

В ближайших планах - укрепление материальной базы проекта (гм, про "танковые дивизии" верно замечено) ну и улучшение балансировки нагрузки, чтобы локальных торможений не случалось более, никто ж не спорит, что время поиска, в том числе и первого не должно превышать комфортной секунды.

Что касается внутреннего устройства наших машинок - мы их пока не готовы обсуждать, работ там довольно много, и меняться еще будет - тоже многое.

11.05.2006 14:22 | пишет Jack | ссылка

to Roman

"По моему в поисковом бизнеси, как и на войне, сила за танковыми дивизиями..."

"Атомная бомба" - это и есть свежая идея и принципиально иная концепция ПОИСКА, а все то что Вы называете "танковыми дивизиями" уже вторично.

Иначе говоря, без "Атомной бомбы" нет победы, т.е. нет качественного поиска, который мог бы удовлетворить всех.

11.05.2006 16:32 | пишет Dim | ссылка

Про танковые дивизии:
Давайте цитировать верно:
"Бог - на стороне больших батальонов"
(с) Наполеон Боннапарт
:-)

11.05.2006 17:20 | пишет Roman | ссылка

2 Jack. какая бы свежая идея у вас не была все равно что бы просто собрать и сложить всю информацию из инетренета сейчас необходимо сотни тысч серверов. и количество информации с бешенной скоростью растет. да вся надежда на тэги и вэб 2.0 :)
но прорыв обязательно случится! но он будет в другом месте. прорыв будет в оптических носителях информации и в скоростях обмена ею.
я думаю прорыв будет когда весь сегодняшний интернет можно будет сохранить на одном оптическом носителе стандарной персоналки.

11.05.2006 17:33 | пишет Roman | ссылка

Шахматные алгоритмы за 20 лет не претерпели существенных изменений. компьютер обыграл человека только благодаря росту производительности.
тоже самое произойдет с поиском в ближайшие 10-15 лет, резкое улучшение поиска произойдет только за счет роста производительности компьютерного оборудования.
господин Ашманов лучше всех знает, что наступает такой момент(при создании ИИ), когда, чтбы улучшить систему на 1% необходимо затратить средств больше в несколько раз чем на создание самой системы.

11.05.2006 17:48 | пишет Glavniy | ссылка

всё это херня-лучший поиск у систем где результаты выводятся в виде облака а не списка

12.05.2006 12:23 | пишет Николай | ссылка

"В проектах, связанных с использованием тэгов (типа Delicious) эту проблему решили с помощью фактического отсутствия рубрикатора - тэги насыпаются внавалку, мешками, и помогают при поиске, но не задают жесткой иерархии. ... Это снижает полноту поиска, но снимает проблему непрозрачности."

Странно, глядя на каталог lermont.ru, где используются теги, а не древовидные рубрики, можно сделать как раз обратный вывод - использование тегов снимает(или минимизирует) проблему непрозрачности, а полнота поиска она в стороне - это родовая проблема всего, что отобрано руками.

20.05.2006 10:05 | пишет Ашманов | ссылка

Так вы прочитайте внимательно: я и говорю, что иерархические рубрикаторы создают проблему непрозрачности.

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost