РАЗДЕЛЫ
Архив
|
В МГУ родилась поисковая система Nigma.RuВебпланета ≡ Архив | архивная статья | 12.04.2005 14:54 Научный коллектив, состоящий из студентов и аспирантов факультетов ВМиК и психологии МГУ им.М. В. Ломоносова, разработал поисковая система Nigma.Ru, которая была официально запущена в статусе Несмотря на то, что работы над поисковой системой продолжаются лишь 2,5 месяца, членами команды уже разработаны оригинальные алгоритмы ранжирования результатов, полученных от набора поисковых систем, с поддержкой русской морфологии и двухуровневая кластеризация. Морфология реализована через отсылку в поисковые системы дублирующих запросов, в которых приведены все распространенные морфологические формы запрашиваемых слов. При этом, в отличие от имеющихся реализаций русской морфологии для поисковых систем, предлагаемый алгоритм не сокращает, а наоборот — увеличивает количество найденных документов, т.к. морфологически измененный запрос объединяется с исходным. Релевантность также увеличивается, т.к. используются специальные алгоритмы объединения результатов. Позиция найденной ссылки в результатах поиска отображается в виде «Поисковая система: позиция» (например, «Google: 5» означает, что ссылка находится на пятом месте в поисковой системе Google), а ссылки от морфологически измененных запросов — в виде «Поисковая Результаты поиска объединяются с помощью специального алгоритма, причем только те результаты, которые Nigma.Ru успевает получить от поисковых систем за 1,5 секунды (в очень редких случаях — за 5 секунд). Соответственно, алгоритм не выделяет В итоге, на подавляющее большинство поисковых запросов Nigma.Ru выдает на порядок больше найденных сайтов, чем, например, при простом поиске на сайте Google.Ru. Для того, чтобы пользователь не запутался в этих результатах, они группируются в так называемые «кластеры». Каждый кластер — это группа сайтов, относящихся, по мнению поисковой системы, к общей тематике. Научная группа решила использовать частотную кластеризацию по ключевым словам, поэтому названия кластеров — это тоже ключевые слова, которые пользователь может использовать для расширения своего запроса. В свою очередь, т.к. количество найденных кластеров также зачастую очень велико, интеллектуальный алгоритм объединяет кластеры в иерархию (пока — двухуровневую), которая позволяет представить их в более компактном виде. Например, введя очень общий запрос «новости», на который поисковая система Nigma.Ru выдает порядка полумиллиарда документов, в левой колонке вы видите самые популярные темы новостей, которые встречаются в интернете. Нажав на тему (например, «спорт»), вы получите примеры новостных ресурсов, которые освещают эту тему. Если вы хотите получить больше ресурсов о новостях спорта, нужно нажать на «Расширить запрос» — тогда система выдаст более двух миллионов ссылок о новостях спорта. Они, в свою очередь, тоже отклассифицированы по темам — есть футбол, хоккей и т.п. Работа научной группы в части кластеризующих алгоритмов находится в начальной стадии, и ее участники планируют продолжать ее совершенствование. В ближайшее время поисковая система будет расширена экспертными системами, психологическими тестами, системами поведенческого анализа, и другими методами, базирующимися на таких алгоритмах искусственного интеллекта как искусственные нейронные сети, генетические алгоритмы, алгоритмы нечеткой логики и т.п. Исследования группы имеют научный характер, поэтому, после того как будет создана стабильная версия кода, планируется опубликовать его исходные тексты. комментарии(38) разделы: Архив Материалы по теме
Другие |
Последние комментарии
Гость про Суд велел "Твиттеру" сдать сторонников WikiLeaks (12)
Гость про Книгоиздатели начали судиться с торрентами (2)
l_e_x_a про "ВКонтакте" принудительно протестирует пользователей (35)
andrey_kadetov про Google назвал Facebook "ловушкой без выхода" (6)
volv про День папуасского робошахтёра (14)
l_e_x_a про Русские кликботы признаны самыми активными (11)
все комментарии looli спрашивает: Земля вампиров смотреть онлайн в HD качестве looli спрашивает: Зеленый Фонарь смотреть онлайн в HD качестве looli спрашивает: Защитник смотреть онлайн в HD качестве looli спрашивает: Запретная зона смотреть онлайн в HD качестве looli спрашивает: Закон доблести смотреть онлайн в HD качестве looli спрашивает: Вышибала смотреть онлайн в HD качестве looli спрашивает: Встречный ветер смотреть онлайн в HD качестве looli спрашивает: Все любят китов смотреть онлайн в HD качестве |
Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.