Искусственный интеллект в поиске

Пол Крилл (Paul Krill), PC World

≡ Ноу-хау | 05.08.2008 05:58

Искусственный интеллект может улучшить качество поиска в Интернете, но на пути к этому все еще полно препятствий – на этом акцентировал внимание главный докладчик технической конференции, проведенной в июле корпорацией IBM.

Конференция называлась "Новый искусственный интеллект – новые приемы использования компьютеров" и проходила в исследовательском центре IBM в Сан-Хосе (США). Основой конференции стало выступление Орена Эциони (Oren Etzioni), директора Центра имени Тьюринга в Вашингтонском университете. Однако было представлено и множество других проектов, связанных с усовершенствованием вычислительных машин.

Г-н Эциони делает особый упор на улучшенный поиск в Интернете: "В течение следующих пяти лет мы увидим появление нового поколения поисковых систем, основанных на технологиях вроде Open IE (Information Extraction – извлечение информации)". Он уточнил, что Open IE включает в себя алгоритмы для разбора фраз на логические выражения, причем эти алгоритмы могут применяться к любым текстам, содержащимся в сети.

Исследователь рассказал о работе над технологией "умного" интерфейса Softbot. Однако, он отметил и проблемы, связанные с этим проектом. Например, Softbot может неверно интерпретировать запрос и удалить нужный файл вместо старых логов на сервере. Эциони провел аналогию – Softbot, находясь в поисках молока, мог бы купить не только молоко, но заодно и луг (как это случилось с героем юмористического мультика "Дунсбери").

Несмотря на все проблемы, технологии по улучшению поиска развиваются, говорит Эциони. Среди них - технологии семантической трактовки, с которыми машина может распознать простые предложения, а также технологии прояснения тех диалогов, которые могут иметь двойные значения.

Для "общения" с системами искусственного интеллекта вроде Softbot были выбраны естественные языки, но при этом требуется и надежность технологии, отмечает Эциони. Он упомянул проекты, придерживающиеся того же принципа – KnowItAll, суть которого в извлечении высококачественной информации из текста веб-страниц; TextRunner, цель которого сделать извлечение информации открытым и на его основе создать массивную базу знаний для искусственного интеллекта.

Организатор конференции призвал избегать термина "искусственный интеллект". "Это понятие вышло из моды. Уже не услышишь ничего об экспертных системах", - жалуется Стефан Нассер (Stefan Nusser), старший менеджер отделения IBM User Systems & Experience Research, - "Но именно сейчас все эти технологии как бы вспоминаются заново".

На мероприятии было представлено несколько проектов в области искусственного интеллекта и областей обучения машин. Среди них:

- Использование искусственного интеллекта для выявления интересных суждений (Using AI to Identify Interesting Assertions). В этом исследовании Вашингтонского университета обучение машины совмещается с человеческими расчетами для того, чтобы определить, какие именно суждения, извлеченные из Сети, наиболее интересны. Используется инструмент TextRunner, а также сайты с механизмами создания контента вроде Wikipedia.

- Визуализация данных и непрерывные интерфейсы (Data Visualizations and Continuous Interfaces). Этот проект Yahoo! представляет собой различные приложения для визуализации сложных данных вроде воздушных путей Федерального авиационного агентства США (FAA).

- Изучение препятствий для разработчика в проведении статистического обучения машины (Examining Obstacles to Software Developer Adoption of Statistical Machine Learning). Этот проект Вашингтонского университета и корпорации Intel включает в себя исследования, которые должны стать основой разработки утилит, призванных облегчить разработчикам ПО применение в своих приложениях методов статистического обучения машины.

- CueFlik: концепция интерактивного обучения при поиске изображений (Interactive Concept Learning in Image Search). Программа спонсируется Вашингтонским университетом и корпорацией Microsoft, в ее основе – приложение для поиска картинок в Сети, позволяющее пользователям разработать правила для переоценки изображений согласно их визуальным характеристикам.

- На пути к PR2: персонализированная платформа для создания роботов (Towards PR2: A Personalized Robot Platform). Частная лаборатория Willow Garage пытается создать программную и аппаратную платформу для роботов, которые делают работу для людей и в окружении людей. В сотрудничестве со Стэндфорским университетом также разрабатывается открытая операционная система для роботов.

- SparTag.us: система маркировки низкой стоимости для извлечения веб-контента (A Low Cost Tagging System for Foraging of Web Content). Исследовательский центр Пало-Альто (Palo Alto Research Center, PARC) разрабатывает новую систему оценки с использованием техники "Click2Tag", чтобы обеспечить недорогую маркировку веб-контента. Пользователи могут выделять куски текста и собирать отмеченные тэгами или просто выделенные ранее параграфы в "блокнот", который затем можно просмотреть и что-то в нем поискать.

- WikiDashboard: социальная прозрачность и визуализация для "Википедии" (Social Transparency and Visualization for Wikipedia). Также проект PARC, где разрабатывается инструмент для анализа, с помощью которого должна увеличиться социальная прозрачность и отслеживаемость статей в "Википедии".

- Реагирующее зеркало: "умная" примерочная кабина с информацией от нескольких камер (An Intelligent Fitting Room Using Multi-Camera Perception). Здесь сотрудники PARC собираются сделать систему для примерочных кабинок в торговых залах, производящую онлайновое социальное сравнение моды, основанное на информации от нескольких установленных в кабинке камер.

- Magitti: мобильные рекомендации для отдыха (Mobile Recommendations for Leisure Activities). Система, разработанная PARC, использует контекстный фильтр, чтобы сузить перегруженный график различных развлекательных событий в крупных городах. Система судит об интересах и предлагает развлечения по моделям, выученным на основе личности пользователя и анализе его поведения.

- "Умный" e-mail: предсказание ответа и приложения к письму (Intelligent E-mail: Reply and Attachment Prediction). Пенсильванский университет предлагает усовершенствованные интерфейсы для электронной почты, призванные уменьшить стресс от избытка переписки.

- Управляемые моделями коннекторы контента и веб-интеллект. (Model-driven Content Connectors and Web Intelligence. Consider the Source). Попытка IBM делать предсказания насчет релевантного контента и того, что может быть достижимым для интеллектуальной навигационной системы. Здесь используется объединенный язык моделирования (Unified Modeling Language) для создания связей между целями, объектами и типами контента.

- AALIM: помощь для кардиологов в постановке диагнозов (Diagnostic Decision Support for Cardiologists). Эта система IBM предназначена для того, чтобы идентифицировать одинаковые записи в истории болезни пациентов и помогать в постановке диагнозов.

- CoScripter: веб-программирование путем демонстрации (Programming the Web by Demonstration). Принадлежащий IBM проект (выполненный в виде плагина для Firefox) включает в себя систему для записи, автоматизации и разделения процессов, выполняемых браузером. Повторяющиеся действия автоматизируются.

- Highlight: приведение к мобильному виду существующих сайтов (Mobilizing Existing Web Sites). Это проект IBM позволяет пользователям создавать мобильные версии существующих в Сети сайтов, которые будут настроены под их цели и устройства.

- ShapeWriter: интеллектуальное распознавание ввода (Intelligent Gesture Input). Здесь IBM пытается создать продвинутый инструмент ввода текста для мобильных устройств, способный с помощью статистического анализа распознать вводимое пользователем слово в реальном времени, как только он начнет тыкать стилусом по экрану.

- CALO Express (Когнитивный ассистент, который обучается и самоорганизуется, Cognitive Assistant that Learns and Organizes). Это Windows-версия проекта CALO компании SRI International для создания интеллектуального персонального помощника. К примеру, он может проанализировать RSS-потоки и посоветовать новые.

Источник – PC World, перевод - Александр Рыбаков.

комментарии (5) |

разделы: Ноу-хау | Сервисы