Профессиональный поиск в Интернете
Шрифт:
Стоит признать, что потенциал у таких поисковиков действительно большой, однако в настоящее время в данных системах реализованы далеко не все возможные семантические технологии, по сути своей, сейчас они только помогают выделить ключевые слова из свободно построенных фраз и подобрать дополнительные словоформы для составления корректного поискового запроса.
Визуальные поисковые системы действуют на стыке областей собственно интернет-поиска и анализа данных. Не случайно в них широко применяются технологии кластеризации данных. Самые полезные и инновационные системы такого плана – Quintura и AllPlus. Обе эти системы можно рекомендовать широкому кругу пользователей.
Глава 5
Рекомендательные машины
Эпоха «социального Web 2.0» открыла новую ипостась интернет-поиска. Появились поисковые сервисы, по-английски метко названные «Discovery Engines», то есть «машины открытий». Наиболее распространенный вариант перевода этого названия на русский язык – рекомендательные сервисы. Обычные поисковики способны работать только по прямому запросу пользователя и обладают ограниченными возможностями его уточнения. Запросы на рекомендательных машинах работают по принципу анализа ассоциативных связей. Проанализировав тем или иным способом предоставленную пользователем информацию о его вкусах или потребностях, такие машины автоматически подбирают подходящие предложения из своих баз. Метод поиска, основанный на сборе подобной статистики и применении статистических методов анализа, принято называть «коллаборативной фильтрацией». Рекомендательные машины без преувеличения являются одним из самых полезных классов поисковых приложений Web 2.0.
Рекомендательная функция современных интернет-сервисов становится все более выраженной. Инструменты автоматической рекомендации доступны на значительном количестве мультимедиа-хостингов, а также являются частыми гостями интернет-магазинов. Однако используемые в таких проектах алгоритмы достаточно просты и редко могут похвастаться точными попаданиями. В то же время существует ряд сервисов, для которых рекомендации – это основная специализация. Именно такие решения рассмотрены в данной главе.
Рекомендательные машины можно разделить на два типа: универсальные и тематические. На универсальных ресурсах можно искать и получать рекомендации не только по выбору книг или фильмов, но и музыки, подарков, телепередач, сайтов и других объектов. Тематические рекомендательные машины, как правило, сосредотачиваются на каком-либо одном виде контента. Здесь рассмотрены лучшие представители этих направлений. Примером универсального ресурса выступает крупнейший российский проект рекомендательного плана Imhonet. Тематические проекты представлены сервисами, работающими с музыкой, видео и веб-сайтами.
Imhonet
Информацию, необходимую для расчета рекомендаций, система получает социальными методами. Каждому новому пользователю Imhonet предлагается выставлять оценки предлагаемым объектам. Как только накапливается некий необходимый минимум оценок, пользователь начинает получать рассчитанные именно для него рекомендации и прогнозы.
Чтобы пользоваться рекомендациями можно было как можно скорее, уже в ходе регистрации аккаунта Imhonet предлагается оценить два десятка книг, фильмов и подарков. За счет продуманного интерфейса (на странице выводится сразу шесть объектов, а новые подгружаются по мере оценивания), этот процесс проходит на редкость быстро.
Наиболее качественно на Imhonet реализована работа с фильмами и книгами. Для определения оценок по десятибалльной шкале предлагается весьма функциональная панель. На ее вкладке. Детализированная оценка можно оценить до десятка отдельных характеристик фильма или книги, а также указать, насколько давно состоялось знакомство с оцениваемым произведением. Кроме того, оценку можно пометить как знаковую, которая будет иметь при расчете будущих рекомендаций максимальный вес, а также как неактуальную. При наведении указателя мыши на любой пункт оценки всплывают подсказки со словесной характеристикой, что в определенной степени способствует унификации оценок различных пользователей (рис. 5.1).
Рис. 5.1. Универсальный рекомендательный сервис Imhonet
Список рекомендаций каждого тематического раздела имеет собственные варианты настройки. Так, например, для фильмов можно указать временной промежуток их выхода, жанр, минимальный средний балл рекомендуемых произведений и минимальное количество рекомендующих их пользователей. Любопытно, что предлагается также фильтр, с помощью которого можно отсеять фильмы с очень большим количеством оценок. Это призвано избавить пользователя от банальных и общеизвестных результатов.
Страница выдачи, кроме собственно списка предлагаемых произведений, содержит достаточно подробные сведения о них. Рядом с каждой позицией выводится средняя оценка, а также оценка-прогноз, рассчитанная на основе предыдущих ваших оценок. Доступна и форма расширенной статистики, которая сообщает не только простое количество пользователей, оценивших тот же объект, но и процентное соотношение совпадений ваших оценок с оценками других пользователей, а также соотношение поставленных вами рейтингов с рейтингами других пользователей Imhonet при оценке одного объекта.
Щелкнув на ссылке, можно просмотреть подробные сведения о рекомендуемом произведении. Такой своеобразный «паспорт» состоит из отдельных вкладок, касающихся основных сведений, полученных наград, отзывов пользователей. Для фильмов предлагаются дополнительные вкладки с подборками кадров и перечнем задействованных актеров.
В музыкальном разделе Imhonet нет стартовой формы оценки, подобной фильмам и книгам. Взамен нам предлагают заглянуть в разделы композиций с самыми высокими оценками, а также посмотреть самые неоднозначные произведения, обладающие наибольшим расхождением в пользовательских оценках. На страницах с информацией об альбомах есть возможность онлайнового прослушивания композиций. Если сравнивать качество музыкальных рекомендаций Imhonet и оценки наиболее известного специализированного музыкального сервиса рекомендаций Last.fm, то преимущество, пожалуй, отдадим специальному ресурсу.
Раздел Сайты интегрирован со встроенным онлайновым менеджером закладок. В его функциях нет ничего выдающегося, крупным специализированным менеджерам он сам по себе не конкурент. Дело в том, что в рекомендательные списки Imhonet исправно попадают и так хорошо известные сайты, свежих тематических проектов там не так много. В результате рекомендательный сервис не в полной мере справляется с ролью «машины открытий» и на сегодняшний день по-настоящему может быть полезен разве что начинающим пользователям.
Дальнейшим развитием идеи раздела Сайты можно считать раздел. Блоги. Веб 3.0. Наполняется этот раздел, как и любой другой блог. Для каждого поста предлагается стандартная для Imhonet панель оценок, где можно указать свой рейтинг материала. После того как собрана начальная статистика персональных предпочтений, появляется возможность включить рекомендательный режим.
Раздел Игры на фоне уже рассмотренных нами разделов смотрится довольно бледно. Из рекомендательных инструментов здесь присутствуют разве что пункты. Прогноз и блок. Похоже оценивают. Прогноз хоть и рассчитывается, но оказывается, по субъективной оценке, гораздо менее точным, чем при рекомендации фильмов или книг.