Чтение онлайн

ЖАНРЫ

Dolgin.indb

Маматов Алексей Сергеевич

Шрифт:

156 Такие как голосование по умолчанию, обратная частотность, предсказание на ос-

новании взвешенного большинства и др.

157 Sarwar B., Karypis G., Konstan J., Riedl J. Item-Based Collaborative Filtering Recommendation Algorithms // Proc. 10th Intl WWW Conf., 2001. По их мнению, системы, ориентированные на анализ оценок, данных товарам, показывают луч-

шие результаты по сравнению с коллаборативными алгоритмами, ориентиро-

ванными на анализ потребителей. Так же считают и авторы работы: Deshpande M., Karypis G. Item-Based Top-N Recommendation Algorithms // ACM Trans.

Information Systems, Vol. 22, № 1, 2004. P. 143–177.

184

ГЛАВА 2.7. ОБЗОР РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ

Наряду с клиент-клиентскими системами применяется коллабора-

тивная фильтрация второго класса – модельного158. В этой схеме с помо-

щью некоего индекса сходства пользователей объединяют в кластеры.

Покупки и оценки, данные потребителями из одного сегмента, исполь-

зуются для вычисления рекомендаций. По утверждению Г. Линдена и

его соавторов, кластерные модели лучше масштабируются (т. е. приспо-

соблены к работе с крупными базами данных) в сравнении с поклиент-

ской коллаборативной фильтрацией, так как сверяют профиль пользо-

вателя с относительно небольшим количеством сегментов, а не с целой

пользовательской базой159. Сложный и дорогой кластерный подсчет

ведется в оффлайновом режиме, что разгружает систему. Но качество

рекомендаций при этом снижается, и вот почему. Кластерная модель

группирует пользователей в сегмент, сравнивает конкретного пользо-

вателя с этим сегментом и выдает всем членам сегмента общие реко-

мендации. Так как пользователи, объединенные в кластер, не обладают

идеальным сходством, рекомендации тоже не идеальны. Их качество

можно повысить, разбивая пользователей на высокооднородные под-

группы, но тогда их будет много, и анализ связи пользователь-сегмент

обойдется так же дорого, как и поиск сходных потребителей методом

субъект-субъектной (поклиентской) коллаборативной фильтрации160.

158 Billsus D., Pazzani M. Learning Collaborative Information Filters; Breese J. S., Heckerman D., Kadie C. Empirical Analysis of Predictive Algorithms for Collaborative Filtering; Getoor L., Sahami M. Using Probabilistic Relational Models for Collaborative Filtering //

Proc. Workshop Web Usage Analysis and User Profi ling (WEBKDD ’99), Aug. 1999; Goldberg K., Roeder T., Gupta D., Perkins C. Eigentaste: A Constant Time Collaborative Filtering Algorithm // Journal of Information Retrieval, Vol. 4, № 2, July 2001. P. 133–

151; Hofmann T. Collaborative Filtering via Gaussian Probabilistic Latent Semantic Analysis // Proc. 26th Ann. Intl ACM SIGIR Conf., 2003; Marlin B. Modeling User Rating Profi les for Collaborative Filtering // Proc. 17th Ann. Conf. Neural Information Processing Systems (NIPS ’03), 2003; Pavlov D., Pennock D. A Maximum Entropy Approach to Collaborative Filtering in Dynamic, Sparse, High-Dimensional Domains //

Proc. 16th Ann. Conf. Neural Information Processing Systems (NIPS ’02), 2002.

159 Linden G., Smith B., York J. Amazon.com Recommendations. Item-to-Item Collaborative Filtering // IEEE Internet Computing, February 2003.

160 Каждый товар может рассматриваться как один из узлов байесовой сети, а по-

ложение узла соответствует предполагаемой величине оценки товара. Плохо

здесь то, что каждый пользователь может быть отнесен к отдельному клас-

теру, хотя некоторые системы способны рассматривать пользователя сразу в

нескольких амплуа. Например, в системе, занимающейся рекомендацией книг, пользователь может интересоваться одной темой для работы и совершенно

другой – для досуга. Кроме того, предлагается метод КФ, основанный на ма-

шинном самообучении (например, система искусственных нейронных сетей), вкупе с методами извлечения релевантных признаков (таких, как алгебраичес-

кие модели сокращения матриц до матриц меньшего размера с сохранением

185

ЧАСТЬ 2. УХУДШАЮЩИЙ ОТБОР В ИНДУСТРИЯХ КУЛЬТУРЫ

Работа по совершенствованию коллаборативной фильтрации пол-

ным ходом ведется во всем мире. Известны попытки внедрения ста-

тистической схемы161, а также более сложных вероятностных мето-

дов162. Объединение анамнестического и модельного принципов дает

лучшие результаты, чем каждый из них в отдельности.

2.7.3.1. Проблемы и недостатки

Коллаборативные рекомендации по целому ряду параметров пре-

восходят контентные. В частности, они могут работать с любыми про-

дуктами, даже c теми, которые не принадлежат к числу уже оцененных

данным потребителем. Технология может использоваться и для экс-

пертизы самого эксперта163. (Если профессиональный критик включа-

ется в орбиту рекомендательного сервиса, важно знать, в какой облас-

ти он специализируется и сколь авторитетен.)

Главное достоинство коллаборативной фильтрации состоит в том, что рекомендации персонифицированы. При этом сервис не просто

использует повседневную потребительскую активность участников, а

подталкивает их к размышлениям над своими поступками. Создате-

ли рекомендательных систем для торговли по вполне понятным при-

чинам стараются не утруждать потребителя и свести его рефлексию

к минимуму. Но несомненно, что для самого покупателя осмысление

выбора – полезное занятие. В частности, культурно-потребительская

активность может привести к формированию сообществ по интере-

репрезентативности). По некоторым оценкам, не являющимся окончательными, модельные методики превосходят анамнестические в точности рекомендаций.

См., например: Billsus D., Pazzani M. Learning Collaborative Information Filters и

Поделиться с друзьями: