Экономика символического обмена
Шрифт:
1.3.2.4. Приостановка фильтрации
При всей своей привлекательности метод коллаборативной фильтрации, по крайней мере в его первозданном виде, а не в виде бизнес-модификаций, до сих пор не особенно известен вне круга специалистов [135] . При очевидной ценности он ждет своего звездного часа уже долгих двенадцать лет. Почему так?
Во-первых, для него требовалась такая скорость вычислений, которую нарастили до нужного уровня совсем недавно. Во-вторых, чтобы раскрыть свои возможности в полном объеме, коллаборативной фильтрации нужно было дожить до широкого распространения интернет-шоппинга, для которого, как полагают многие, эта технология является естественным придатком. Сегодня торговля через интернет свершившийся факт. Однако коллаборативная фильтрация не получила широкого применения даже в музыке, где для этого имеются все предпосылки. И это при том, что с 1999 по 2002 год целый ряд компаний с широким ассортиментом разработок по контент-менеджменту пытались модернизировать музыкальную индустрию. Среди них – eTantrum, GigaBeat, HiFind, Music Buddha, Sonic Print и Uplister (уже не существуют), Cantametrix (приобретен Gracenote), Mongo Music (приобретен Microsoft), AgentArts, Audible Magic, BayTSP, Friskit, Media Unbound, MoodLogic, Relatable, Savage Beast, Sonicprint и Tune Print [136] . Большинство из них прекратили свою деятельность, не оставив следов и не поделившись ноу-хау.
135
На русском языке вплоть до конца 2005 г. не вышло ни одной статьи на эту тему, и почти никто в России не знает, что такое коллаборативная фильтрация.
136
См. приложение 1, глава 11.
Есть основания думать, что трудная судьба изобретения, обещающего революцию в потребительской навигации, не случайна. Ее предопределил один чрезвычайно существенный изъян, с самого начала заложенный в технологию, из-за чего очень правильная и остро актуальная затея пошла по ложному пути. Метод коллаборативной фильтрации не опирался на устойчивую бизнес-модель. Из-за этого сервис был обречен дрейфовать под крыло бизнеса. По мере того как это происходило, замыслы разработчиков отодвигались в тень, а на первый план выступали нужды нового хозяина, начинавшего эксплуатировать идею в сугубо меркантильных целях. В условиях экономической несамостоятельности подобные метаморфозы неизбежны, и они часто оборачиваются утратой автономии и идеологической чистоты, что для экспертного сервиса смертельно. Проводить свою «альтруистическую» линию в жизнь можно лишь оставаясь независимым от дистрибьютора, а для этого необходимо самому зарабатывать деньги. Иными словами, нужно было учиться продавать свой продукт, а именно – рекомендации и сопутствующие услуги. Но этого не случилось. Вероятно, пионерам коллаборативной фильтрации в голову не приходило брать с клиентов – физических лиц деньги за информацию, которую те сами поставляли. Создатели Ringo пытались разбогатеть на продаже своих разработок другим компаниям. Поначалу дело вроде пошло на лад, по крайней мере к концу 1995 года было привлечено $2,6 млн. Но план себя не оправдал, а найти другие источники не удалось. Это и вынудило к слиянию с крупным партнером – Microsoft, что не замедлило сказаться на судьбе рекомендательного сервиса. Менеджеры Microsoft в какой-то момент сочли, наверное, что наилучшей бизнес-модификацией коллаборативной фильтрации будет ее непосредственная интеграция в онлайн-магазин. Когда это сделали, оказалось, что в магазине царят свои законы, и переступить за тонкую черту, отделяющую рекомендацию от навязывания, очень легко. Экспертные возможности системы, изначально ориентированной на благо пользователей, вошли в противоречие с интересами продавцов. Те быстро смекнули, как поступить, и начали производить подсказки несколько иного толка. Если первоначальная альтруистичная версия системы деликатно отвечала на запросы и бесхитростно указывала то, что клиенту покупать не следует, то меркантильная схема преследовала обратную цель – максимально стимулировать покупки.
Анализируя опыт первопроходцев коллаборативной фильтрации, нельзя не обратить внимания еще на один фактор. Согласно ключевой идее фильтра, при вхождении в систему от клиента требуется заполнить анкету, чтобы проинформировать о своих предпочтениях. Тогда это всех смущало: считалось, что клиента не следует утруждать. Почему-то все были едины во мнении, будто минуты, потраченные на построение персонального профиля – это непреодолимый барьер для массового спроса. Как будто в обмен не предлагались сэкономленные часы и месяцы досуга. Почему столь абсурдный вывод поддерживал бизнес, гадать не приходится: ему не нужен искушенный и разборчивый клиент. Тут интереснее другое. Как потребитель позволил обвести себя вокруг пальца? Почему он не насторожился при перевертывании знака в очевидном алгебраическом соотношении: «затраты на экспертизу априори меньше потерь от некачественного потребления»? Почему не забил тревогу, когда обнаружил, что полезный механизм (пусть еще слабый, только рождающийся, но, по всему видно, обещающий набрать недюжинную мощь) растворился в недрах компьютерного гиганта?
Судя по всему, изобретение и его пользователи разминулись во времени: коллаборативный сервис возник до того, как потребитель освоился в той системе торговли, где эта технология способна проявиться во всем блеске. Когда же с развитием интернета массовый покупатель обрел техническую среду, в которой возможен эффективный поиск, он уже застал рекомендательную систему в выхолощенном виде. Этим и воспользовался бизнес, оценивший угрозу нового метода и сыгравший на опережение. Теперь, по прошествии времени, это можно интерпретировать как блестящую контроперацию перехвата. Видно, почуяв реальную угрозу, исходящую от рекомендательного сервиса, бизнес переманил к себе на службу этого новоявленного «суперагента» потребительского сообщества и тотчас втянул его в свою двойную игру: агенту разрешили действовать, как будто ничего не произошло, но при этом слегка редактировали его месседжи. Потребители же, не успев как следует раскусить нового игрока, приняли его информацию за чистую, хоть и не очень ценную, монету. О том, что ее истинная ценность могла быть стократно выше, мало кто догадывался. А бизнес потакал такой недальновидности. Как сказал один из тех, кто успел насладиться сервисом Ringo, «ни одна из действующих сегодня систем навигации не может сравниться с качеством работы Ringo». Если это отчетливо увидел простой пользователь, то трудно поверить, что этого не знал Microsoft, несколько лет работавший с Firefly Network перед тем, как купить ее. Продавцу нужна технология, помогающая продавать, а не та, которая позволяет потребителям беспроигрышно выбирать, оставляя тем самым производителя с залежами неликвидов. Бизнес Microsoft таков, что коллаборативная фильтрация не угрожала этой компании непосредственно. Но это ничего не значит. Достаточно того, что эта технология создавала угрозу множеству других бизнесов, и Microsoft не могла питать иллюзий насчет коммерческих перспектив рекомендательных систем. В августе 1999 года на сайте Firefly.com появилось сообщение: «Готовясь к запуску сервиса Microsoft Passport, 18 августа мы закрываем веб-сайт Firefly и связанные с ним сервисы». Когда ничего аналогичного Firefly не обнаружилось, сетевое сообщество не проявило своей хваленой сплоченности. Хотя, возможно, к этому моменту оно просто не уловило смысла происходящего – Napster только набирал обороты. Рекомендательные системы переподчинили без всякого шума. Пионеры новой технологии один за другим сдавались на поруки бизнесу или дышали на ладан в рамках университетских грантов. Проблема была в том, что они не мыслили свою деятельность иначе как инструментально – как услугу милой их сердцу отрасли, и были горды от осознания того, что большой бизнес принял эстафетную палочку из их рук. Они ждали, что он и дальше понесет ее в том же направлении. Но направление изменилось. Тогда еще никто не осознал, что публичная потребительская экспертиза качества радикально меняет расстановку сил на рынке. Если же потребитель не проявляет себя в качестве сильной стороны, черпающей информацию из независимых источников, он тем самым попустительствует худшим наклонностям рыночных профессионалов.
1.3.2.5. Трюк с подменой технологии
Благовидный предлог для приостановки целомудренного навигационного сервиса оказался под рукой. Им стал тот самый недостаток коллаборативной фильтрации, о котором уже упоминалось: необходимость сбора клиентских предпочтений. Для продуктивной работы требуется приличная база клиентских оценок – минимум сотни тысяч. До того как критическая масса набрана, люди не мотивированы выражать свое мнение, поскольку система не способна вознаградить их усилия. Это так называемая проблема холодного старта. Кто-то первым должен потрудиться во имя остальных – это классическая ситуация производства общественного блага со всеми ее сложностями. Для разогрева на старте можно ничего не спрашивать у клиентов, а попытаться вычислить их предпочтения из потребительских действий (кстати, совершаемых не обязательно в рамках рекомендательной системы) [137] . Этой дорогой и двинулся бизнес, вскоре обнаружив, что можно вообще обойтись без сбора прямых и явных (сознательно выраженных) клиентских предпочтений [138] . Косвенными источниками оценок могут служить, например, прошлые покупки или время просмотра конкретной веб-страницы, или последовательность кликов по ссылкам в сети. В. Коуэн и В. Фэн показали, как можно отслеживать музыкальные предпочтения путем анализа логов (хронологической записи событий), статистики скачиваний и прочей технической информации [139] . По названию файла можно установить исполнителя или композитора, а по IP-адресам – потребителей.
137
Подробнее об этом см. часть 2, параграф 2.7.3.1.
138
Предпочтения могут быть явными (когда пользователь сам оценивает потребленные книгу, компакт-диск или ресторан) либо неявными (когда выводы делаются на основе его действий).
139
Cohen W. W., Fan W. Web-Collaborative Filtering: Recommending Music by Crawling the Web // Proceedings of the 9th International World Wide Web Conference, 2000.
Тот же принцип применяется в интернет-магазине Amazon: каждая книга здесь сопровождается списком литературы, приобретенной покупателями данной книги [140] . Считается, что фактом покупки люди выражают свою оценку. Хотя купленное и понравившееся – это, очевидно, не одно и то же, но этой разницей Amazon считает возможным пренебречь. Несмотря на то что качество прогнозов, выведенных из косвенных данных, ниже, чем из прямых потребительских оценок, бизнес сделал ставку именно на них. За этим проглядывает желание не просто избавить покупателей от лишних хлопот, но и дозировать их компетентность. (Это тот же мотив, который привел дигитальные отрасли культуры к единообразию цен.) Опции, облегчающие выбор, привлекают клиентов, способствуя увеличению продаж, но они же уточняют выбор, что ведет к снижению продаж. Предоставляя услугу по навигации, бизнес заинтересован в таком ее виде, который не вредит сбыту продукции разного достоинства. То есть он выбирает оптимальный для себя вариант, но это не значит, что это лучший вариант с точки зрения покупателя. Если бы навигационный сервис Amazon был платным и доходы от него были бы сопоставимы с продажей книг, тогда резонно было бы ожидать более высокого качества. Дареному же коню в зубы не смотрят. Предоставили какую-то навигацию – и на том спасибо. Вообще, экспертиза, соединенная с продажами, потенциально содержит возможность двурушничества, и полагаться на нее если и можно, то с большой осмотрительностью.
140
Подробнее см. приложение 1, параграф 11.6.1.
1.3.2.6. Кто кого фильтрует?
По мере того как число участников коллаборативной фильтрации растет, нарастают проблемы обработки данных. При нескольких миллионах пользователей ограничения скорости операций становятся ощутимыми. Поэтому, когда рекомендательный сервис используют в качестве придатка к торговым системам, фильтрацию по типу «потребитель-потребитель» заменяют цепочкой «объект-объект» (см. рисунок). Этот принцип экономичнее, в частности из-за отсутствия необходимости часто пересчитывать взаимосвязи между клиентами [141] . В этот момент и закладываются предпосылки для незаметной переориентации метода с нужд потребителей на интересы продавцов.
141
Этот вариант навигации в 2001 г. предложили Бадрул Сарвар и его коллеги из Университета Миннеаполиса (см.: Sarwar B., Karypis G., Konstan J., Riedl J. Item-based Collaborative Filtering Recommendation Algorithms. [on-line] Department of Computer Science and Engineering, University of Minnesota, Minneapolis, 2001. [cited Feb. 15, 2006]. Available from URL: <http://www10.org/cdrom/papers/519/index.html>). В том же направлении одновременно двигались и другие группы, включая Amazon.
В основе пообъектной фильтрации – фиксация всех оценок, выставленных пользователями системы различным объектам (это могут быть товары, услуги, учреждения и т. д.), и анализ сходства между объектами, что не совсем то же самое, что сходство между людьми. Например, берется конкретный продукт – книга – и выявляются все прочие книги, получившие от различных потребителей сходную оценку. Хотя с точки зрения математики подсчеты «объект-объект» вроде идентичны данным, полученным из оценок потребителей, но во втором случае отбираются продукты, нужные людям, а в первом – люди, «нужные» для продвижения продуктов. В объектной фильтрации сходство между товарами устанавливается по профилю оценок потребителей, а в «человеческой» версии – по ряду персонально выделенных и значимых параметров. Разница именно в том, что в коллаборативной фильтрации с непосредственным участием потребителей те сами расставляют акценты, а пообъектная схема обходится без этого. Методы были бы идентичны, если бы в поклиентской версии фильтрации учитывались все оценки всех покупок, совершаемых потребителями.
Пренебрегать прямо высказанными оценками – это все равно что судить о совпадении вкусов людей по их знакомству с блокбастерами. К тому же очевидно, что факт потребления чего-либо далеко не всегда равнозначен удовлетворению. Существует зазор между интересом к продукту и его итоговой оценкой. Неспроста модераторы Ringo не ограничивались часто ранжируемыми артистами, а оставляли место для индивидуальных предпочтений. Расхождение между оплатой и удовлетворением особенно существенно тогда, когда нет повторного потребления, и накопления информации (позитивной или негативной) от предыдущих покупок не происходит. Именно поэтому культурная продукция, потребляемая однократно, оказывается в числе наиболее проблемных случаев для пообъектной фильтрации. Здесь между интересом, ожиданиями и конечными впечатлениями может пролегать пропасть. В предметной сфере ситуация менее острая.
В потребительской версии люди сигнализируют о своих итоговых эмоциях и впечатлениях, а в пообъектной – товары указывают на свою способность притягивать внимание людей, что, очевидно, заслуга не только их качества, но еще и рекламы и цены [142] . Таким образом, люди дают экспертную оценку товаров с большей пользой для себя. В особенности если учитывать, что их вовлеченность в процесс сама по себе позитивна. В областях, где люди потребляют приблизительно одинаковый ассортимент, например одни и те же автомобили или стиральные порошки, совпадение списка покупок не выявляет различий во вкусе. Другое дело, что оно указывает на схожесть статусов, и в этом смысле пообъектная фильтрация оказывается информативной. В то же время очевидно, что она скорее подогревает стремление к подражанию, чем к отличиям, и это на руку бизнесу.
142
Подробно о взаимосвязях рекламы и цены см. часть 3, разделы 3.4.1. и 3.4.2.
Как отмечалось, анализ сходства в рамках объектной фильтрации не нужно делать каждый раз, что обеспечивает скорость ответа на запрос. Именно это и требуется Amazon и прочим торговцам для того, чтобы успеть напичкать клиентов рекомендациями, пока они пребывают в покупательском настроении. Люди ведут поиски и покупки в интернете, оставляя на различных сайтах следы своего присутствия, а на них попутно сыплется информация то ли рекомендательного, то ли рекламного свойства. Простые клики на веб-страницы засчитываются системой как акты потребительского ранжирования. Но остановка внимания на некоем предложении, а может быть просто пауза по сторонним причинам – не такой уж точный показатель заинтересованности человека в данной вещи. К тому же, далеко не все покупки совершаются в интернете, поэтому выборка покупательских предпочтений, сделанная только на основе этих данных, не вполне репрезентативна. Коллаборативная фильтрация с непосредственным участием потребителя пусть медленнее, но вернее служит его интересам.