ЖАНРЫ

Нужна ли анонимность демократическому информационному обществу?

Роговский Евгений Александрович

Шрифт:

Общая схема исследования

1) В Facebook были выбраны 58 466 добровольцев из США, которые согласились поработать с приложением My Personality Facebook (www.mypersonality.org/wiki) и расставить свои пометки like("нравится") на различных материалах (контенте), доступных в этой социальной сети: фотографиях, "друзьях", интересных страницах, спорте, музыке, книгах, ресторанах, популярных Web– сайтах и проч. В среднем каждый из участников расставил примерно 170 пометок, всего пометок удостоились 55 814 материалов, при этом абсолютное большинство из них отмечалось неоднократно, то есть разными участниками. По завершении работы с этим приложением оно содержало информацию об участниках, взятую из их "профилей Facebook", список расставленных ими пометок like, а также некоторую иную информацию.

Далее была сделана матрица "участник — пометка" (представлена на рис. 1 слева), составленная из строк, каждая из которых содержит пометки, поставленные одним участником. В клетку матрицы ставилась "1", если данный участник (строка) пометил данный материал (столбец) словом like, и "0" — в противном случае. Всего в такой матрице было проставлено около 10 млн. единиц (? 58466*170, то есть произведение количества участников на число помет).

2) На втором шаге размерность матрицы "участник — пометка" была сокращена с помощью формального математического метода "сингулярно-значимой декомпозиции" (singular-value decomposition, SVD) [14] . В результате исходная матрица была преобразована в матрицу "участник — компоненты" (представлена на рис. 1 в центре), у которой количество столбцов сокращено до 100 в соответствие с числом выделенных значимых факторов (компонент). Клетки этой матрицы заполнялись не "1", а специально рассчитанными "коэффициентами значения" той или иной компоненты.

14

Golub, G. H., Kahan, W. Calculating the singular values and pseudo-inverse of a matrix / SIAM (Society for Industrial and Applied Mathematics) // Journal on Mathematical Analysis. 1965, Vol. 2, No. 2, pp. 205–224.

3) На третьем шаге весь массив предсказываемых параметров ("атрибутов"), характеризующих каждого из участников, был разбит на три группы (на рис. 1 справа):

а) параметры, соответствующие профилю Facebook;

б) демографической "картине"

;в) проведенным тестам.

К группе а) были отнесены такие параметры, как возраст, пол, политические и религиозные взгляды, семейное положение, сексуальная ориентация, размеры и плотность личной социальной сети. В группу б) вошёл только один параметр — этническая принадлежность. В группу в) были включены психологические параметры, характеризующие индивидуальность личности человека по общепризнанной 5-факторной модели (невроз или эмоциональная стабильность, экстраверт или интраверт, открытость к новому опыту или закрытость, уступчивость или конфликтность, добросовестность или нет) [15] . В данной работе использовались данные по 5-факторной модели для 54 373 участников, полученные с помощью обобщения ответов на вопросы международного обследования [16] .

15

Costa, P. T., McCrae, R. R. Revised NEO Personality Inventory (NEO-PI-R) and NEO Five-Factor Inventory (NEO-FFI) professional manual. Odessa, FL: Psychological Assessment Resources, 1992.

(Далее: Costa, P. T., McCrae, R. R. Revised NEO Personality Inventory…)

16

Goldberg, L. R., et al. The international personality item pool and the future of public-domain personality measures / Presidential Symposium at the sixth annual meeting of the Association for Research in Personality, New Orleans, January 20, 2005 // Journal of Research in Personality. 2006 (40), pp. 84–96.

Кроме того в группу в) попали оценки уровня интеллектуального развития [17] , удовлетворённости жизнью [18] и статус взаимоотношений между родителями подростка до достижения им 21 года.

Для предсказания параметров каждой группы использовались различные методы. Для прогнозирования количественных параметров (возраста или уровня интеллектуального развития) использовались линейные регрессионные модели; для дихотомических параметров (пол или сексуальная ориентация) модели логической регрессии. В обоих случаях применялась 10-кратная перекрёстная оценка параметров регрессионных уравнений, построенных по 100 выделенным значимым факторам (SVD components). Для предсказания таких параметров, как сексуальная ориентация, статус взаимоотношений между родителями подростка, а также потребление алкоголя, наркотиков и сигарет, было выбрано 30 значимых факторов (из-за относительно небольшого количества представленной информации). Результаты предсказания дихотомичных "атрибутов" представлены на рис. 2.

17

Raven, J. C. The Raven’s progressive matrices: Change and stability over culture and time // Cognitive Psychology. 2000, Vol. 41, pp. 1–48.

18

Diener, E., Emmons, R. A., Larsen, R. J., Griffin, S. The satisfaction with life scale // Journal of Personality Assessment. 1985, Vol. 49, Issue 1, pp. 71–75.

Точность предсказания дихотомичных «атрибутов»

Сверху вниз:

— семейное положение (одинокий или нет);

— жили ли родители вместе до достижения подростком 21 года;

— употребление сигарет, алкоголя, наркотиков;

— являешься ли белым американцем или африканского происхождения;

— христианин или мусульманин;

— демократ или республиканец;

— являешься ли геем, лесбиянкой;

— пол.

Учёные обнаружили, что надёжнее всего данная методика различает пол участника (вероятность 93 %), а также его этническую принадлежность, точнее, является ли он белым американцем или африканского происхождения (вероятность 95 %). Далее, выяснилось, что, анализируя пометки like на предпочитаемых пользователями фильмах и телевизионных шоу (на фоне прочей информации), можно с 88-процентной точностью угадать сексуальную ориентацию мужчин и с 75-процентной — женщин [19] ; с точностью 82 % определить христиан и мусульман; с точностью 85 % отличать американских "демократов" от "республиканцев". Достаточно высоким оказалось доверие в отношении употребления наркотиков, алкоголя и сигарет (примерно 70 %).

19

Интересно отметить, что только очень немногие участники (менее 5 %) открыто объявляли о своей сексуальной ориентации. В этом вопросе для предсказания более значимыми оказались пометки like, отданные Britney Spears или программе Desperate Housewives.

Оценивая это исследование, уместно вспомнить, что развитие методов предсказания тех или иных индивидуальных наклонностей и "атрибутов" личности на основе её различных проявлений (поведения) имеет долгую историю. Психологической науке давно известны работы, в которых в качестве исходных использовались такие материалы, как образцы письменного текста [20] , ответы на специальные психометрические тесты [21] (например, обследование на "детекторе лжи") или анкетирование для выявления "ролевой функции" данной личности в среде её обитания [22] .

20

Fast, L. A., Funder, D. C. Personality as manifest in word use: Correlations with selfreport, acquaintance report, and behavior // Journal of Personality and Social Psychology. 2008, Vol. 94, Issue 2, pp. 334–346.

21

Costa, P. T., McCrae, R. R. Revised NEO Personality Inventory…

22

Gosling, S. D., Ko, S. J., Mannarelli, T., Morris, M. E. A room with a cue: Personality judgments based on offices and bedrooms // Journal of Personality and Social Psychology. 2002, Vol. 82, Issue 3, pp. 379–398.

Сегодня в психологической науке многое изменилось. Во-первых, если раньше особые и весьма специфические по своему характеру методы и методики применялись, как правило, немногочисленными высококвалифицированными профессиональными экспертами-психологами и только в рамках научных, медицинских и/или криминалистических исследований, то сегодня такие методы и методики стали доступны для использования в коммерческих целях и без каких-либо морально-этических ограничений. Во-вторых, если раньше такие методы и методики применялись для анализа малых выборок (примерно несколько сотен представителей), то сегодня они могут использоваться для классификации широких масс обитателей киберпространства (сотни миллионов и более).

И, наконец, в-третьих, если раньше реализация аналогичных по своему содержанию исследовательских проектов в области практической психологии (в частности, осуществление масштабных социологических опросов и обработка их материалов), сталкивалась с ограничениями из-за своей чрезмерной трудоёмкости и дороговизны, то теперь такая колоссальная по объёму работа становится дешёвой. Можно сказать, что "миграция" людей в цифровую киберсреду качественно упростила процедуры сбора и обработки первичной социо-психологической информации. В результате, психология как наука потеряла ореол "элитарности", а её весьма специфические методики стали доступны для свободного применения как в коммерческих, так и в политических целях [23] . При отлаженной методике, когда за исходными материалами никуда ездить не надо (их сбор, систематизация и обобщение запрограммированы и осуществляются автоматически), эту работу легко могут выполнять подростки, не отягощенные моральными ценностями правового демократического общества (см. начало статьи).

23

Практически сразу после президентских выборов 2012 г. в американской прессе появились подробные данные, характеризующие проголосовавших за Б. Обаму и М. Ромни с различных сторон.

А информации, представляющей значительный интерес с точки зрения коммерческих приложений методов практической психологии, в современном киберпространстве уже накопилось много.

Как отмечалось в ряде опубликованных ранее работ, о возрасте, поле, месте работы, уровне образования и некоторых иных параметрах личности пользователя можно судить на основе тех "логинов", которыми он пользуется для входа на Web– сайт [24] . Другие параметры личности пользователя могут быть предсказаны на основе содержания его персонального Web– сайта [25] , его музыкальной коллекции [26] , а также данных из его "профилей" в Facebook или Twitter, содержащих информацию о количестве друзей, плотности дружеских сетевых связей [27] и месте (роли) самого пользователя в кругу его сетевых связей (как было установлено, это указывает на его сексуальную ориентацию) [28] .

24

Hu, J., Zeng, H.-J., Li, H., Niu, C., Chen, Z. Demographic prediction based on user’s browsing behavior // WWW’07: Proceedings of the 16th international conference on World Wide Web, New York, 2007, pp. 151–160.

Murray, D., Durrell, K. Inferring demographic attributes of anonymous Internet users // Revised Papers from the International Workshop on Web Usage Analysis and User Profiling. Editors Masand, B. M., Spiliopoulou, M. Springer, London, 1999, pp. 7–20.

De Bock, K. W., Van den Poel, D. Predicting website audience demographics for Web advertising targeting using multi-website clickstream data // Fundamenta Informaticae 2010, Vol. 98, Issue 1, pp. 49–70.

Goel, S., Hofman, J. M., Sirer, M. I. Who does what on the Web: Studying Web browsing behavior at scale // International Conference on Weblogs and Social Media, 2012, pp. 130–137. — http://jakehofman.com/inprint/whowhatweb.pdf

Kosinski, M., Kohli, P., Stillwell, D. J., Bachrach, Y., Graepel, T. Personality and Website Choice / ACM Web Science Conference (Evanston, Illinois) // Proceedings of the ACM Web Science Conference, 2012, pp 251–254.

25

Marcus, B., Machilek, F., Sch"utz, A. Personality in cyberspace: Personal Web sites as media for personality expressions and impressions // Journal of Personality and Social Psychology. 2006, Vol. 90, Issue 6, pp. 1014–1031.

26

Rentfrow, P. J., Gosling, S. D. The do re mi’s of everyday life: The structure and personality correlates of music preferences // Journal of Personality and Social Psychology. 2003, Vol. 84, Issue 6, pp. 1236–1256.

27

Quercia, D., Lambiotte, R., Kosinski, M., Stillwell, D., Crowcroft, J. The Personality of popular Facebook users / ACM Conference on Computer Supported Cooperative Work // Proceedings of the ACM 2012 Conference on Computer Supported Cooperative Work, pp. 955–964.

28

Jernigan, C., Mistree, B. F. Gaydar: Facebook friendships expose sexual orientation // First Monday. October 2009, Vol. 14, No. 10.

Поделиться с друзьями: