Политическая наука №1 / 2018
Шрифт:
Рис. 2.
Наука шагает на двух ногах: наблюдении и осмыслении [Taagepera, 2015]. Две ноги науки
Взгляните на рисунок 2. Здесь наука изображена на двух ногах. Именно наличие двух ног и позволяет ей шагать, приращивать знание. Как я уже говорил, шаг одной заключается в вопросе о положении дел. Этот шаг связан с наблюдением, измерением, наглядным отображением и статистическим описанием. Шаг другой ногой связан с выяснением логических оснований положения дел. И не только наблюдаемых, но возможных, а также и необходимых при последовательном использовании логических оснований.
Именно второй шаг ведет нас к построению логических моделей. И это придает дополнительный смысл первому. Пока мы фокусируем свой взгляд только на том, что перед глазами, мы действительно улавливаем, каково положение дел в конкретном случае. Вся полнота проблемы раскрывается целиком, только когда мы задаемся вопросом: «Каким положение дел должно быть?» Именно этот вопрос и связанный с ним шаг позволяют нам понять, что именно следует искать. Две ноги шагают дальше, когда мыслительные модели тестируются с помощью собранных данных, чаще всего статистически 13 .
13
То, что обычно небрежно сваливается в одну кучу под названием «статистический анализ», исполняет в действительности две чрезвычайно различные функции. Одна из них – статистическое описание данных – наилучшим образом соответствует тому, что обычно понимается под подходящим математическим форматом, включая значения констант в данном формате, меры разброса (такие как R2) и т.д. Вторая – статистическое тестирование предполагаемых моделей – показывает, насколько хорошо предсказание согласуется со средним данных. Измерения с помощью статистических критериев тоже различаются между собой, но они также отличаются значительно от мер разброса. В частности, коэффициент детерминации R2 не имеет значения и даже бесполезен, когда дело доходит до тестирования моделей.
Вы можете сказать, что это звучит слишком абстрактно. Чтобы понять, что стоит за данными словами, я проиллюстрирую их на примере открытого мною закона продолжительности жизни правительства 14 . Первым шагом было следующее наблюдение: в странах с большим числом партий недолговечные правительства. Вторым шагом стало размышление над данным наблюдением. Оно очевидно приводит нас к непосредственному предсказанию о направлении связи (directional prediction), т.е. улавливающему лишь направление или тренд зависимости: чем больше партий, тем продолжительность жизни правительств меньше. Измерения продолжительности жизни правительств и числа партий в значительной степени подтверждают данное предсказание.
14
Это представление и применение «двуногого» процесса соответствует главе 1 Шугарта и Таагеперы (2017), хотя там используются иные примеры.
Но простого предсказания направления недостаточно. Вспомните о Галилее. Любой тосканский крестьянин мог сказать Галилею, в каком направлении падают вещи [Taagepera, 2008, p. 24]. Они падают вниз! Что еще вам нужно знать? Но Галилей хотел понять логику этого падения: как быстро они падают и почему. Если мы хотим быть учеными, то мы должны задавать подобные вопросы и относительно продолжительности жизни правительств, и о любых других направленных связях. И еще, когда я адресую такие вопросы журнальным рецензентам, то они отвечают в духе тех самых тосканских крестьян. Они указывают на излишние черты, лежащие за пределами обозначенной связи рассматриваемого эффекта. Делая это, они препятствуют исследованию на первом же шаге, когда Галилей только начинал свое изучение гравитации. Такие «крестьяне» причиняют ощутимый вред социальным наукам.
Крайне важный шаг заключается в том, чтобы наглядно представить имеющиеся данные (to graph the data) 15 . Посмотрите на график и поразмышляйте над тем, какую информацию он дает. На графике с обычным масштабом (не таком, как на рисунке 1), связь между продолжительностью жизни кабинета и числом партий представляется в виде нисходящей кривой, но НЕ прямой линии. Так забудьте о рефлекторном использовании линейной регрессии!
15
На самом деле мы должны визуализировать больше, чем данные [Taagepera, 2008, p. 202–204; Taagepera, 2015, ch. 8]. На графиках мы должны выявлять те «запретные» зоны, где точки не базируются на концептуальных основаниях, – в данном случае на тех, где N<1 и C<0. Также следует показать те «якорные точки», которые как раз логически включены в описываемые взаимосвязи. Например, любая взаимосвязь между самой большой долей мест и их количеством должна быть равна MS=1 (случай президентских выборов), что приводит к тому, что S1=1 – так как максимально может быть занято 100% мест. Именно поэтому (1; 1) – та самая «якорная» точка. Ее визуализация опирается на «мыслительную» ногу в дополнение к «наблюдательной».
Кривая наводит на мысль, что продолжительность жизни правительства может быть обратно пропорциональна числу партий. Однако дальнейшие размышления приводят нас к предсказанию, что это должен быть квадрат числа: C=k/N 2, где k – это еще неопределенная константа 16 . Представленное выражение не является линейным, как и большинство других взаимосвязей в науках. Но это нелинейность такого вида, когда можно логически предположить, что логарифмирование продолжительности жизни правительств и числа партий приведет к линейной взаимосвязи, с наклоном -2. Повторная визуализация, но теперь уже с использованием логарифмированных шкал, подтверждает это подозрение, что мы и можем видеть на рисунке 1.
16
Функциональная форма C=k/N 2 выводится логически, но значение константы k определяется эмпирически. Это вполне обычная ситуация в физике.
Теперь и только теперь можно перейти к статистическим подходам, которые позволят протестировать предложенные логические модели. Чтобы это имело смысл, линейная регрессия должна применяться только к логарифмированным показателям продолжительности жизни правительств и числа партий – не к их количественным измерениям как таковым. Данная линейная регрессия подтверждает ожидаемый наклон, равный -2, а также позволяет найти наилучшее значение для константы – 42 года.
Итак, конечным результатом является получение количественной предсказательной логической модели: C=42 года/N 2. Эта модель «количественная и предсказательная», потому что она предсказывает не только направление изменений, но также и продолжительность жизни правительства при заданном числе партий. Модель «логическая», потому что использование в качестве делителя квадрата числа партий исходит из логических соображений.
Заметьте, что мы использовали чередующиеся шаги каждой ноги, на которых стоит наука. Мы начали с наблюдения, левой ноги, а затем обратили внимание на направленное мышление – правую ногу. Визуализация включается в «наблюдательную» ногу. Дальнейшие размышления приводят к обратной квадратной модели. Это заставило нас задаться вопросом: «Как мы можем превратить эту кривую в прямую линию?» Переход к логарифмам послужил ответом. Затем мы снова переключили наше внимание на «наблюдательную» ногу, перейдя к построению линейной регрессии на основе измененных данных. Наконец, мы должны были вновь сместить фокус нашего внимания на «мыслительную» ногу и спросить себя: «Имеет ли данный результат смысл?» Да, имеет. В частности, при большом числе партий продолжительность существования правительства будет приближаться к нулю, как это и должно быть.
Вообразим теперь, что за дело возьмется специалист в области статистики. Как только он установит направленность связи, все дальнейшие логические рассуждения покажутся ему излишними. Он попытается прыгать только лишь на «наблюдательной» ноге, как это показано на рисунке 3. Здесь он даже откажется от визуализации. Он загрузит сырые данные для построения регрессии, не обращая внимания на тот факт, что сама структура данных нелинейна. Без визуализации как он это узнает? 17 Его компьютерная выдача покажет отрицательный знак для коэффициента наклона. Это подтвердит его предсказание о направлении связи, и это все, что такой специалист нацелен получить 18 .
17
Он может сделать еще хуже. Он может включить полдюжины контрольных переменных, которые могут правдоподобно влиять на продолжительность жизни правительства: состояние экономики, левая или правая партия, публичная поддержка премьер-министра и т.д. Каждая из них может незначительно «отобрать» влияние числа партий, которое в полной мере уменьшается, когда мы вычитаем N, вместо того чтобы делить на квадрат N. Кроме того, несколько других факторов могут привести к иллюзорным уровням «значимости».
18
Специфические количественные предсказания легко могут оказаться неверными при ближайшем рассмотрении; даже когда существует поддержка широкого направления изменений. Напротив, слишком много исследований в политологии находится в «безопасности» при попытке доказать их ложность, так как они только и предсказывают широкое направление изменений, оставляя его точное значение неопределенным.
Но постойте! Какой срок жизни правительства его регрессионная прямая отмерит в случае очень большого числа партий? Его нисходящая прямая предскажет отрицательную продолжительность жизни правительства, если число партий станет действительно большим. Это нелепо. Он не задается базовым вопросом: «Имеет ли данный результат смысл?»
Я вижу, как такие нелепые регрессии публикуются постоянно. Забывая о логическом мышлении, социальные исследователи слишком часто идут по легкому пути, подгоняя сырые данные к прямой линии или же к любому другому стандартному формату, базирующемуся на статистических или иных «модных» основаниях 19 . Дорогие коллеги, если мы как ученые хотим всерьез воспринимать нашу профессию – политическую науку, мы не должны публиковать такие нелепости. Нам не следует этого делать, чтобы действующие политики воспринимали нас всерьез.
19
Это единственное предложение действует как громоотвод, если опустить слово «часто». Как говорится в одном комментарии к рабочему варианту данной статьи: «Как таковое, оно хорошо применимо к политологии (особенно до недавнего времени), но неприменимо к другим дисциплинам в области социальных наук, например, к экономике, где лог-логарифмические и линейно-логарифмические модели являются обычным делом, и где пробит-, логит- и другие нелинейные оценивающие [курсив мой. – Авт.] модели становятся нормой. Это даже неприменимо в полной мере к некоторым искушенным сотрудникам журналов, таких как Political Analysis, где используются нелинейные модели (главным образом пробит и логит), а также эффекты взаимодействия».
Рак пожирает социальные науки. Готовые компьютерные программы дают возможность людям, не обладающим широким пониманием математики, «вымучить» кучу бессмысленных регрессионных анализов и подобных вещей, чтобы претендовать на научность. Сама же идея логических моделей опровергается в том случае, если регрессионный выход (output) будет назван «эмпирическими моделями».
Заметьте, это не просто нелепость «мусор загрузил, мусор выгрузил». Это куда хуже. Нередко мы загружаем ценные данные, а на выходе получаем тот же самый мусор. Почему? Потому что данные не были должным образом преобразованы (с использованием логического мышления), прежде чем они были загружены в компьютер.