Пособие по журналистике данных
Шрифт:
Мы были в недоумении, когда оказалось, что у правительства и экспертов нет надежных и достоверных данных о нанесенном ущербе. Когда чиновники спрятали данные SPEEDI (информация о предполагаемом распространении радиоактивных материалов) от общественности, мы были не готовы к их расшифровке, даже если бы они стали доступны вследствие какой–нибудь утечки. Добровольцы начали собирать данные о радиоактивности при помощи своих собственных устройств, но нам не хватало знаний статистики, интерполяции, визуализации, и так далее. Журналистам нужно иметь доступ к исходным данным, и учиться не полагаться на официальную интерпретацию оных.
— Исао Мацунами, Chunichi/Tokyo Shimbun
Работа с лавиной данных
Вызовы и возможности, предлагаемые цифровой революцией, продолжают подрывать и дезорганизовывать журналистику. В век информационного изобилия журналисты и граждане, как и все остальные, нуждаются в лучшем инструментарии, будь то когда мы имеем дело с самиздатом XXI века на Ближнем Востоке, или с обработкой и разгрузкой данных поздней ночью, или ища наилучший способ визуализации качества воды для нации потребителей. Когда мы боремся с потребительскими вызовами, которые представляет эта куча данных, новые публикационные платформы также дают возможность всем собирать данные и делиться ими цифровым образом, превращая их в информацию. В то время как журналисты и редакторы являются традиционными векторами для сбора и распространения информации, выдыхающееся и становящееся вялым и безвкусным информационное окружение 2012 года приводит к тому, что новости сначала появляются в онлайне, а не на редакционном столе.
По всему миру фактически связь между данными и журналистикой становится сильнее. В век больших данных растущая важность журналистики данных берет свою основу в возможности тех, кто ею занимается, обеспечивать контекст, чистоту, и, возможно, самое важное, находить правду во все увеличивающемся количестве цифрового контента в мире. Это не означает, что интегрированные медийные организации сегодняшнего дня не играют критически важной роли. Отнюдь. В информационный век журналистам нужно большее, нежели просто извлечение, верификация, анализ и синтез потоков данных. В этом контексте журналистика данных имеет глубокую важность для общества.
Сегодня, извлечение смысла из больших объемов данных, в частности, неструктурированных данных, станет главной целью для ученых, работающих с данными по всему миру, неважно, работают ли они в ньюсрумах, на Уолл–Стрит или в Кремниевой долине. И самое важное, что эта цель будет реализовываться за счет растущего набора общих инструментов, неважно, используются ли они правительственными технологами, открывающими Чикаго, технологами в области здравоохранения или работниками ньюсрумов.
— Алекс Говард, O’Reilly Media
Наша жизнь – это данные
Качественная журналистика данных – сложное дело, потому что качественная журналистика – вообще сложное дело. Это означает знать, как получить данные, как понять их, и как найти сюжет. Порой выходит дохлый номер, порой заходишь в тупик, а порой просто оказывается, что нет хорошей темы. В конце концов, если бы все сводилось к тому, чтобы нажать на нужную кнопку, это была бы не журналистика. Но именно это делает ее целесообразной, и – в мире, в котором наши жизни все больше превращаются в данные – категорически необходимой для свободного и справедливого общества.
— Крис Тэггарт, OpenCorporates
Способ сэкономить время
У журналистов нет времени, которое они могли бы бездарно потратить на переписывание чего–то от руки, и бездельничанье в попытке вытащить данные из PDF–файлов, поэтому некоторое знакомство с основами программирования, или знание того, где искать людей, которые могут помочь, невероятно ценно.
Один журналист из газеты «Фола де Сан–Паулу» (Folha de S~ao Paulo) работал с местным бюджетом и позвонил мне поблагодарить за то, что мы выложили счета муниципалитета Сан–Паулу в онлайн (два дня работы одного хакера!). Он сказал, что он переписывал их от руки последние три месяца, пытаясь создать сюжет. Я также помню решение «PDF–ной проблемы» для Contras Abertas, парламентской организации, занимающейся мониторингом новостей: 15 минут и 15 строк в программе – и сделана работа, которая в противном случае занимает месяцы.
— Педро Маркун, Transpar^encia Hacker
Неотъемлемая часть набора инструментов журналиста
Я думаю, важно подчеркнуть слово «журналистика», или репортерский аспект «журналистики данных». Дело должно быть не в том, чтобы анализировать данные или визуализировать данные ради самих данных, а в использовании этого метода как инструмента для того, чтобы подобраться ближе к правде о том, что происходит в мире. Я вижу в анализе и интерпретации данных жизненно необходимую часть современного багажа инструментов журналистики, а не отдельную дисциплину. В конечном итоге все это имеет отношение к качественной журналистике, к созданию профессиональных репортажей и рассказыванию историй самым подходящим способом.
Журналистика данных – еще один способ критически изучать мир и сдерживать власти, призывая их к ответу. В условиях, когда объемы доступной информации все увеличиваются, сейчас более чем когда–либо важно, чтобы журналисты знали о технике журналистики данных. Она должна быть инструментом, присутствующим в арсенале любого журналиста: будь то за счет изучения того, как работать с данными напрямую, или посредством сотрудничества с кем–то, кто умеет это делать.
Ее реальная сила – в том, чтобы помочь вам получить информацию, которую в противном случае было бы трудно отыскать или доказать. Хорошим примером этого является статья Стива Дойга (Steve Doig), в которой он проанализировал примеры ущерба от урагана «Эндрю». Он объединил два разных набора данных: один, показывающий уровень разрушений, причиненных ураганом, и второй, демонстрирующий скорости ветра. Это позволило ему выделить зоны, где слабые законы в области жилищного строительства и практика некачественного строительства внесли свой вклад в результаты урагана. Он завоевал Пулитцеровскую премию за эту свою статью в 1993 году, и это отличный, вдохновляющий пример того, чего можно достичь.
В идеале вы используете данные для того, чтобы точно определить и выделить секреты и провалы и всплески значений, очертить области интереса, или выделить факты, которые удивляют. В этом смысле данные могут служить исходником или источником конфиденциальной информации. Но хотя сами цифры тоже могут быть интересными, просто написать о данных недостаточно. Надо на их основе сделать репортаж, чтобы объяснить, что они значат.
— Синтия О'Мурчу, Financial Times
Приспособление к изменениям в нашем информационном окружении
Новые цифровые технологии приносят новые способы производства и распространения знаний в обществе. Журналистика данных может пониматься как попытка средств массовой информации адаптироваться к изменениям в нашем информационном окружении и отреагировать на эти перемены – в том числе, путем более интерактивного, более многомерного представления тем и сюжетов, давая возможность читателям использовать источники, лежащие в основе новостей, и подталкивая их к участию в процессе создания и развития историй и сюжетов.
— Сезар Виана, Университет Гойяс
Способ видеть вещи таким образом, каким бы вы их иначе не увидели
Некоторые сюжеты и темы можно понять и объяснить только с помощью анализа – и порой визуализации – данных. Связи между влиятельными людьми или организациями могли бы остаться нераскрытыми; смерти, связанные с борьбой с наркотиками, остались бы тайной; политика в области экологии, которая наносит вред окружающей среде, по–прежнему оставалась бы без внимания. Но все вышеозначенное изменилось – из–за данных, которые получили журналисты – получили, проанализировали и предоставили читателям. Данные могут быть простыми как простая таблица или список телефонных звонков, или сложными, как школьные таблицы или данные о больничных инфекциях, но внутри себя все они содержат истории, которые стоит рассказать.