Педагогическое тестирование: Проблемы, заблуждения, перспективы
Шрифт:
2. Принятая система тестирования ограничивает содержание и круг проблем, рассматриваемых при выработке политики в сфере образования
В предыдущем разделе было показано, что узость спектра измеряемых качеств в процессе школьной аттестации и при приеме выпускников на работу может оказывать серьезное деструктивное влияние на обучение в школе. В этом разделе будут рассмотрены ограничения, которые нынешняя измерительная парадигма накладывает на наши представления об образовании и на круг вопросов, обсуждаемых при формировании политики в сфере образования.
Напомним, что в первой главе доказывалось, что так называемое «оценивание» результатов учебного процесса может привести к ошибочным и даже безнравственным по своему содержанию выводам (в смысле возможного урона для личности и для общества в целом), если только оно не будет опираться на более широкий набор измеряемых качеств. Далее утверждалось, что намерение Объединенного комитета использовать в сфере образования только надежные и валидные тесты представляет собой ловушку, поскольку пока еще не созданы надежные и валидные средства для измерения большинства важнейших положительных и отрицательных результатов педагогического процесса. Было высказано убеждение, что невозможно разработать такие средства без радикальных изменений самой измерительной парадигмы, потому что наиболее важные результаты образования состоят в развитии инициативы, формировании представлений о том, как функционируют различные социальные институты и организации, а также развитии компетентностей, необходимых человеку для успешного достижения его целей. В этом контексте утверждалось, что учет такого рода результатов показал бы, что хотя действующие сегодня программы обучения и способствуют повышению оценок учащихся по традиционным тестам, но одновременно они наносят и серьезный ущерб, что неоднократно подчеркивали такие авторы, как Goodman, Reimer и Illich.[57]
Применение тестов, сконструированных в соответствии с традиционным критерием, согласно которому «хороший» тест должен давать «нормальное» (то есть гауссово) распределение, имеет еще и побочный результат. Он состоит в том, что такие тесты крайне неэффективны для оценки качества системы образования в целом или какой-либо ее части (подсистемы) с точки зрения достижения стоящих перед ней важных целей. Невозможно ведь получить нормальное распределение по всей популяции, если на практике лишь немногие учителя содействуют развитию названных способностей. По этой причине у нас слишком мало материалов, показывающих что школы стремятся содействовать развитию таких качеств, как инициатива или готовность сотрудничать с другими людьми.
В результате лишь единицы из имеющихся в настоящее время тестов могут быть использованы для того, чтобы показать, способствует или нет данная система обучения или данный конкретный учитель появлению большого числа учеников с разнообразными типами одаренности. Чтобы сделать это, необходимо отказаться от нынешних представлений о различиях между учащимися и использовать тесты, способные продемонстрировать, в чем данный конкретный ученик особенно силен, а вовсе не то, силен ли он в решении задач, отобранных учителем или внешним экспертом без учета его способностей.
Но это не единственная причина, по которой использование тестов, предполагающих «нормальное» распределение результатов, ведет к недооценке важнейших проблем образования. Принятие этих тестов в качестве адекватных методов измерения результатов обучения побуждает исследователей к использованию многофакторных схем анализа. При таком подходе за аксиому принимается допущение, что прилагаемые педагогические усилия, равно как и результаты обучения, могут существенно различаться количественно. Однако можно со значительной долей вероятности предположить, что лишь очень немногие учителя попытаются создать в классе оптимальную развивающую среду, остальные же этого делать не станут. Следовательно, можно будет ожидать желательных (или нежелательных) результатов в одних классах и их отсутствие в других. Рассуждения об образовании в рамках неких «факторов» педагогического воздействия (которые предположительно монотонно связаны с «факторами» педагогических результатов), не затрагивающие самой сути педагогических процессов и их возможных последствий, вряд ли приведут исследователя к обоснованным выводам о том, какие аспекты процесса обучения важны, а какие нет. Между тем именно это, как правило, и хотят знать чиновники, заказывающие и финансирующие исследования. Следование статистическому (строго научному) стандартному многофакторному исследовательскому плану, похоже, освобождает специалиста, оценивающего процесс обучения, от обязанности ясно формулировать предполагаемую им цепочку причинно-следственных связей между воздействием, например, финансовой поддержки образования и результатами, к которым, это финансирование должно привести, таким, например, как улучшение показателей учащихся по тестам. По этой причине чисто оценочные исследования редко сообщают о том, как можно улучшить педагогический процесс. Еще менее они способны показать, как перейти от того, что есть, к тому, что должно бы быть, имея в виду, что тот набор деятельностей, который способен привести к желаемому результату, чрезвычайно маловероятен в этом мире: я имею в виду мир, каким он предстает на основе многофакторного описания. Сказанное, однако, не означает ни того, что различные компоненты эффективных программ обучения нельзя исследовать в принципе, ни того, что нельзя создать более эффективные программы обучения.
Необходимо сказать еще об одном важном последствии, к которому ведет неспособность общепринятых процедур оценивания выявлять существенные характеристики педагогического процесса (что связано с чрезмерным увлечением «переменными») и особенности учрежденческого и социального контекста, в котором этот процесс происходит. Исследователи часто проходят мимо факта, что провал конкретного нововведения, направленного на достижение желаемого результата, происходит не столько из-за недостаточности избранных средств и методов, сколько из-за недостаточного внимания к тому влиянию, которое они оказывают на другие аспекты системы. Например, довольно часто приходится иметь дело с проектами по усовершенствованию учебных программ, в которых группы учителей обучаются неким «новым методам». Затем эти учителя возвращаются работать в свои школы. При этом не предпринимается никаких шагов, чтобы другие педагоги, родители и учащиеся поняли смысл и новизну этого проекта. Необходимые пособия и оборудование чаще всего отсутствуют, не делается ничего, чтобы помочь учителям с максимальной отдачей осуществить эти нововведения. Ученики проводят немало времени с другими учителями, которые в лучшем случае не обращают внимания на новации своего коллеги и не поддерживают его усилий, а часто сознательно изменяют свою работу с детьми так, чтобы подорвать веру в эти «новомодные» проекты. Веря в то, что они действуют в интересах учащихся, эти учителя могут, например, увеличить нагрузку по своему предмету, чтобы компенсировать «вред», наносимый «новатором». Совершенно невозможно довести до конца такие проекты, которые могли бы обновить содержание обучения и одновременно сами способы оценивания, изменив тем самым мнение педагогов об учениках. Поэтому другие учителя, родители, да и сами учащиеся, опасаясь сокращения у «подопытных кроликов» шансов на успех в реальной жизни, наращивают усилия на достижение традиционных (академических) целей. Не отдавая себе отчета во всем этом, эксперты, оценивающие эффективность нововведений, принимают во внимание только результаты тестов и вносят очередной проект в длинный список «неуспешных попыток реформирования учебного плана».
На самом же деле никому не интересны результаты нововведений, если они были плохо организованы, если они не были обеспечены соответствующей поддержкой. Такие результаты будут иметь слишком небольшое значение как для отдельного ученика, так и для общества, и будут лишь косвенно связаны с целями нововведения. Гораздо важнее узнать о положительном или отрицательном влиянии педагогического нововведения в долгосрочной перспективе (вроде экономического и социального развития общества), если оно будет внедряться должным образом и в обстановке поддержки. Не менее важно также понять, какие изменения – собственно педагогические и внешние, ситуационные – необходимы для получения желательных и предотвращения нежелательных результатов.[58]
Излишняя фокусировка исследователей, оценивающих содержание и методы обучения, только на узком спектре результатов (а именно на тех, которые проверяются «надежными и валидными» тестами) часто мешает им глубоко изучить существо происходящих процессов. Возникает это еще и потому, что игнорируются те формы педагогической деятельности, которые не оказывают существенного влияния на контролируемые результаты. Это особенно часто бывает в тех случаях, когда сам процесс обучения рассматривается как нечто неосязаемое и не поддающееся измерению. К примерам такого рода относится большинство программ и методов обучения, разработанных для обеспечения личностного роста учащихся (и часто достигающих поставленной цели). Как подчеркивает Jackson,[59] это справедливо для большинства образовательных программ, направленных на духовное или нравственное развитие, а также на выявление и развитие скрытых до поры способностей и одаренностей. Jackson, Havighurst и Taba,[60] McClelland,[61] Dolphin и Raven[62] отмечают, что такие изменения личности, как правило, происходят в результате взаимодействия с людьми, которые преуспевают в том, в чем сам испытуемый хотел бы добиться успеха, или с людьми, на которых он хотел бы быть похожим. (Такие ролевые модели могут быть представлены как на примере конкретных людей, так и с помощью различных рассказов или притч.) Эти изменения также могут возникать в результате стрессовых или экстремальных ситуаций.[63] Некоторые из тех, кого мы интервьюировали в ходе одного из упоминавшихся выше исследований, отмечали, что такого рода изменения были вызваны у них встречей с профессионалом более высокого класса, чем они сами, в то время, когда они были заняты очень важной для них деятельностью. Или же источником таких изменений может быть эмоциональный опыт, связанный с переживанием восторга и изумления, охватывающих, например, при проникновении в суть устройства сложных организмов или сим-биотических взаимосвязей. Сюда можно еще, наверное, добавить «духовное», или трансцендентное измерение, которое, как настаивает Foshay,[64] должно составлять неотъемлемую часть всех исследований, ориентированных на учебные предметы.
Ряд других процессов, которые игнорируются исследованиями в рамках факторно-аналитического подхода, связан с естественным стремлением человека активно выбирать и конструировать среду, в которой он живет и работает.
Многие исследователи заявляют, что такие процессы не поддаются научному изучению. Это привело некоторых из них к заключению, что и деятельность в сфере образования, и ее оценка являются искусством, в котором науке (по крайней мере позитивизму) делать особо нечего. Обе эти позиции свидетельствуют о глубоко неверном понимании существа науки.[65] Вся история науки – это отчет о процессе превращения неявного в видимое: Ампер использовал магнитную стрелку, чтобы сделать видимым электричество; пузырьковые камеры используются, чтобы сделать видимым путь нейтронов.
Принятие «надежных и валидных» тестов как единственной правомерной основы для научной оценки в образовании порождено таким представлением о науке, которое недостаточно ориентировано на развитие новых концепций, новых способов мышления, новых путей формализации интуитивного знания. В свою очередь ошибочное представление о науке порождает нежелание властей финансировать (независимо от величины расходов) работу, направленную на углубленное понимание содержания и методов обучения и воспитания. Это нежелание распространяется и на поиск путей оценки влияния скрытых от нас пока факторов, оказывающих существенное воздействие на процессы обучения, а также на поиск способов измерения его результатов.
Подводя итоги этого раздела, необходимо подчеркнуть, что применение традиционных тестов, считающихся отличными инструментами по таким критериям, как различительная способность, внутренняя согласованность, надежность и валидность, привело к принятию неадекватных схем проверки и оценивания, к дезориентирующим нас исследовательским выводам, к социально и нравственно несправедливым решениям в области образовательной политики и практики, к распространению неверных взглядов на исследовательский процесс и науку в целом. Похоже, вместо того, чтобы судить о совершенстве этих тестов по названным критериям, нам надо оценить их по тому, помогают ли они людям обнаруживать и развивать свои таланты, получать их признание; способствуют ли возникновению новых взглядов на проблемы образования; помогают ли понять преимущества и недостатки конкретных программ обучения; помогают ли понять, что работает, а что нет – и почему; как улучшить педагогический процесс; и, наконец, как помочь учителю выявлять способности и таланты каждого из его учеников, как содействовать их развитию и признанию.