115755 (711797), страница 2
Текст из файла (страница 2)
Отечественная система образования весьма специфична, поэтому научные и прикладные наработки мировых лидеров по педагогическому тестированию в нашей! стране однозначно не адаптируются, что служит основанием для развития не только прикладных разработок, но и теоретических исследований в данной области; педагогики. Последнее дополнительно стимулируется наличием у нас большого количества научных работников с хорошей математической подготовкой, способных заняться данной актуальной педагогической проблемой. Отдельную группу здесь составляют работы, выполняемые в рамках теории моделирования и параметризации педагогических тестов. Моделирование педагогических тестов I может осуществляться с пр1шенением двух f теоретических подходов — классической ■ теории и современной теории 1RT (Item
Научные сообщения
Response Theory). Первая с помощью определения показателей надежности и ва-пнпности позволяет сделать оценку качества разработанного теста. Для определения взаимосвязанности заданий в тесте в ней используются методы корреляционного „ факторного анализа. Второй подход основан на методологии латентно-структурного анализа XLSAI_c его мощным математическим аппаратом и имеет больше возможностей по созданию эффективных тестов Так, с помощью модели Г.Раша [12] посредством использования характеристических кривых можно оценивать латентные (скрытые) параметры уровня подготовленности испытуемых и трудности заданий. Разумно составленные варианты теста и статистическая обработка результатов тестирования в рамках данной модели позволяют получать оценки латентных параметров на метрической шкале, однако шкалы, соответствующие различным вариантам теста, отличаются друг от друга. Для их преобразования в единую шкалу необходимо иметь дополнительную информацию, получаемую перекрытием вариантов теста для различных групп участников или перекрытием групп испытуемых, исследуемых различными вариантами теста. Такая дополнительная информация устраняет неопределенность начала отсчета каждой шкалы, соответствующей различным вариантам теста.
Использование двухпараметрнческой модели, предложенной А.Бирнбаумом [13], позволяет определять дифференцирующую способность тестовых заданий. Для обеспечения нормализации их распределения по уровню трудности рассматриваются вопросы аппроксимации логистического распределения тестовых заданий [14. с. 59—61]. При работе с этой моделью неопределенными оказываются не только начала отсчета каждой шкалы, соответствующей различным вариантам теста, но и масштабы таких шкал. Для устранения указанных неопределенностей рекомендуется обеспечивать определенное перекрытие вариантов теста. Обсуждаются структура перекрытия, количество общих заданий — узлов и основные требования к ним. Трехпараметрическая модель А.Бирнбаума позволяет при моделировании тестов учитывать вероятность угадывания ответа на каждое задание. Это повышает эффективность проектирования тестов и ждет своего применения.
Следует отметить, что современная теория измерений различает шкалы номинальные (наименований), порядковые (ранговые), интервалов, отношений (пропорций) и разностей. При измерениях в педагогике чаще всего ограничиваются применением порядковых шкал. Однако в работах Б.П.Битинаса, В.И.Михеева, Л.Т.Турбовича, Л.М.Фридмана, К.Инген-камна и других авторов делаются попытки перехода к интервальным шкалам. Для этого все чаще используются стандартные нормы (z-шкала, с-шкала, т-шкала, р-шка-ла и др.), являющиеся нормированными шкалами на уровне шкал интервалов. В этой связи заметим, что педагогические измерения с помощью традиционной 5-балльной шкалы и тестовых оценок также основаны на порядковых шкалах. Однако перевод латентных параметров в единую метрическую шкалу позволяет перейти от качественных порядковых к количественным квазиннтервальным шкалам и проводить адекватную обработку результатов более мощным математическим аппаратом. Наиболее удобным для оценивания результатов тестирования является 100-балльная т-шкала. в которой в настоящее время стал выставляться сертификационный балл выпускников средних школ при проведении единого государственного экзамена.
Отечественная школа при развитии тестовых измерений показала высокую готовность к использованию информационных технологий на всех этапах разработки и внедрения педагогических тестов. Здесь следует отметить значительные достижения Центра тестирования Минобразования РФ в организации централизованного, абитуриентского и репетиционного тестирования, а также единого государственного тестового экзамена, результатом обобщения которых явилась монографическая публикация [15]. Компьютерные технологии автоматической генерации тестов, проведения и обработки результатов тестирования, региональные и федеральные системы тестирования с использованием всемирной информационно-образовательной среды Интернет возводят педагогическое тестирование в России в разряд современных педагогических технологий и позволяют ему быстрыми шагами приближаться к мировому эталонному уровню.
Основное внимание федеральной власти, регионов и учебных учреждений уделяется итоговым аттестационным экзаменам в средней школе и абитуриентским экзаменам в высшей. Это та отправная точка, от которого педагогическое тестирование будет развиваться вниз (в среднюю общеобразовательную и специальную школу) и вверх (в высшую школу и послевузовское образование). Пока нормативная база отечественной системы образования (за исключением рассмотренного выше перехода школа — вуз) не разрешает проводить тестовые экзамены итогового и заключительного уровней, однако во всех компонентах этой системы ведется большая подготовительная работа. Наиболее актуальным становится разработка текущих, тематических и рубежных тестов, используемых в учебном процессе всех образовательных структл-р. Это большое профессиональное иоле, полностью заполнить которое не удастся на ближайшую обозримую перепекших. Для сравнения можно указать, что к США ежегодно знания и способности учашмхея проверяются с помощью 47 млн. тестовых бланков, выпускаемых 400 тестовыми компаниями. Подавляющее большинство из них представляют бланки текущего, тематического и рубежного уровнен
Всевозрастающее число разработчиков педагогических тестов выдвигают перед отечественной системой образования ряд важных задач.
Первая из них связана с сертификацией качества педагогических тестовых материалов, используемых для оценки знаний и других педагогических характеристик обучающихся в образовательных учреждениях РФ. С целью повышения качества образования и дальнейшего совершенствования аттестационных тестовых технологий создан Координационный совет Минобразования России (приказ Минобразования РФ № 1122 от 17.04.2000), призванный осуществлять контроль за соблюдением требований к качеству педагогических тестовых материалов, вырабатывать рекомендации по совершенствованию процесса их сертификации, определять порядок оформления и выдач сертификатов. Наличие сертифицированных педагогических тестов позволит организовать их распределение и будет способствовать формированию рынка тестовых услуг.
Вторая актуальная задача связана с подготовкой квалифицированных тестологов. С недавнего времени эта задача стала государственной, и ее решение предлагается введением в системе дополнительного профессионального образования дополнительной квалификации "тестолог".
Таким образом, можно констатировать, что педагогическое тестирование в России в настоящий исторический момент возрождено и переходит в стадию интенсивного развития. Специфика российских образовательных систем придает ему индивидуальные черты, формирование которых позволит решить ряд важнейших педагогических проблем их интеграции в международные системы образования, реформирования отечественной средней и высшей школы, а также развития научных основ педагогического тестирования.
Тесты в американской системе образования
Интерес к тестам впервые возник в отечественной педагогике в 20-е гг., в период становления советской школы. Тогда активно обсуждался вопрос об отношении к стандартизованным видам учета – тестам успешности. Педагоги хотели найти наиболее объективный и точный способ оценки знаний учащихся. Тесты привлекали их возможностью массовой проверки знаний школьников. Советские педагоги того времени опирались главным образом на исследования этой проблемы в американской школе.
Однако в советской педагогической литературе тех лет указывалось и на ограниченные возможности тестовой методики. Подчеркивалось, что тесты нужны лишь для проверки элементарных школьных навыков и непригодны для выявления глубины и осознанности знаний.
В сер. 30-х гг. работа с тестами была свернута в известным постановлением ЦК ВКП(б) «О педологических извращениях в системе Наркомпросов» (1936), в котором их использование подверглось резкой критике. Вообще-то в постановлении речь шла не о проверки знаний, а о тестировании умственных способностей школьников, которое, хотя и гораздо позднее, было категорически отвергнуто и западной педагогикой. Однако в атмосфере 30-х гг. сам термин "тест" стал символом "педологических извращений". Идея использования тестов в учебном процессе была вычеркнута из арсенала педагогических средств.
Интерес к тестам вновь возродился лишь с начала 60-х гг. Статьи о них появились на страницах педагогических изданий. Исследователи видели достоинства этого метода прежде всего в возможности объективной оценки знаний. Однако, как и в 20-е гг. отмечались ограниченные возможности тестов. Подчеркивалось, что они не выявляют способность ученика логически рассуждать и связно излагать свои мысли и их нецелесообразно применять для проверки сформированности умения обобщать, сравнивать, делать выводы, объяснять явления и факты на основе изученных законов и теорий. В связи с намечаемой реформой образования в России представляется уместным познакомиться с опытом, накопленным американской школой, так как разработка и применение тестов для проверки подготовленности учеников являются се неотъемлемой составной частью. Тестовая методика в США — универсальное средство проверки знаний, умений, профессиональной подготовки во всех областях человеческой деятельности. Для допуска к практически любому роду деятельности, требующей каких-то навыков и знаний, необходимо получение сертификата. Например, десятки тысяч нештатных счетчиков для проведения переписи 2000 г. отбирались среди добровольцев: с помощью специальных тестов, направленных на проверку элементарных канцелярских навыков, умения писать и считать. Тесты для профессиональной деятельности, разумеется, намного сложнее.
В области образования тесты разрабатываются силами специализированных коммерческих компаний, располагающих весьма компетентными специалистами. Отбор материала и степень сложности предлагаемых вопросов зависят от ступени обучения. Естественно, в начальной и средней школе они различны, но во всех случаях включают математику и так называемый вербальный тест (объяснительное чтение: способность понимать текст, проводить аналогии, дополнять незаконченные утверждения, проводить критический анализ текста). Особое значение имеют тесты, предлагаемые в выпускных XI и XII классах. Это прежде всего SAT-1 (Scholastic Aptitude Test) — по существу школьный выпускной экзамен. Он не очень сложен, соответствуя примерно уровню VI—VII классов российской школы. SAT-I принят большинством штатов. Практически он стал общегосударственным, хотя закон, делающий его обязательным для всех, до сих пор остается предметом дискуссий. Есть еше много других аналогичных тестов, например ACT (American College Test) — оценка подготовленности к поступлению в колледж.
Результатами этих тестов, наряду с другими показателями (средние баллы за последние годы обучения, личная характеристика и пр.), колледжи и университеты руководствуются при отборе абитуриентов. Разумеется, требования сильно отличаются н зависимости от ранга учебного заведения. Поступающему в очень престижные и дорогие, например Принстонский или Стенфордский. университеты необходимо иметь оценки, близкие к максимальным, и благоприятные дополнительные характеристики. Для муниципального колледжа достаточно, чтобы оценки по SAT-1 были не ниже уровня среднеамериканского выпускника. В университетах некоторых штатов, например Флориды и Техаса, прием вообще производится не по результатам тестов, а по итоговым школьным оценкам, но эти университеты занимают в общеамериканской табели о рангах соответственно 60-е и 82-е места в списке из 228 американских университетов (147 общественных и 81 частный). Есть заведения, в особенности частные колледжи, которые вообще ничего не требуют: плати деньги и приступай к учебе, а чему научишься и какова будет цена полученного диплома в глазах будущего работодателя — проблема самих студентов.
Обычно время проведения теста строго ограничено: сверх положенного не дадут ни одной лишней секунды, на размышления и колебания времени нет. Например, на SAT-I отводится пять получасовых и два пятнадцатиминутных периода с короткими перерывами между ними. Общее число вопросов — 60 по математике и 78 вербальных. Один из получасовых периодов является "экспериментальным" — его результаты не входят в зачет, однако испытуемый не знает, какой именно. Если он чувствует, что не справился с заданием, то может в течение суток отменить свою работу и пересдать тест в другой раз. Если полученные результаты неудо-влетворительны, то можно пройти испытание повторно, снова внеся небольшую плату. Разумеется, при неизменности содержания, вопросы тестов каждый раз новые. Теоретически тестирование можно проходить сколько угодно раз, однако каждый результат фиксируется в компьютерах системы образования. Поэтому любой серьезный университет всегда имеет возможность поинтересоваться не только очками абитуриента, то и тем, с какой попытки они получены.
Престижные университеты крайне дорожат своей репутацией и очень строго отбирают лишь самых способных и подготовленных: слабый абитуриент не попадет туда ни за какие деньги. Напротив, очень талантливые студенты, с наиболее высокими показателями, вполне реально могут рассчитывать не только на прием, но и на всякие льготы, вплоть до бесплатного образования в самых дорогих университетах.















