46073 (665367), страница 2

Файл №665367 46073 (Методика составления тестовых заданий по курсу Механика) 2 страница46073 (665367) страница 22016-07-31СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 2)

Построение компьютерных тестов можно осуществить по следующим последовательным шагам:

  1. формализация экспертной целевой модели знаний;

  2. нисходящее проектирование тестового пространства;

  3. формирование и наполнение тестовых заданий;

  4. формирование полного компьютерного теста;

  5. тестовый эксперимент;

  6. выбор эффективного теста;

  7. анализ, корректировка и доводка теста до вида эксплуатации.

На рис.1.1 приводится схема создания теста. Множество тестовых заданий (тестовое пространство), согласно принципу исчерпывающего тестирования, вообще говоря, может быть бесконечным. Однако очевидно, что существует конечное подмножество тестовых заданий, использование которых позволяет с большой вероятной точностью оценить соответствие личностной модели знаний экспертным моделям знаний (полный тест). Важнейшим элементом в подготовке тестов выступает класс э
квивалентности тестовых заданий.

Для создания тестов по предметной области существуют и разрабатываются специальные инструментальные программы-оболочки, позволяющие

вырабатывать компьютерные тесты путём формирования базы данных из набора тестовых заданий.

В большинстве случаев тестовые оболочки (ТО) построены на принципах однозначного распознавания ответов тестируемого: выбор, шаблонный ответ, конструирование ответа.

Другим важным свойством ТО должно быть наличие возможности передачи результатов и протокола тестирования какому-либо статистическому пакету для дальнейшей обработки, что в некоторых существующих ТО представлено неполно.[5]





1.3. Критерии качества тестов



Научно обоснованный тест – это метод, соответствующий установ­лен­ным стандартам надежности и валидности.

Традиционно выделяются два основных критерия качества тестов. Пер­вый из них связан с понятием точности измерений и известен, главным, обра­зом, в виде понятия надежности теста.

Качество педагогического контроля в вузе зависит не только от надеж­ности используемых методов, но и от их валидности. Валидность теста — его пригодность для достижения поставленной цели: пригодность по содержанию, пригодность к применению в конкретных обстоятельствах, пригодность по какому-либо критерию или, что то же самое, характеристика его способности изучать то, что он должен изучать по замыслу авторов.[1]



1.3.1. Надежность тестов.



Существует несколько практи­ческих способов определения надежности теста. Самый безупречный со статистиче­ской точки зрения метод определения надежности – это корре­лирование двух параллельных тестов, созданных для измерения одного и того же свойства.

Суть корреляции состоит в том, что из полученной каждым сту­дентом суммы баллов вычитается ровно то число, которое может быть угадано в со­ответствии с теорией вероятностей. Корреляция осуществляется с помощью соотношения:

,

где - скорректированный на догадку тестовый балл испытуемого;

- число правильных ответов, полученных испытуемым в тесте;

- число неправильных ответов;

- число готовых ответов в заданиях теста.

Эта формула применяется к заданиям с одинаковым числом готовых ответов.

Интуитивно наиболее понятный и простой способ определения на­деж­ности теста – это двукратное, по меньшей мере, использование одного и того же теста в той же самой группе студентов. Результаты обоих опро­сов анализируются с целью поиска корреляции между ними. Данный метод имеет свои достоинства и недостатки. Достоинства заключаются в сравнительной простоте его использования, ясности основных посылок, лежащих в определении надежности, простоте расчетов. К недос­таткам можно отнести неопределенность в выборе вре­менного интервала ме­жду первым и вторым опросами. Этот интервал мо­жет колебаться от не­скольких минут до нескольких дней, месяцев и даже лет.

Надежность тестов достаточно просто оценить в гомогенных тестах. Однако, оценка надежности за­метно осложняется в гетерогенных тестах. Осложнение вызвано главным образом некоррелируемостью (или слабой коррелируемостью) гомогенных тестов между собой. Соответственно ответы студентов на задания одного гомогенного теста, как правило, редко коррелируют с ответами на задания другого. Отсутствие же корреляции ме­шает всякой надежде на мало-мальски заметную надежность теста в целом.

Все методы оценки надежности теста основаны на разных теоретических положе­ниях, но все они призваны ответить на один и тот же вопрос – насколько точны проведенные измерения? Само понятие "точность" в каждом случае оценки приобретает несколько отли­чающийся смысл.

Имеются, по меньшей мере, два источника погрешностей, мешающие говорить об абсолютной надежности теста. Первый источник связан с выбор­кой испытуемых. Вряд ли можно найти две такие выборки, в которых тесто­вый опрос был бы одинаково надежным. Скорее всего, значения варьировали бы от выборки к выборке в некоторых пределах в соответствии с законом нормального распределения. Уже одно это призывает к осторожности в ин­терпретации коэффициента надежности. Вместо выражения «надежность теста» мы вынуждены использовать другое, более точное – "полученная в данной выборке оценка надежности теста".

Второй источник погрешностей – в формулировании и отборе заданий. Если мы примем небезосновательное предположение о детерминации (в ста­тистическом смысле) или, иначе, о зависимости конкретных результатов из­мерения от истинных, присущих данным испытуемым в идеальных усло­виях, то коэффициент надежности удобно интерпретировать как коэффициент детерминации.[1]







1.3.2. Валидность тестов.



в отличие от надежности, определение которой сводится к выбору одной из множества расчетных схем, обоснование валидности теста пред­ставляет собой задачу методологического характера. Как и обоснование лю­бой деятельности, процесс валидизации начинается с уточнения цели и кон­кретных задач педагогического контроля. Если ставится цель проверить зна­ния студентов по какой-либо дисциплине и при этом не важно, каким мето­дом это надо будет сделать, то легко понять, что эта цель может быть дос­тигнута посредством использования зачетов, экзаменов, курсовых и диплом­ных работ. Эти и другие методы неравноценны с точки зрения объективности и качества оценки, и потому вопрос о валидности легко переводится в праг­матическую плоскость оценки сравнительной пригодности того или иного метода для достижения поставленной цели.

Тест может быть валидным, если помимо прочих требований средние результаты соответствуют большей части студентов, а сами данные рас­пределяются по нормальному закону. Если это условие не выполняется, то тест считается невалидным с точки зрения соответствия стандартам распреде­ления. Именно отсюда возникает стремление разработчиков тестов добиваться нормальности распределения за счет варьирования числа легких и трудных заданий.

Если в тесте нет достаточного числа легких и трудных заданий, то воз­никает вопрос о его сбалансированности по трудности, то есть обычно в тесте должно быть больше заданий средней трудности и несколько меньше от­кровенно легких или трудных заданий. В процессе создания теста мера труд­ности регулярно проверяется на случайной выборке из того контингента, для которого тест предназначается. В сбалансированном тесте легко добиваются нормальности распределения. Дальнейшее совершенствование идет по пути замены ряда заданий, ответы на которые нарушают нормальность распреде­ления. Трудность заданий влияет на надежность и валидность. Если тест очень трудный, то студенты чаще вынуждены догадываться – какой ответ правиль­ный. Но чем чаще они прибегают к догадке, тем больше распределение ре­зультатов теста приближается к случайному распределению. Поэтому при­годность теста для оценки всей массы студентов будет тем ниже, чем труднее тест. Такое же влияние на надежность, – но по другой причине – оказывает легкий тест, в котором студенты, наоборот, догадываются редко, их ответы устойчивы, но почти нет различий между испытуемыми.

Валидность теста существенно зависит от его разли­чающей способности. Если десять человек в группе получают «отлично», та­кая оценка не позволяет различать, кто из этих десяти лучше, а кто несколько хуже знает предмет. Различающая способность тем выше, чем меньше одина­ковых оценок студенты по нему получают. Следовательно, тем больше ва­риация результатов и более чувствительна шкала к индивидуальным разли­чиям. Поэтому повышению различающей способности теста (РСТ) в стадии его создания уделяется большое внимание. При этом применяются несколько методов:

1.Регулирование по времени тестирования; чем больше стандартное от­клонение, тем больше различающая способность теста.

2. Оптимальный подбор заданий. В принципе РСТ, а вместе с ней и на­дежность теста, возрастают с увеличением доли заданий средней трудности в тесте. Однако в тесте обязательно должна быть некоторая часть легких и трудных вопросов, точное количество которых зависит от конкретных об­стоятельств.

3. Точность измерений. Если, например, время реакции измерять у ис­пытуемых с точностью до одной десятой, сотой, тысячной и так далее се­кунды, то получим различную различающую способность теста.

Валидность теста связана, помимо прочего, с понятиями «гомогенный и гетерогенный тест». Если тест создан с целью проверки знаний по одной учебной дисциплине и все вопросы теста связаны именно с ней, то такой тест считается гомогенным, а значит и валидным для этой частной цели. Поэтому в более чистом виде гомогенный тест представляет собой тест для изучения знаний какому-то частному разделу программы.

Для комплексной оценки знаний студентов может быть составлен тест, состоящий из вопросов по нескольким дисциплинам. Это – пример гетеро­генного теста, который состоит из группы гомогенных тестов. Соответст­венно такой тест является валидным именно для комплексной оценки.

Валидность теста зависит и от так называемой длины теста. Под длиной теста понимается количество заданий, входящих в тест. Существуют тесты очень короткие, состоящие из 7 – 15 заданий, и очень длинные, состоящие из более чем пятисот заданий.

Если тест очень длинный, то ухудшается мотивация и внимание у ис­пытуемых, а это снижает надежность и валидность. Практика показывает, что если тестирование занимает более полутора часов, то при этом возникают ор­ганизационные проблемы, испытуемые с неохотой соглашаются отвечать на вопросы теста. С другой стороны, с точки зрения теории, чем длиннее тест, тем он надежнее. Возникающее противоречие между теорией и практикой решается компромиссом в ту или иную сторону, в зависимости от конкрет­ного случая.

Валидность теста зависит еще и от расположения заданий в тесте. Су­ществует различная практика расположения заданий:

1. По степени возрастания трудности. Такое расположение характерно в основном для гомогенных тестов. Для гетерогенных тестов сохранение это­го принципа выражается в так называемой «спиральной» форме расположения заданий.

2. В случайном порядке. Этот способ расположения заданий широко применяется в психологических тестах и в процессе компьютерного тестиро­вания.

3. В специальном порядке, в соответствии с какой-либо теорией, сооб­ражениями переноса навыков, концентрации внимания и других.

4. В порядке, сочетающем специальный и случайный подбор. Обычно это делается в гетерогенных тестах.

Существуют несколько подходов к валидизации тестов, различающихся в зависимости от используемых критериев. В педагогической практике наи­большее распространение в последние годы получили такие тесты, валид­ность которых не требуется доказывать эмпирически: в таких тестах крите­рием их пригодности является само содержание теста, одобренное опытными преподавателями-экспертами. При этом у преподавателя должна быть уве­ренность в том, что:

  • задания теста находятся в соответствии с программой;

  • задания теста охватывают не один какой-либо раздел, а всю про­грамму курса;

  • высока вероятность того, что студент, успешно ответивший на зада­ния теста, знает предмет в соответствии с полученной оценкой.

Перечисленные три пункта объединяются общей идеей – содержит ли тест задания, пригодные для оценки знаний по конкретной дисциплине? Если в результате статистической проверки выявляется, что ответы на вопросы теста вполне позволяют обоснованно судить о знаниях студентов, то счита­ется, что тест содержит валидные вопросы; он валиден по содержанию. Тре­бо­вание валидности по содержанию предъявляется к каждому вопросу теста, мерой валидности является коэффициент корреляции ответов по заданию с критерием. При создании теста в качестве критерия обычно берутся оценки, выставляемые студентам группой преподавателей-экспертов без тестов. Ре­зультаты студентов по вопросам теста и по оценкам экспертов коррелиру­ются. Высокая согласованность оценок по тесту и у экспертов указывает и на высокую валидность.

Надо подчеркнуть, что нет показателей раз и навсегда установленных надеж­ности и валидности теста. В каждом отдельном исследовании рекомен­дуется проверять качество теста и лишь на этой основе делать выводы о дос­товерно­сти данных.

Таблица 1.1

Характеристики

Тип файла
Документ
Размер
1,5 Mb
Тип материала
Учебное заведение
Неизвестно

Список файлов реферата

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6644
Авторов
на СтудИзбе
294
Средний доход
с одного платного файла
Обучение Подробнее