Диссертация (1146969), страница 9
Текст из файла (страница 9)
Например: 1, 1, 1, 4, 4, 4, 8, 8, 8.2) Если два соседних значения встречаются одинаково часто, но чащедругих значений, то мода будет равна среднему этих двух значений(Гольдберг, Козлова, 1985). Например: 2, 4, 7, 7, 25, 25, 25, 25, 26, 26, 26, 26,30, 31, 40, мода равна 25,5.3) Если два несмежных значения в группе встречаются одинаково часто,но чаще других значений, то существуют две моды. Такое распределениеоценок является бимодальным (Наследов, 2008).
Например: 4, 8, 8, 8, 9, 11, 14,19, 19, 19, моды 8 и 19.Наибольшей модой в группе называется единственное значение,удовлетворяющее определению моды. Стоит отметить, что во всей группе49может быть несколько меньших мод. Эти моды представляют собойлокальные максимумы распределения частот (Ким, 2007).Медиана — это значение, которое находится посередине упорядоченного множества данных так, что одна половина значений оказываетсябольше медианы, а другая — меньше. (Павловская, Башмакова, 2007).В случае четного количества различных значений медиана высчитывается каксреднее арифметическое между двумя центральными значениями.
Например:2, 4, 7, 7, 25, 25, 25, 25, 26, 26, 26, 26, 30, 31, 40, медиана равна 25.Меры центральной тенденции используют для оценки качества тестапри проведении апробации теста на репрезентативной выборке тестируемых(Павловская, Башмакова, 2007). Известно, что хороший нормативноориентированныйтестобеспечиваетнормальноераспределениеиндивидуальных баллов репрезентативной выборки участников (Гольдберг,Козлова, 1985). При этом в центре распределения находится среднее значениебаллов, вокруг которого группируются остальные значения. Таким образом, вцентре сосредоточено примерно 70% значений, а остальные постепенноуменьшаются к краям распределения, как это видно на рис.
5 (Наследов, 2008).Рис. 5. Стандартное нормальное распределение (по: Наследов, 2008)50Если по результатам теста мы видим распределение баллов, близкое кнормальному, это означает, что на его основе можно определить среднееустойчивое значение баллов. Такое среднее значение корректно принять вкачестве одной из репрезентативных норм выполнения теста (Павловская,Башмакова, 2007).Для характеристик степени рассеяния отдельных значений вокругсреднего используются различные меры: размах, дисперсия, стандартноеотклонение.Размах измеряет на шкале расстояние, в пределах которого изменяютсявсе значения показателя в распределении. Редкое использование размахасвязано с тем, что он является приблизительным показателем, так какучитывает только крайние значения в распределении баллов по тесту и независит от степени изменчивости промежуточных значений.Более надежной мерой считается дисперсия, так как подсчет дисперсииоснован на вычислении отклонений каждого значения показателя от среднегоарифметического в распределении.Формула для расчета дисперсии выглядит так (Ким, 2007):гдеSx2 — дисперсия,Xi — анализируемый показатель,— среднее значение показателя,N — количество значений в анализируемой совокупности данных.Совокупность с большей неоднородностью будет иметь большие помодулю отклонения, и наоборот: для однородных распределений отклонениядолжны быть близки к нулю.
Знак отклонения указывает место результатаученика по отношению к среднему арифметическому по тесту. Если51просуммировать все отклонения, взятые со своим знаком, то длясимметричных распределений сумма будет равна нулю.Помимодисперсии,дляхарактеристикимерыизменчивостираспределения можно использовать еще один показатель вариации —стандартное отклонение.
Стандартное отклонение равно корню квадратномуиз дисперсии.гдеSx2 — дисперсия.Дисперсия играет важную роль в оценке качества нормативноориентированныхтестов.Слабаявариациярезультатовтестируемыхуказывает на низкое качество теста (Челышкова, 2002). Низкая дисперсияиндивидуальных баллов говорит о слабой дифференциации тестируемых поуровню подготовки в группе, — а это прямо противоположна основной целисоздания нормативно-ориентированного теста.Излишне высокая дисперсия, характерная для случая, когда всеучащиеся отличаются по числу выполненных заданий, свидетельствует онеобходимости доработки теста.Степень отклонения распределения наблюдаемых частот выборки отсимметричного распределения, характерного для нормальной кривой,оценивается с помощью асимметрии (Глас, Стэнли, 1976; Гольдберг, Козлова,1985).Асимметрия устанавливается визуально при анализе полигона частот,или гистограммы (Наследов, 2008).52гдеXi — анализируемый показатель,– среднее значение показателя,N — количество значений в анализируемой совокупности данных,Sx3 — куб стандартного отклонения (по: Челышкова, 2002).Рис.
6. Распределение частот с различными значениями асимметрии As(по: Наследов, 2008)В случае симметричного распределения коэффициент асимметрии будетравен нулю. При левосторонней асимметрии значение моды больше значениямедианы,которая,всвоюочередь,большезначениясреднегоарифметического; при правосторонней асимметрии наблюдается обратнаязависимость: среднее арифметическое больше медианы, а медиана большемоды (Гольдберг, Козлова, 1985). Коэффициент асимметрии отрицателен прилевосторонней асимметрии и положителен при правосторонней, то естьасимметрия распределения положительна, если основная часть значенийиндивидуальных баллов лежит справа от среднего значения, что обычнохарактерно для излишне легких тестов.
Асимметрия распределения балловотрицательна, если большинство студентов получили оценки ниже среднего53балла. Эффект отрицательной асимметрии встречается в излишне трудныхтестах.Помимо отклонения распределения частот от симметричного вида поотношению к среднему арифметическому необходимо определить, являютсяли полигон частот, или гистограмма, островершинным или плосковершинным(Гольдберг, Козлова, 1985). Мерой островершинности графика распределениятого признака, который измеряют, является эксцесс (Наследов, 2008).гдеXi — анализируемый показатель,– среднее значение показателя,N — количество значений в анализируемой совокупности данных,Sx — стандартное отклонение (Дружинин, 1997).Рис.7.Распределение(по: Наследов, 2008)частотсразнымизначениямиEx54Нулевой эксцесс соответствует нормальному распределению, привеличине эксцесса больше нуля наблюдается островершинное распределение,а если эксцесс лежит в пределах от -3 до нуля — плосковершинноераспределение (Наследов, 2008).Понятие «эксцесс» применимо лишь к унимодальным распределениям.Интерпретация результата, указывающего на крутизну кривой распределения,возможна в сравнительно небольшой окрестности моды и теряет свой смыслпо мере удаления вдоль кривой.
В случае бимодального распределениянеобходимо рассматривать эксцесс в окрестности каждой моды. Бимодальноераспределение указывает на то, что выборка студентов по результатамвыполнения теста разделилась на две группы. Одна из них справилась сбольшинством легких заданий теста, а другая — с большинством трудных.Наряду с исследованием распределения характеристик измеренногопризнаканеобходимоисследоватьвнутреннююсогласованностьхарактеристик, которые описывают один и тот же признак, что удобно сделатьпри помощи вычисления коэффициента альфа Кронбаха.Стандартизированный коэффициент альфа Кронбахавычисляетсяпо формуле (Клайн, 1994):где— количество исследуемых компонентов,— средний коэффициент корреляции между компонентами.Также коэффициент можно вычислить по следующей формуле:55,где— число исследуемых компонентов,— среднеквадратичное отклонение всех исследованных множеств,— среднеквадратичное отклонение отдельного компонента.Несмотря на то, что альфа Кронбаха может принимать значения от 1 до∞, только положительные значения поддаются интерпретации.
АльфаКронбаха сравнивает разброс каждого элемента с общим разбросом всейшкалы. Если разброс результатов теста меньше, чем разброс результатов длякаждого отдельного вопроса, это означает, что каждый отдельный вопроснаправлен на исследование одного и того же признака, свойства или явления.Они вырабатывают значение, которое можно считать истинным. Еслиполучается случайный разброс при ответе на вопросы, коэффициент альфаКронбаха будет равен 0.
Тест в этом случае нельзя считать надежным. Если жевсе вопросы измеряют один и тот же признак, то коэффициент альфа Кронбахав этом случае будет равен 1, и тест считается надежным. Ученые полагают,что профессионально разработанные тесты должны иметь внутреннююсогласованность на уровне не менее 0.9 (Дружинин, 1997; Наследов, 2008).После оценки характеристик теста в целом необходимо исследоватьтестовыезадания,вчастностидискриминативностьзаданийтеста.Дискриминативность заданий теста — способность отдельных пунктов(заданий) теста дифференцировать обследуемых относительно «максимального» или «минимального» результата теста (Наследов, 2008; Павловская,Башмакова, 2007).Любой ответ тестируемого на конкретное задание можно оценить подвухбалльной шкале — «верно» (1 балл), «неверно» (0 баллов). Сумма баллов56по всем пунктам представляет собой первичную («сырую») оценку.