Популярные услуги

Критерий Колмогорова-Смирнова

2021-03-09СтудИзба

Вопрос 3

λ - критерий Колмогорова-Смирнова

Назначение критерия

Критерий λ предназначен для сопоставления двух распределений:

а)      эмпирического с теоретическим, например, равномерным или нормальным;

б)      одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Описание критерия

Рекомендуемые материалы

Если в методе χ2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала часто­ты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверны­ми. В формулу критерия λ  включается эта разность. Чем больше эмпи­рическое значение λ, тем более существенны различия.

Гипотезы                                                                         -

Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

Графическое представление критерия

Рассмотрим для иллюстрации распределение желтого (№4) цвета в 8-цветном тесте М. Люшера. Если бы испытуемые случайным обра­зом выбирали цвета, то желтый цвет, так же, как и все остальные, равновероятно мог бы занимать любую из 8-и позиции выбора. На практике, однако, большинство испытуемых помещают этот цвет, "цвет ожидания и надежды" на одну из первых позиций ряда. 

На Рис. 4.9 столбиками представлены относительные частоты8 попадания желтого цвета сначала на 1-ю позицию (первый левый стол­бик), затем на 1-ю и 2-ю позицию (второй столбик), затем на 1-ю, 2-ю и 3-ю позиции и т. д. Мы видим, что высота столбиков постоянно воз­растает, так как они отражают относительные частоты, накопленные к данной позиции. Например, столбик на 3-й позиции имеет высоту 0,51. Это означает, что на первые три позиции желтый цвет помещают 51% испытуемых.

8 Относительная частота, или частость, - это частота, отнесенная к общему коли­честву наблюдении; в данном случае это частота попадания желтого цвета на дан­ную позицию, отнесенная к количеству испытуемых. Например, частота попадания желтого цвета на 1-ю позицию ƒ=24; количество испытуемых n=102; относительная частота ƒ*=ƒ/n=О,235.

Прерывистой линией на Рис. 4.9 соединены точки, отражающие накопленные частоты, которые наблюдались бы, если бы желтый цвет с равной вероятностью попадал на каждую из 8-и позиций. Сплошными линиями обозначены расхождения между эмпирическими и теоретически­ми относительными частотами. Эти расхождения обозначаются как d.

Рис 4.9. Сопоставления в критерии λ: стрелками отмечены расхождения между эмпирическими и теоретическими накоплениями относительными частотами по каждому разряду

Максимальное расхождение на Рис. 4.9 обозначено как dmax Именно эта, третья позиция цвета, и является переломной точкой, опре­деляющей, достоверно ли отличается данное эмпирическое распределе­ние от равномерного. Мы проверим это при рассмотрении Примера 1.

Ограничения критерия λ

1. Критерии требует, чтобы выборка была достаточно большой. При сопоставлении двух эмпирических распределений необходимо, что­бы n1,2 >50. Сопоставление эмпирического распределения с теоре­тическим иногда допускается при n>5 (Ван дер Варден Б.Л., 1960; Гублер Е.В., 1978).

2. Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, мы можем за разряды принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточ­ности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то и накопление частот будет отражать лишь этот элемент случайного соседства разрядов. Например, если шесть стимульных картин в ме­тодике Хекхаузена разным испытуемым предъявляются в разном порядке, мы не вправе говорить о накоплении реакций при переходе от картины №1 стандартного набора к картине №2 и т. д. Мы не можем говорить об однонаправленном изменении признака при со­поставлении категорий "очередность рождения", "национальность", "специфика полученного образования" и т.п. Эти данные представ­ляют собой номинативные шкалы: в них нет никакого однозначного однонаправленного изменения признака.

Итак, мы не можем накапливать частоты по разрядам, которые отличаются лишь качественно и не представляют собой шкалы порядка. Во всех тех случаях, когда разряды представляют собой не упо­рядоченные по возрастанию или убыванию какого-либо признака кате­гории, нам следует применять метод χ2 .

Пример 1: Сопоставление эмпирического распределения с теоретическим

В выборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний воз­раст 20 лет, проводился тест Люшера в 8-цветном варианте. Установ­лено, что желтый цвет предпочитается испытуемыми чаще, чем отверга­ется (Табл. 4.16). Можно ли утверждать, что распределение желтого цвета по 8-и позициям у здоровых испытуемых отличается от равно­мерного распределения?

Таблица 4.16

Эмпирические частоты попадания желтого цвета на каждую из 8 позиций (n=102)

Разряды

Позиции желтого цвета

Сумма

1

2

3    4

5

6

7

8

Эмпирические частоты

24

25

13 | 8

15

10

9

8

102

Сформулируем гипотезы.

H0: Эмпирическое распределение желтого цвета по восьми позициям не отличается от равномерного распределения.

H1: Эмпирическое распределение желтого цвета по восьми позициям отличается от равномерного распределения.

Теперь приступим к расчетам, постепенно заполняя результатами таблицу расчета критерия λ. Все операции лучше прослеживать по Табл. 4.17, тогда они будут более понятными.

Занесем в таблицу наименования (номера) разрядов и соответст­вующие им эмпирические частоты (первый столбец Табл. 4.17).

Затем рассчитаем эмпирические частости ƒ* по формуле:

ƒ*j = ƒ*/n

где fj - частота попадания желтого цвета на данную позицию;      n - общее количество наблюдений;

      j - номер позиции по порядку.

Запишем результаты во второй столбец (см. Табл. 4.17).

Теперь нам нужно подсчитать накопленные эмпирические часто­сти ∑ƒ*. Для этого будем суммировать эмпирические частости ƒ*. На­пример, для 1-го разряда накопленная эмпирическая частость будет равняться эмпирической частости 1-го разряда, Eƒ*1=0,2359 .

Для 2-го разряда накопленная эмпирическая частость будет пред­ставлять собой сумму эмпирических частостей 1-го и 2-го разрядов:

Eƒ*1+2=O,235+0,147=0,382

Для 3-го разряда накопленная эмпирическая частость будет пред­ставлять собой сумму эмпирических частостей 1-го, 2-го и 3-го разрядов:

Eƒ*1+2+3=0,235+0,147+0,128=0,510

Мы видим, что можно упростить задачу, суммируя накопленную эмпирическую частость предыдущего разряда с эмпирической частостью данного разряда, например, для 4-го разряда:

Eƒ*1+2+3+4=0,510+0,078=О,588

Запишем результаты этой работы в третий столбец.

Теперь нам необходимо сопоставить накопленные эмпирические частости с накопленными теоретическими частостями. Для 1-го разряда теоретическая частость определяется по формуле:

f*теор=1/k

9Все формулы приведены для дискретных признаков, которые могут быть выра­жены целыми числами, например: порядковый номер, количество испытуемых, ко­личественный состав группы и т.п.

где k - количество разрядов (в данном случае - позиций цвета).

Для рассматриваемого примера:

f*теор =1/8=0,125

Эта теоретическая частость относится ко всем 8-и разрядам. Действительно, вероятность попадания желтого (или любого другого) цвета на каждую из 8-и позиций при случайном выборе составляет 1/8, т.е. 0,125.

Накопленные теоретические частости для каждого разряда определяем суммированием.

Для 1-го разряда накопленная теоретическая частость равна теоретической частости попадания в разряд:

f*т1=0,125

Для 2-го разряда накопленная теоретическая частость представ­ляет собой сумму теоретических частостей 1-го и 2-го разрядов:

f*т1+2=0,125+0,125=0,250

Для 3-го разряда накопленная теоретическая частость представ­ляет собой сумму накопленной к предыдущему разряду теоретической частости с теоретической частостью данного разряда:

f*т1+2+3=0,250+0,125=0,375

Можно определить теоретические накопленные частости и путем умножения:

S f*тj= f*теор*j

где f*теор  - теоретическая частость;

j - порядковый номер разряда.

Занесем рассчитанные накопленные теоретические частости в четвертый столбец таблицы (Табл. 4.17).

Теперь нам осталось вычислить разности между эмпирическими и теоретическими накопленными частостями (столбцы 3-й и 4-й). В пя­тый столбец записываются абсолютные величины этих разностей, обо­значаемые как d.

Определим по столбцу 5, какая из абсолютных величин разности является наибольшей. Она будет называться dmax. В данном случае dmax =0,135.

Теперь нам нужно обратиться к Табл. X Приложения 1 для оп­ределения критических значений dmax при n=102.

Таблица 4.17

Расчет критерия при сопоставлении распределения выборов желтого цвета с равномерным распределением (n=102)

Позиция желтого цвета

Эмпирическая частота

Эмпирическая частость

Накопленная эмпирическая частость

Накопленная теоретическая частость

Разность

1

24

0,235

0,235

0,125

0,110

2

15

0,147

0,382

0,250

0,132

3

13

0,128

0,510

0,375

0,135

4

8

0,078

0,588

0,500

0,088

5

15

0,147

0,735

0,625

0,110

6

10

0,098

0,833

0,750

0,083

7

9

0,088

0,921

0,875

0,046

8

8

0,079

1,000

1,000

0,000

Суммы

102

1,000

Для данного случая, следовательно,

Очевидно, что чем больше различаются распределения, тем больше и различия в накопленных частостях. Поэтому нам не составит труда распределить зоны значимости и незначимое™ по соответствую­щей оси:

dэмп =0,135

dэмп- dкр

Ответ: Но отвергается при р=0,05. Распределение желтого цве­та по восьми позициям отличается от равномерного распределения. Представим все выполненные действия в виде алгоритма

АЛГОРИТМ 14

Расчет абсолютной величины разности d между эмпирическим и равномерным распределениями

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2.  Подсчитать относительные эмпирические частоты (частости) для каждого разряда по формуле:

ƒ*эмп = ƒэмп /n

где ƒэмп  - эмпирическая частота по данному разряду;

п - общее количество наблюдений.

Занести результаты во второй столбец.

3.         Подсчитать накопленные эмпирические частости ∑f*j по формуле:

f*j=∑f*j -1+f*j

где f*j -1 - частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

f*j:- эмпирическая частость данного j-ro разряда.

Занести результаты в третий столбец таблицы.

4.         Подсчитать накопленные теоретические частости для каждого раз­ряда по формуле:

fj=∑fj -1+fj

где =∑fj -1 - теоретическая частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

ƒ*тj : - теоретическая частость данного разряда. Занести результаты в третий столбец таблицы.

5.Вычислить разности между эмпирическими и теоретическими нако­пленными частостями по каждому разряду (между значениями 3-го и 4-го столбцов).

6.Записать в пятый столбец абсолютные величины полученных раз­ностей, без их знака. Обозначить их как d.

7.Определить по пятому столбцу наибольшую абсолютную величину разности - dmax.

8.По Табл. X Приложения 1 определить или рассчитать критические значения dmax для данного количества наблюдений n.

Если dmax равно критическому значению d или превышает его, различия между распределениями достоверны.

Пример 2: сопоставление двух эмпирических распределений

Интересно сопоставить данные, полученные в предыдущем при­мере, с данными обследования X. Кларом 800 испытуемых (Klar H., 1974, р. 67). X. Кларом было показано, что желтый цвет является единственным цветом, распределение которого по 8 позициям не отли­чается от равномерного. Для сопоставлений им использовался метод χ2. Полученные им эмпирические частоты представлены в Табл. 4.18.

Таблица 4.18

Эмпирические частоты попадания желтого цвета на каждую из 8 пози­ций в исследовании X. Клара (по: Klar H., 1974) (п=800)

Разряды-позиции желтого цвета

1

2

3

4

5

6

7

8

Сумма

Эмпирические частоты

98

113

116

87

91

112

97

86

800

Сформулируем гипотезы.

Н0: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара не различаются.

H1: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара отличаются друг от друга.

Поскольку в данном случае мы будем сопоставлять накопленные эмпирические частости по каждому разряду, теоретические частости нас не интересуют.

Все расчеты будем проводить в таблице по алгоритму 15.

АЛГОРИТМ 15

Расчет критерия λ при сопоставления двух эмпирических распределений

1.Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты, полученные в распределении 1 (первый столбец) и в распределении 2 (второй столбец).

2.Подсчитать эмпирические частости по каждому разряду для распределения 1 по формуле:

ƒ*ээ/n1

где ƒэ  - эмпирическая частота в данном разряде;

n1[ - количество наблюдений в выборке.

Занести эмпирические частости распределения 1 в третей столбец.

3.         Подсчитать эмпирические частости по каждому разряду для распределения 2 по формуле:

ƒ*ээ/n2

где ƒэ  - эмпирическая частота в данном разряде;

n2 - количество наблюдений во 2-й выборке.

Занести эмпирические частости распределения 2 в четвертый столбец таблицы.

4.         Подсчитать накопленные эмпирические частости для распределения 1 по форму­ле:

∑ƒ*j =∑ƒ*j-1 +ƒ*j

где ∑ƒ*j-1 - частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

ƒ*j-1 - частости данного разряда.

Полученные результаты записать в пятый столбец.

5.Подсчитать накопленные эмпирические частости для распределения 2 по той же формуле к записать результат в шестой столбец.

6.Подсчитать разности между накопленными частостями по каждому разряду.
Записать в седьмой столбец абсолютные величины разностей, без их знака.
Обозначить их как d.

7.Определить по седьмому столбцу наибольшую абсолютную величину разности

4пах-

8.         Подсчитать значение критерия λ по формуле:

где  n1 - количество наблюдений в первой выборке;

n2 - количество наблюдении во второй выборке.

9.         По Табл. XI Приложения 1 определить, какому уровню статистической зна­чимости соответствует полученное значение λ.

Если λэмп > 1,36, различия между распределениями достоверны.

Последовательность выборок может быть выбрана произвольно, так как расхождения между ними оцениваются по абсолютной величине разностей. В нашем случае первой будем считать отечественную выбор­ку, второй - выборку Клара.

Таблица 4.19

Расчет критерия при сопоставлении эмпирических распределений

желтого цвета в отечественной выборке (n1=102)

и выборке Клара (п2=:800)

Позиция желтого цвета

Эмпирические частоты

Эмпирические частости

Накоплены эмпирические частности

Разность

∑ƒ*1-∑ƒ*2

ƒ1

ƒ2

ƒ*1

ƒ*2

∑ƒ*1

∑ƒ*2

1

24

98

0,235

0,123

0,235

0,123

0,112

2

15

113

0,147

0,141

0,382

0,264

0,118

3

13

116

0,128

0,145

0,510

0,409

0,101

4

8

87

0,078

0,109

0,588

0,518

0,070

5

15

91

0,147

0,114

0,735

0,632

0,103

6

10

112

0,098

0,140

0,833

0,772

0,061

7

9

97

0,088

0,121

0,921

0,893

0,028

8

8

86

0,079

0,107

1,000

1,000

0

Суммы

102

800

1,000

1,000

Максимальная  разность  между  накопленными   эмпирическими частостями составляет 0,118 и падает на второй разряд.

В соответствии с пунктом 8 алгоритма 15 подсчитаем значение λ:

По Табл. XI Приложения 1 определяем уровень статистической
значимости полученного значения: р=0,16                            :

Построим для наглядности ось значимости.

На оси указаны критические значения λ соответствующие приня­тым уровням значимости: λ0,05=1,36, λ0,01=1,63.

Зона значимости простирается вправо, от 1,63 и далее, а зона незначимости – влево, от 1,36 к меньшим значениям.

λ эмп < λкр

Ответ: Но принимается. Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара совпадают. Таким образом, распределения желтого цвета в двух выбор­ках не различаются, но в то же время они по-разному соотносятся с равномерным распределением: у Клара отличий от равномерного рас­пределения не обнаружено, а 8 отечественной выборке различия обна­ружены (р<0,05). Возможно, картину могло бы прояснить применение другого метода?

Е.В. Гублер (1978) предложил сочетать использование критерия λ с критерием φ* (угловое преобразование Фишера).

Об этих возможностях сочетания методов λ и φ* мы поговорим в следующей лекции.

Ещё посмотрите лекцию "48. Экономико-географическая характеристика г. Москвы в условиях перехода к рыночным отношениям." по этой теме.

.5. Алгоритм выбора критерия для сравнения распределений

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Нашёл ошибку?
Или хочешь предложить что-то улучшить на этой странице? Напиши об этом и получи бонус!
Бонус рассчитывается индивидуально в каждом случае и может быть в виде баллов или бесплатной услуги от студизбы.
Предложить исправление
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5138
Авторов
на СтудИзбе
442
Средний доход
с одного платного файла
Обучение Подробнее