Непараметрические методы
4. Непараметрические методы
Непараметрические методы математической статистики это методы непосредственной оценки и проверки гипотез о теоретическом распределении вероятностей и тех или иных его общих свойствах (симметрии, независимости и т. п.) по результатам наблюдений. Название «Непараметрические методы» подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретическое распределение принадлежит какому-либо семейству, зависящему от конечного числа параметров (например, семейству нормальных распределений), и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений. Особенность непараметрических методов, в отличие от классических методов, состоит в независимости от неизвестного теоретического распределения.
В качестве примера непараметрических методов можно привести критерий проверки согласованности теоретических и эмпирических распределений (критерий Колмогорова). Пусть результаты независимых наблюдений имеют функцию распределения
и пусть
обозначает эмпирическую функцию распределения, построенную по
независимым наблюдениям (
— несмещённая и состоятельная оценка для
). Пусть Dn — наибольшее по абсолютной величине значение разности
. Случайная величина
имеет, в случае непрерывности
, функцию распределения
, не зависящую от
и стремящуюся при безграничном возрастании
к пределу
.
Отсюда при достаточно больших для вероятности
неравенства
получается приближённое выражение
(*)
функция табулирована. Её значения для некоторых
приведены в таблице.
Таблица значений функции
Равенство (*) используется для проверки гипотезы о том, что теоретическим распределением является распределение с заданной непрерывной функцией распределения : сначала по результатам наблюдений находят значение величины
, a затем по формуле (*) вычисляют вероятность получить отклонение
от
, большее или равное наблюдённому. Если указанная вероятность достаточно мала, точнее равна наперёд заданному малому числу
, 0<
< 1, то в соответствии с общими принципами статистических гипотез проверки проверяемую гипотезу отвергают. В противном случае считают, что результаты опыта не противоречат проверяемой гипотезе. Аналогично проверяется гипотеза о том, что две независимые выборки объёма
, и
соответственно получены из одной и той же генеральной совокупности с непрерывным законом распределения, т. е. что соответствующие функции распределения одинаковы (гипотеза однородности двух выборок). При этом вместо формулы (*) пользуются тем, что вероятность неравенства
имеет пределом , где
есть наибольшее по абсолютной величине значение разности
. Приведённые примеры относятся к непараметрическим методам, основанным на разностях теоретического и эмпирического или двух эмпирических распределений.
Дополнительным примером непараметрических методов могут служить методы проверки гипотезы о том, что теоретическое распределение принадлежит семейству нормальных распределений. Один из этих методов — так называемый метод выпрямленной диаграммы. Этот метод основывается на следующем замечании. Если случайная величина имеет нормальное распределение с параметрами и
, то
,
где — функция, обратная нормальной:
.
Таким образом, график функции будет прямой линией, а график функции
— ломаной линией, близкой к этой прямой. Степень близости и служит простейшим критерием для проверки гипотезы нормальности распределения
.
"11 Инициирование государственной политики" - тут тоже много полезного для Вас.
Значительное место в современной математической статистике занимают непараметрические методы, в которых используются не сами эмпирические функции распределения, а некоторые функции от порядковых статистик — членов вариационного ряда. Если используются порядковые номера результатов наблюдений или ранги, то такие непараметрические критерии называются ранговыми, они, как правило, являются критериями однородности. Например, пусть и
— взаимно независимые элементы двух выборок с непрерывными функциями распределений. Для проверки гипотезы о том, что соответствующие
и
функции распределения одинаковы, можно использовать ранговый критерий, основанный на значениях функции от рангов:
где — ранг случайных величин
, в общем вариационном ряду
и
, а функция
,
определяется заранее заданной подстановкой
где — одна из возможных перестановок чисел 1,2,...,
. Выбор подстановки может быть осуществлён оптимальным образом.
Ранговые критерии также используются для проверки гипотез случайности и независимости.