Непараметрические методы
4. Непараметрические методы
Непараметрические методы математической статистики это методы непосредственной оценки и проверки гипотез о теоретическом распределении вероятностей и тех или иных его общих свойствах (симметрии, независимости и т. п.) по результатам наблюдений. Название «Непараметрические методы» подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретическое распределение принадлежит какому-либо семейству, зависящему от конечного числа параметров (например, семейству нормальных распределений), и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений. Особенность непараметрических методов, в отличие от классических методов, состоит в независимости от неизвестного теоретического распределения.
В качестве примера непараметрических методов можно привести критерий проверки согласованности теоретических и эмпирических распределений (критерий Колмогорова). Пусть результаты независимых наблюдений имеют функцию распределения и пусть обозначает эмпирическую функцию распределения, построенную по независимым наблюдениям ( — несмещённая и состоятельная оценка для ). Пусть Dn — наибольшее по абсолютной величине значение разности . Случайная величина имеет, в случае непрерывности , функцию распределения , не зависящую от и стремящуюся при безграничном возрастании к пределу
.
Отсюда при достаточно больших для вероятности неравенства получается приближённое выражение
(*)
функция табулирована. Её значения для некоторых приведены в таблице.
Таблица значений функции
Равенство (*) используется для проверки гипотезы о том, что теоретическим распределением является распределение с заданной непрерывной функцией распределения : сначала по результатам наблюдений находят значение величины , a затем по формуле (*) вычисляют вероятность получить отклонение от , большее или равное наблюдённому. Если указанная вероятность достаточно мала, точнее равна наперёд заданному малому числу , 0<< 1, то в соответствии с общими принципами статистических гипотез проверки проверяемую гипотезу отвергают. В противном случае считают, что результаты опыта не противоречат проверяемой гипотезе. Аналогично проверяется гипотеза о том, что две независимые выборки объёма , и соответственно получены из одной и той же генеральной совокупности с непрерывным законом распределения, т. е. что соответствующие функции распределения одинаковы (гипотеза однородности двух выборок). При этом вместо формулы (*) пользуются тем, что вероятность неравенства
имеет пределом , где есть наибольшее по абсолютной величине значение разности . Приведённые примеры относятся к непараметрическим методам, основанным на разностях теоретического и эмпирического или двух эмпирических распределений.
Дополнительным примером непараметрических методов могут служить методы проверки гипотезы о том, что теоретическое распределение принадлежит семейству нормальных распределений. Один из этих методов — так называемый метод выпрямленной диаграммы. Этот метод основывается на следующем замечании. Если случайная величина имеет нормальное распределение с параметрами и , то
,
где — функция, обратная нормальной:
.
Таким образом, график функции будет прямой линией, а график функции — ломаной линией, близкой к этой прямой. Степень близости и служит простейшим критерием для проверки гипотезы нормальности распределения .
"11 Инициирование государственной политики" - тут тоже много полезного для Вас.
Значительное место в современной математической статистике занимают непараметрические методы, в которых используются не сами эмпирические функции распределения, а некоторые функции от порядковых статистик — членов вариационного ряда. Если используются порядковые номера результатов наблюдений или ранги, то такие непараметрические критерии называются ранговыми, они, как правило, являются критериями однородности. Например, пусть и — взаимно независимые элементы двух выборок с непрерывными функциями распределений. Для проверки гипотезы о том, что соответствующие и функции распределения одинаковы, можно использовать ранговый критерий, основанный на значениях функции от рангов:
где — ранг случайных величин , в общем вариационном ряду и , а функция , определяется заранее заданной подстановкой
где — одна из возможных перестановок чисел 1,2,..., . Выбор подстановки может быть осуществлён оптимальным образом.
Ранговые критерии также используются для проверки гипотез случайности и независимости.