Диссертация (1138126), страница 36
Текст из файла (страница 36)
На основании выбранного в п. 5 распределения G S | H 0 вычисляют значениеP S S* g s | H ds 1 G S0*| H0 S*гдеG S | H 0 – распределение статистики критерия при справедливости гипотезы H 0 .7. Если P S S * , где – задаваемый уровень значимости, то нет оснований дляотклонения проверяемой гипотезы. В противном случае проверяемая гипотеза H 0отвергается. Можно вычисленное значение статистики S * сравнить с критическимзначением S , определяемым из условия g s | H ds0S.Гипотеза о согласии отвергается, если значение статистики попадает вкритическую область, т.
е. при S* S .2.3. Критерии, используемые для проверки сложных гипотез2.3.1. Критерий 2 Фишера172Данный критерий позволяет проверять согласие как с дискретными, так и снепрерывными распределениями.Предварительная обработка состоит в группировке данных в некоторые множества Ai ,i 1,m и подсчете числа наблюдений ni в каждом множестве.
Для устойчивой работыкритерия должно быть n 50 , ni 5 . При этом, строго говоря, разбиение на множестваAi надо делать, не глядя на выборку.В качестве оценки параметра (в общем случае векторного) берется оценкамаксимального правдоподобия ̂ . Опираясь на эту оценку, вычисляются гипотетическиеmвероятности появления множествm p 1i 1pi P Ai | H 0 i 1,m 0. Посколькуni 1in, имеем0i.mСтатистикой критерия Фишера являетсяраспределение12 m k 1 2 m k 1S* i 1 n np 0i2inpi0, которая имеет примерно. Тогда критическое значение- квантиль распределения 2 m k 1S 12 m k 1, где*уровня 1 .
Если S S , тогипотезу о том, что распределение наблюдений может принадлежать классуF x, ,следует отвергнуть, поскольку даже с «лучшим» распределением в этом классе согласие*плохое. Если S S , гипотезу H 0 можно принять при выбранном уровне значимости .22.3.2. Критерий типа Мизеса (Андерсона-Дарлинга)Критерий предназначен для проверки согласия в случае непрерывных функцийраспределенияF x, . Это, разумеется, является ограничением по сравнению с2критерием Фишера, но в то же время не производится группировка данных, которая влюбом случае ведет к потере информации.
Практика показывает, что для непрерывныхфункцийF x, такие критерии, как критерий Андерсона-Дарлинга или критерийКолмогорова-Смирнова, работают точнее. Их общим недостатком является то, что нужноиметь возможность использовать специальные таблица для каждого типа проверяемых173распределений, но при пользовании качественными пакетами обработки данных такойпроблемы не возникает.Оценка параметра может вычисляться методом максимального правдоподобия илиминимизацией приведенной ниже статистики критерияn 2i 1 2i 1 S * n 2 ln F xi , 1 ln 1 F xi , 2n i 1 2nЗначения S при использовании оценок максимального правдоподобия приведены втабл.
1Таблица 1. Критические значения S при использовании ОМП для критерияАндерсона-ДарлингаРаспределениеУровень значимости 0.050.01Коши1,22312,0845Лапласа1,00151,5188Логнормальное0,74981,0897Логистическое0,65890,8909Нормальное0,74711,0698Вейбулла-Гнеденко0,76081,0956Гипотеза о согласии отвергается, если S* S .2.3.3.
Критерий КолмогороваКак и предыдущий, предназначен для проверки согласия при непрерывной функцииF x, . Оценивание неизвестного параметра производится методом максимальногоправдоподобия либо минимизацией статистики критерияSS* 6nDn 1гдеDn max Dn , Dn 6 ni 1iDn max F xi , Dn max F xi , i 1,n ni1,nn . Значения,,при использовании оценок максимального правдоподобия приведены в табл.
2Таблица 2. Критические значения S при использовании ОМП для критерияКолмогороваРаспределениеУровень значимости 0.050.01174КошиЛапласаЛогнормальноеЛогистическоеНормальноеВейбулла-Гнеденко0,87720,94970,97310,80360,90420,90691,03501,12061,22340,92611,05991,0684Как и в предыдущем случае, гипотеза отвергается, если S* S .2.3.4. Критерий СмирноваПо назначению и применению похож на критерий Колмогорова. Статистикой критерияявляетсяS* 6nDn 129nОценивание параметра производится методом максимального правдоподобия либо*минимизацией статистики S .
Критические значения S приведены в табл. 3.Таблица 3. Критические значения S при использовании ОМП для критерияСмирноваРаспределениеУровень значимости 0.050.012,76334,0668Коши3,01604,4495Лапласа3,18505,0813Логнормальное2,26793,0761Логистическое2,81024,0581Нормальное2,6923,8129Вейбулла-Гнеденко*При S S гипотеза о согласии отвергается.Поскольку критерии Колмогорова и Смирнова опираются на близкие статистики,часто говорят о критерии Колмогорова-Смирнова.22.3.5.
Критерий типа Мизеса (Крамера-Мизеса-Смирнова)По назначению и применению похож на критерии Андерсона-Дарлинга, Колмогороваи Смирнова, но опирается на статистикуn12i 1 S F xi , 12n i 1 2n 2*Неизвестный параметр может быть найден методом максимального правдоподобия*Sили минимизацией статистики S . Критические значения приведены в табл.
4.175Таблица 4. Критические значения S при использовании ОМП для критерияКрамера-Мизеса-СмирноваРаспределениеУровень значимости 0.050.010,16180,2706КошиГамма0,15040,2529Лапласа0,14580,2449Логнормальное0,09820,1379Логистическое0,12210,1756НормальноеРавномерное0,1263Вейбулла-ГнеденкоПри S* S гипотеза о согласии отвергается.При проверке гипотезы о согласии с гамма-распределением критические значения Sв критериях Андерсона-Дарлинга, Колмогорова, Смирнова и Крамера-Мизеса-Смирновазависят от значений оцениваемого параметра , соответствующие таблицы критическихзначений см.
http://www.ami.nstu.ru/%7Eheadrd/applied/nepar/2_2_5.htm.2.4. Анализируемые параметрические распределения вероятностейПри проверке сложных гипотез в качестве альтернативных используются следующиераспределения, которые по своим характеристикам в той или иной мере могутсоответствовать анализируемым массивам.2.4.1. Распределение КошиЭто распределение имеет плотность видаp x x m22где m - параметр положения, являющийся модой и медианой, а - параметр формы.Моменты распределения бесконечны.
В частности, это означает, что привычныестатистические оценки X 1 n1 n2длясреднегоиXS Xi X in 1 i 1n i 12для разбросабессмысленны. Распределение часто встречается в задачах с «тяжелыми хвостами»,поскольку его плотность убывает как x 2 .На рис.1 представлены примеры графиков p x с разными значениями параметров m(Mode) и (Scale).176Cauchy Distribution0.4Mode,Scale10,110,515,115,5density0.30.20.10-10010203040xРис. 1. Плотность распределения Коши при разных значениях параметров.2.4.2. Гамма-распределениеЗадается плотностью распределения вида 1 xx e , x0p x 0 , x 0и зависит от двух параметров (Shape) и (Scale). Первые два момента выражаютсячерез них следующим образом: E , D 2 . Это распределение безграничноделимо и является непрерывным аналогом отрицательного биномиального распределенияиегочастнымислучаямираспределение 2 n ( образом,анализраспределениймоделируетявляютсяэкспоненциальное( 1 ),распределение1n, ) и распределение Эрланга ( n , n ).
Таким22гамма-распределенияпозволяетисключитьотдельныйанализ 2 n , Эрланга и экспоненциального. Это распределение хорошомассивы,убывающиеэкспоненциальноспоправкойнамедленновозрастающий коэффициент. Вид плотности распределения при разных значенияхпараметров представлен на рис.2.177Gamma Distribution0.4Shape,Scale20,120,315,115,3density0.30.20.1001020304050xРис. 2. Плотность гамма-распределения при разных значениях параметров2.4.3. Распределение Лапласа (двойное экспоненциальное)Задается плотность распределения видаp x 2e x mи описывается двумя параметрами m (Mean) и (Scale), через которые выражаютсямоменты распределения ( E m , D 22).
Распределение широко используется примоделировании сумм случайного числа случайных слагаемых. Зависимость плотностираспределения от параметров представлена на рис.3.Laplace Distribution1.5Mean,Scale10,110,315,115,3density1.20.90.60.305811141720xРис. 3. Плотность распределения Лапласа при разных значениях параметров1782.4.4.
Логнормальное распределениеИмеет плотность распределения вида 1 ln x m 2 exp , x 02p x x 220 , x 0и зависит от двух параметров – параметра положения m (Mean) и параметра формы (Standard deviation). Первые два момента выражаются через эти параметры как E eиD e4me41 .Распределениевозникаеткакраспределение1 4 m2экспонентынормальной случайной величины, т.е. случайная величина ln имеет нормальноераспределение N m, 2 .
Применяется для моделирования процессов, в которых темпыприроста пропорциональны текущему значению величины. Зависимость плотностираспределения от параметров представлена на рис. 4.Lognormal Distribution0.5Mean,Std. dev .10,110,315,115,3density0.40.30.20.10051015202530xРис. 4. Плотность логнормального распределения при разных значениях параметров2.4.5. Логистическое распределениеЗадается плотностью распределения видаp x exp x m 3 x m 3 1 exp 3 1792зависящей от двух параметров – параметра положения m (Mean) и параметра формы (Standard deviation).
Числовые характеристики: E m , D 2 . Распределение малоотличается от нормального, что хорошо видно на рис., но лучше аппроксимируетданные с ненулевой асимметрией. Зависимость плотности распределения от параметровпредставлена на рис. 5.Logistic Distribution0.5Mean,Std. dev .10,110,315,115,3density0.40.30.20.10-55152535xРис. 5.
Плотность логистического распределения при разных значениях параметров2.4.6. Нормальное (гауссовское) распределениеСамое популярное распределение с плотностью x m 2 1p x exp 22 2гдеm – параметр положения (Mean) и – параметр формы (Standard deviation).Числовые характеристики: E m , D 2 . В силу центральной предельной теоремытеории вероятностей часто возникает в задачах суммирования случайных величин.Распределениебезграничноделимо,являетсяосновойдлямногихалгоритмовстатистического моделирования.
Примеры графиков плотностей распределения приразных значениях параметров представлены на рис.6.180Normal Distribution0.4Mean,Std. dev .10,110,315,115,3density0.30.20.10-55152535xРис. 6. Плотность нормального распределения при разных значениях параметров2.4.7. Равномерное распределениеИмеет плотность распределения 1, x a,b p x b a0, x a,b и представляет собой непрерывный аналог дискретного равномерного распределения.Числовые характеристики выражаются через параметрыD aиb:E 1 a b ,212 b a .















