М.А. Маталыцкий, Т.В. Русилко - Теория вероятностей и математическая статистика (1115300), страница 24
Текст из файла (страница 24)
Границы крити12и K крпри заданном уровне значимости α опческих областей K крределяются соответственно из соотношений:для правосторонней критической области,для левосторонней критической области1P ( K < K кр)=α,для двухсторонней критической области21P ( K > K кр) = P ( K < K кр)=170α.21KH−0βНейман и Пирсон предложили следующий принцип построениякритической области. Критическую область следует выбирать так,чтобы вероятность попадания в нее статистического критерия Kбыла минимальной и равной α , если верна нулевая гипотеза,имаксимальной в противоположном случае.
Другими словами, критическая область должна быть такой, чтобы при заданном уровне знабыла максимальной. Задачачимости α мощность критерияпостроения такой области решается с помощью теоремы Неймана –Пирсона, излагаемой в более полных курсах математической статистики. Уровень значимости α обычно задают значениями 0,05 и 0,01.Наиболее распространена правосторонняя критическая область,рассмотрим подробнее принцип ее построения. По выборочному рас2–пределению статистики определяется критическое значение K кр2такое что, если гипотеза H 0 верна, то вероятность P ( K > K кр ) = α2мала, то есть событие K > K крможно считать практически невоз2можным. Поэтому, если окажется K > K кр, то гипотеза H 0 отверга2ется, в то время как обнаружение того, что K < K кр, подтверждаетсправедливость H 0 .Предположим, что если верна гипотеза H 0 , то статистика Kимеет распределение с плотностью p = p1 ( K ) , а если верна гипотезаH 1 , то p = p2 ( K ) .
Тогда описанные выше построения критическойобласти можно изобразить графически.p2 ( K )p (K )p1 ( K )αβK крРис. 16171KKНа рис. 162или K кр= K кр . Критической правосторон-{}ней областью является множество K : K > K кр . Гипотеза H 0 принимается, если K < K кр .
Площади заштрихованных областей представляют собой вероятности ошибок 1-го и 2-го рода, α иственно.соответ-Рис. 17На рис. 17 представлена правосторонняя критическая область,принцип построения которой описан выше.Итак, процедуру проверки статистической гипотезы можно разбить на следующие основные шаги.1. Сформулировать нулевуюи конкурирующую H 1 гипотезы.2. Задать уровень значимости α .3. Выбрать статистикудля проверки гипотезы H 0 .4. Найти плотность распределения p = p1 ( K ) статистики в предположении, что гипотеза H 0 верна.5.
Определить критическую область K Д . Для наиболее частоиспользуемых распределений (Стьюдента, Фишера, χ 2 ) составленытаблицы критических точек, которые можно найти в учебниках поматематической статистике.6. По выборке вычислить выборочное значение K статистикикритерия.7. Принять решение: если K ∈ K Д , то H 0 отклоняется (то естьпринимается H 1 ), если K ∈ K Д , то H 0 принимается.Принятое решение, разумеется, носит вероятностный характер.Поэтому обычно применяют более осторожные формулировки.
Вме-172сто того чтобы сказать «гипотеза H 0 отклоняется», говорят «данныеэксперимента не подтверждают гипотезу H 0 «, «гипотеза не согласуется с экспериментом» и т.д.Критерий согласия χ 2 ПирсонаОдной из главных задач математической статистик является установление истинного закона распределения случайной величины наосновании экспериментальных данных. На практике о законе распределения можно судить, например, по виду полигона и гистограммы.Однако полной уверенности в сделанном предположении о законераспределения нет, поэтому вопрос может стоять лишь о проверкегипотезы о предполагаемом законе распределения.
Критерии, устанавливающие закон распределения, называются критериями согласия. Для проверки гипотезы о нормальном распределении генеральной совокупности используется критерий Пирсона.Алгоритм применения критерия Пирсона заключается в следующем.h nh1. Из генеральной совокупности образовывается случайная выni′ =ϕ(u i )σборка, и на ее основе делается предположение о нормальном законераспределения. Выдвигается гипотеза H 0 : «генеральная совокупностьраспределена нормально».2. Вычисляются выборочные числовые характеристики x , σ .3. Вычисляются теоретически частоты:3.1.
Для дискретного ряда,где n – объем выборки,вариантами),– шаг (разность между двумя соседнимиu2x −x1 −2, ϕ(u ) =e ,ui = iσ2πзначения ϕ(u ) определяются о таблице приложения 1;1733.2. Для интервального ряда,где– объем выборки,– теоретические вероят-ности попадания в интервалы xi − xi +1 , z i =x −xxi − x, z i +1 = i +1,σσΦ(z ) – функция Лапласа, значения которой определяются по таблице приложения 2.4. Находится наблюдаемое значение критерия Пирсона по формуле.5. По таблице критических точек распределения χ 2 , по заданному уровню значимости α и числу степеней свободы(s –число групп для дискретно ряда или число интервалов для интервального ряда) находят критическую точкуправосторонней кри-тической области.6. Если χ 2 < χ 2кр – нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.
Другими словами,эмпирические и теоретические частоты различаются незначимо. Еслиχ 2 > χ 2кр – гипотезу отвергают.Замечание. Малочисленные варианты и интервалы (содержащиемалочисленные частоты) ni < 5 следует объединить, а соответствующие им частоты сложить. Если производилось объединение частот,то в формуле k = s − 3 следует в качестве s принять число групп илиинтервалов выборки, оставшихся после объединения частот.Пример 17.1. Для интервального статистического ряда, полученного в результате наблюдения случайной величины, требуется:1) вычислить числовые характеристики данного эмпирическогораспределения: выборочную среднюю и выборочную дисперсию;1742) вычислить теоретические частоты предполагаемого нормального распределения;проверить гипоте3) при заданном уровне значимостизу о нормальном распределении генеральной совокупности, пользуясь критерием Пирсона.Даны результаты наблюдения за распределением 60 валиков подиаметру:Решение.1).
Найдем середины интервалов и примем их в качестве вариант для расчета числовых характеристикxi13,9914,0914,1914,2914,3914,4914,5914,69ni114101513106n = ¦ ni = 60 .Выборочную среднюю определим по формуле*"α=0,05′nki = n ⋅ Pi = 604)N⋅ P )". )N )" )N ) " )N 1 )"*)N )"))N )">)N )"3)N)". ) i )" ))" ))"*)) "))x n =)"14,4333.>))"3))"?)x= ¦i il #n >).*.3Определим x 2x2 =1¦ xi2 ni = 208,3456.nДисперсия D = x 2 − ( x) 2 = 208,3456 - 14,4333 ⋅ 14,4333 = 0,0255 .
Среднее квадратическое отклонение σ = D = 0,1597 .2). Найдем теоретические частоты. Для этого пронормируем данX −x.ную случайную величину X и перейдем к величине Z , Z =σЗатем найдем теоретические вероятности, пользуясь формулойPi = Φ ( z i +1 ) − Φ ( z i ) , Φ (z ) – функция Лапласа. И, наконец, по формулеопределим теоретические частоты ni′ . Расчеты приведем в следующей таблице:1753). Сравним эмпирические и теоретические частоты, используякритерий Пирсона. Вычислим наблюдаемое значение критерия Пирсона по формулеs (n − n′ ) 2iχ2 = ¦ i.ni′i =1Необходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений. Однако,учитывая, что первые три интервала содержат малочисленные частоты, объединим их, а соответствующие частоты и теоретические частоты сложим.
Данные расчетов приведем в таблице.№xixi +1nini′(ni − ni′ ) 2ni′ni2ni′12345613,9414,2414,3414,4414,5414,6414,2414,3414,4414,5414,6414,746101513106606,7869,98414,23213,8789,2525,868600,09102,56E-050,04140,05560,06050,00300,25155,305010,016015,809412,177610,80856,135060,2515¦ni2последней таблицы нужен дляni′контроля, так как, если вычисления произведены правильно, то долn2жно выполняться равенство¦ i′ − n = χ 2 . Контроль:niЗначит, χ 2 = 0,2515 . Столбец176n2¦ i′ − n = 60,2515 − 60 = 0,2515 = χ 2 выполняется.niПо таблице критических точек распределения χ 2 (приложение6), по уровню значимости α = 0,05 и числу степеней свободы( s – число интервалов) находим критическуюточку правосторонней критической области.
Так как22χ < χ кр , то гипотезу о нормальном распределении генеральной совокупности принимаем.Пример 17.2. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с эмпирическим распределением выборки объема n = 200 :xi6,686,706,726,746,766,786,806,82ni51724545223187Решение.
Во-первых, найдем выборочную среднюю x = 6,7507и выборочное среднее квадратическое отклонение σ = 0,0316 .k 2= (0,05;snh− * =3)3 =− 7*,8=..* ⋅ . ".χni′кр= ϕ ui = Вычислимϕ uтеоретические3">Aϕ ui частоты по формулеi =σ. ".* 3,для этого составим расчетную таблицу.ixi123456786,686,706,726,746,766,786,806,82ui =xi − xσ-2,24-1,60-0,97-0,340,290,931,562,19ϕ(ui )ni′ = 126,58ϕ(ui )0,03250,11090,24920,37650,38250,25890,11820,03634,1214,0431,5447,6648,4232,7814,964,60Составим расчетную таблицу, из которой найдем наблюдаемоезначение критерия Пирсона177inini′(ni − ni′ ) 2ni′ni′′12345678517245452231874,1214,0431,5447,6648,4232,7814,964,600,18800,62401,80250,84340,26472,91790,61781,252241432484933155¦2008,5105200Значит, χ 2 = 8,5105 . По таблице критических точек распределения χ 2 находим критическую точку правосторонней критическойобласти χ 2кр (0,05; 5) = 11,1 .Так как χ 2 < χ 2кр – гипотезу о нормальном распределении генеральной совокупности принимаем.