GIPOTEZ (Лекции ещё одни)
Описание файла
Файл "GIPOTEZ" внутри архива находится в следующих папках: лекции смольякова, лекции смольякова. PDF-файл из архива "Лекции ещё одни", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из , которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "теория вероятности" в общих файлах.
Просмотр PDF-файла онлайн
Текст из PDF
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗПусть задана некоторая функция от выборки S(x1 , ..., xn ), в качествекоторой, например, можно рассматривать эмпирическое математическое ожидание S(x) = M (x) = x̄. Функцию S называют статистикойкритерия. Множество T всех возможных значений статистики S(x)разбивают на два подмножества, в одном из которых (T0 ) справедливаосновная, базовая гипотеза H0 , а в другом T1 = T \ T0 — альтернативная гипотеза H1 .
Если реализуется значение S(x) ∈ T0 , то принимают базовую гипотезу H0 , а если S(x) ∈ T1 = T \ T0 , то гипотезуH0 отвергают и принимают гипотезу H1 . Так как значения S(x) случайны, то конкретная реализация S(x) может оказаться как в T0 , таки в T1 . При этом при проверке гипотезы H0 можно ожидать ошибокдвух типов. Ошибка первого рода характеризуется тем, что принимается к расчету гипотеза H1 , хотя реализовались данные гипотезы H0(причем исходные данные этой последней и учитываются при расчетена основе гипотезы H1 ).
Вероятность ошибки первого рода обозначимα = P (S ∈ T1 |H0 ). Ошибка второго рода реализуется, когда реализовались условия гипотезы H1 , исходные данные которой и закладываютсяв расчеты, которые, однако выполняются по правилам гипотезы H0 .Пусть β = P (S ∈ T0 |H1 ) — вероятность ошибки второго рода.Таким образом, вероятность α вычисляется в случае реализацииусловий гипотезы H0 , а β — при реализации условий гипотезы H1 .Вероятность 1 − β называют мощностью критерия, а вероятность α —размером критерия.Рассмотрим в качестве статистики S эмпирическое математическоеожидание.
В качестве основной гипотезы H0 пусть будет M (x) = M0 =4 и T0 = [a, b] = [M0 − c, M0 + c], а в качестве альтернативной H1 пустьM1 = 5 и T1 = R1 \[a, b]. Пусть выборка x1 , ..., xn задается n элементамиxi , а среднеквадратичное отклонение при любом M в нормальном законе распределения равно σ = 1. Пусть α = 0, 1, объем выборки n = 9и требуется найти β.В качестве T0 естественно выбрать некоторый интервал [a, b], серединой которого является математическое ожидание M0 , т.е. интервал[M0 − c, M0 + c] = [a, b].
При этом в качестве множества T1 естественнопринять множество R1 \ [a, b] = T1 .1Согласно центральной предельной теореме можно записатьP nPzii=1√n√ nPzin< y = PP {z̄ n < y} =i=1Ry−∞√n < y =(1)4exp(−t2 /2)dt = N (y),где N (y) — нормальный закон распределения в случае математического ожидания E(z) = 0 и дисперсии D(z) = 1. Если же сделать заменупеременной в (1), положив z = (x − M0 )/σ, то для новой переменнойx получаем: E(x) = E(zσ + M0 ) = σE(z) + M0 = M0 = x̄ 6= 0 и D(x) =D(σz + M0 ) = σ 2 D(z) + D(M) ) = σ 2 6= 1.
Это означает, что равенство(1) сохраняется, если в нем заменить z на (x − M0 )/σ, т.е. левую частьпредставить в виде (x̄ − M ) √0n < y .PσНайдем сначала размер критерия α, принимая к расчету данные,отвечающие гипотезе H0 (т.е. полагая, что x̄ = M0 , но при этом удовлетворяя условиям гипотезы H1 , т.е. принимая, что x̄ ∈ T1 ).Рассчитаем величинуα = P (x̄ ∈ T1 |H0 ) != P (x̄ ≤ a|H0 ) + P (x̄ !≥ b|H0 ) =x̄−M0x̄−M0a−M0b−M0≤√≥√+P √=P √222σ /nσ /nσ 2 /n√ σ /n√√F [(a − M√0 ) n/σ] + (1 − F [(b√− M0 ) n/σ]) = F (−c n/σ)+(1 − F (c n/σ)) = 2[1 − F (c n/σ)].(2)В этой формуле учтено, что F (−y)√= 1 − F (y).
Подставляя в этуформулу значения n и σ, получаем F (c n/σ) = 1 − α/2 = F(3c) = 0,95.Значению F = 0,95 функции распределения F (x) "нормального законараспределения"соответствует значение x = 1,65 = 3с. Отсюда следует,что c = 0,55.Найдем теперь параметр β, учитывая, что b = M0 + c, a = M0 − c:β = P (x̄ ∈ √T0 |H1 ) = P (a ≤ x̄√≤ b|H1 ) =√P ([a − M1 ] n/σ√≤ [x̄ − M1 ] n/σ ≤ [b − M√1 ] n/σ) =F ([M0 − M√1 + c] n/σ) − F ([M√0 − M1 − c] n/σ) =F ([−1 + c] n/σ) − F ([−1 − c] n/σ) = F (−1, 35) − F (−4, 65) =1 − F (1, 35) − (1 − F (4, 65)) = 0, 09.2(3)Мощность критерия 1 − β = 0,91. Из (2) и (3) видно, что, вообщеговоря, если значение n (или σ) не задано, то его вместе со значениемc можно найти из совместного решения системы (2),(3), если значениеβ задано.Вообще говоря, уравнения вида (2) и (3) можно использовать также для нахождения любой неизвестной пары параметров, если известны все остальные параметры.
Однако в общем случае подобные расчеты требуют применения итерационных процедур для определенияэтих неизвестных параметров. Если же мы желаем быстро получитьприближенные результаты без применения итерационных процедур, тоэтого можно достичь, если использовать не двусторонний интервал(M0 − c, M0 + c)), а односторонний, полагая T0 = {x < (M0 + c)}, еслиM0 < M1 , и полагая T0 = {x > (M0 − c)}, если M0 > M1 . При этом T1будет являться дополнением интервала T0 на вещественной оси.Пусть в условиях рассматриваемого примера параметр n не задан иего требуется определить.
Поскольку 4 = M0 < M1 = 5, то, используяодносторонний интервал (M0 , M0 + c), по аналогии с (2), имеем√α = P (x̄ ∈ T1 |H0 ) = P (x̄ ≥ (M0 + c)|H0 ) = 1 − F (c n/σ) = 0, 1.Но значению F (x) = 0, 9 нормального закона распределения соответствует √значение x=1,28. Отсюда следует (если принять σ = 1)уравнение c n = 1,28. Здесь два неизвестных параметра, которые мысможем найти, если рассмотрим еще следующий аналог уравнения (3):√√β = P (x̄ < M0 +√c|H1 ) = P ([x̄ − M√1 ] n/σ ≤ [M0 + c − M1 ] n/σ)F ([M0 − M1 + c] n/σ) = F ([c − 1] n) = 0, 1.Значение x, отвечающее уравнению F (x) = 0, 1 (согласно таблицезначений F (x)) следует искать для значения F (−x) = 1 − F (x), т.е.следует найти значение x для F (x) = 0,9 и поставить перед ним знакминус, что дает x = - 1,28. Таким образом, для нахождения параметровn и c получаем систему уравнений√√c n = 1, 28,(c − 1) n = −1, 28.Решение этой системы дает c = 0,5, а n приблизительно равно 7.3.