Аркашов Н.С. - Высшая математика. Теория вероятностей и математическая статистика (1275646), страница 22
Текст из файла (страница 22)
ПустьX= Eα , α>0. Построитьасимптотический доверительный интервал для параметра α.147Решение. Так как для показательного распределения с параметромα математическое ожидание равняется EX1 = 1/α, то согласно формуле14.4√n(X − 1/α)< A.−A ≤SПоследовательно выразимAS1AS−√ ≤ X − < √ ;nαnASAS1X−√ < ≤X+√ ;nαn1ASX−√n>α≥1ASX+√n.Итак, мы получили доверительный интервал (α− ; α+ ), гдеα− =1ASX+√n,α+ =1ASX−√n,а константа A выбирается в соответствии с равенством (14.2).§ 14.6.Задачи для самостоятельного решения~ ⊂14.1 Пусть X= N (θ1 , θ2 ), θ1 ∈ R, θ2 > 0. Построить центральныйдоверительный интервал для параметра θ1 .
Вычислить реализациюдоверительного интервала с уровнем γ = 0, 95, располагая данными: n=10,X = 2, 7; S 2 = 4. Сравнить с результатом примера 14.1.~ ⊂14.2Пусть X= N (a, θ), θ > 0, a- известно. Построить точныедоверительные интервалы (одностороннийи центральный двухсторонний)Pnна основе статистики S12 = n1 i=1 (Xi − a)2 . Вычислить реализациипостроенных интервалов с уровнем γ = 0, 9, располагая данными: n=10,S12 = 4. Сравнить с результатами примера 14.2.~ ⊂14.3 Пусть X= K(θ), θ ∈ R. Построить оптимальный точныйдоверительный интервал для параметра θ по одному наблюдению (n=1).~ ⊂14.4 X= B(p), 0 < p < 1.
Построить приближенные доверительные148интервалы для параметра p на основе оценки θ∗ = X:а) при помощи неравенства Чебышева;б) используя асимптотическую нормальность оценки.~ ⊂14.5 X= (λ), λ > 0. Построить асимптотический доверительныйинтервал для параметра λ с помощью оценки λ∗ = X.~ ⊂14.6 Пусть X= U (0, θ), где θ > 0. С помощью статистик X X 2 построить+асимптотические доверительные интервалы (соответственно (θ−1 , θ1 ) и− +− +(θ2 , θ2 )) уровня 1 − ε и показать, что случайный интервал (θ2 , θ2 ) короче+соответствующего (θ−1 , θ1 ).149Глава 15Проверка статистическихгипотез§ 15.1.Статистические гипотезы~ = (X1 , X2 , ..., Xn ) — выборка, X~ ⊂Пусть X= F, где F - полностьюили частично неизвестное распределение отдельного наблюдения Xi .Определение 15.1.
Статистической гипотезой будем называтьвсякое утверждение о виде или свойствах неизвестного распределения F.Пример 15.1. Пусть F — полностью неизвестное распределение.Примерами гипотез являютсяH : F = F0 , где F0 — полностью определенное распределение;b 0 , где Fb 0 — множество распределений (например, Fb0 =H: F∈Fb 0 = Bp ).Na,σ2 или FВ этих примерах наблюдения имеют распределения из некоторогоодно- или двухпараметрического семейства. Но могут бытьнепараметрические множества, например, F0 ∈ {F : EXi > 0} — классраспределений с положительными математическими ожиданиями.Пример15.2.
Пусть F — частично известное распределение.Например, F ∈ U[a; b] (наблюдения имеют равномерное распределение).В этом случае примеры гипотез:H : a = 0, b = 1 (распределение равномерное на [0; 1]);H : a = 0 (распределение равномерное на [0; b]);150H : a < b − 1 (распределение равномерное на отрезке длины более 1).Гипотеза называется простой, если она однозначно определяетраспределение F, в противном случае гипотеза называется сложной.В приведенных выше примерах простыми являются гипотезы:H : F = F0 и H : a = 0, b = 1 (последняя в случае, когда известно,что распределение равномерное на [a; b]).Остальные гипотезы являются сложными.Мы будем рассматривать ситуацию, когда гипотез всего две.
Однуиз них называют основной, а другую — альтернативной, обозначаясоответственно H0 и H1 .§ 15.2.Статистические критерииОпределение 15.2. Статистическим критерием называют всякоеправило, позволяющее на основании наблюдаемого выборочного вектора~ принять одну из гипотез: основную или альтернативную.XПри применении статистического критерия могут возникнуть ошибкидвух родов. Ошибка нулевого рода состоит в том, что отвергается вернаянулевая гипотеза.
Ошибка первого рода — отвергается верная перваягипотеза. Вообще ошибка i-го рода состоит в том, что статистическийкритерий отвергает верную i-ю гипотезу.принимаемаягипотезаH0H1вернагипотеза H0нетошибкиошибка0-го родавернагипотеза H1ошибка1-го роданетошибкиКритерий характеризуется вероятностями ошибок:α0 = PH0 (H0 отвергается),α1 = PH1 (H1 отвергается).Здесь нижний индекс у символа вероятности указывает, привыполнениикакойгипотезыподсчитывается вероятность. Извсевозможных критериев надо выбирать такие, у которых вероятностиошибок по возможности малы. К сожалению, в невырожденной151статистической задаче не существует критерия, для которого обевероятности ошибок равны нулю. Как правило, чем меньше вероятностьошибки нулевого рода, тем больше вероятность ошибки первого рода.Рассмотрим введенные понятия на следующем примере.Пример 15.3.
Студенты группы А считают, что они играютв шахматы вдвое лучше, чем студенты группы В. В свою очередь,студенты группы В считают, что они играют в шахматы втрое лучше,чем студенты группы А. Для решения спора назначается шахматныйматч между группами А и В. С каждой стороны участвуют 3студента, выбираемые по жребию. Решено считать справедливыммнение группы, выигрывшей матч, то есть набравшей не менее 2 очковв 3 партиях. Предполагается, что ничьих нет.
Найти, в чем состоятошибки нулевого и первого рода. Вычислить вероятности этих ошибок.Решение. Предполагаем, что нулевая гипотеза (соответствующаямнению студентов группы А) состоит в том, что вероятность выигрышакаждого студента группы А у студента группы В вдвое больше вероятностипроигрыша, то есть вероятность выигрыша равна 2/3. Согласно первойгипотезе (мнению студентов группы В), вероятность выигрыша каждогостудента группы А втрое меньше вероятности проигрыша, то естьравняется 1/4.Итак, проводятся три испытания схемы Бернулли с вероятностьюуспеха p, гипотеза H0 : p = 2/3; гипотеза H1 : p = 1/4.Критерий (исход матча) предписывает принять гипотезу H0 , есличисло успехов в схеме Бернулли равняется двум или трем, а в противномслучае принять гипотезу H1 .Ошибка нулевого рода состоит в том, что критерий предписываетсчитать вероятность выигрыша студента первой группы равной 1/4 вто время, как она равняется 2/3.
Ошибка первого рода описываетпротивоположную ситуацию: вероятность выигрыша студента первойгруппы равняется 1/4, а критерий предписывает считать ее равной 2/3.Вычислим вероятности ошибок.Вероятность ошибки нулевого рода α0 — это вероятность отвергнутьверную нулевую гипотезу, то есть получить ноль или один успех в схемеБернулли, которая предполагает 3 испытания с p = 2/3 в каждом.Вычислим эту вероятность на основании формулы Бернулли:α0 = PH0 (H0 отвергается) == C30 (2/3)0 (1/3)3 + C31 (2/3)1 (1/3)2 = 1/27 + 2/9 ≈ 0, 25.152Вероятность ошибки первого рода α1 — это вероятность получить дваили три успеха в схеме Бернулли, которая предполагает 3 испытания сp = 1/4 в каждом.α1 = PH1 (H1 отвергается) == C32 (1/4)2 (3/4)1 + C33 (1/4)3 (3/4)0 = 9/64 + 1/64 ≈ 0, 15.§ 15.3.Критерии согласия~ отУдобно представлять статистический критерий как функцию δ(X)выборочного вектора, принимающую два значения: H0 и H1 . Наиболееобщий подход для построения статистических критериев состоит вследующем.~ - некоторая статистика, характеризующая отклонениеПусть T = T (X)эмпирических данных, представленных выборкой, от теоретических,соответствующих проверяемой гипотезе H0 .
Если распределение~ известно (точно или хотя бы приближенно), тостатистики T (X)для любого α > 0 можно найти такое множество Tα значений T , длякоторого будет выполнено неравенство:P(T ∈ Tα /H0 ) ≤ α.(15.1)Пусть α > 0 настолько мало, что событие, имеющее вероятность, непревосходящую α, может считаться практически невозможным. Тогдастатистический критерий можно задать следующим образом:~ =δ(X)(~ ∈ Tα ,H1 , если T (X)~ ∈H0 , если T (X)/ Tα .(15.2)Это правило основано на здравом смысле: оно предписывает отвергнутьгипотезу H0 (то есть принять H1 ), если происходит событие~{T (X)∈ Tα }, которое не должно произойти, будь гипотеза H0справедлива.
Число α > 0, которое фигурирует в (15.1) - (15.2),называется уровнем критерия, или уровнем значимости, статистика~ называетсяT (X)статистикой критерия, а множество Tα критическим множеством.153§ 15.4.Достигаемый уровень значимости~ требуют следующих свойств:От статистики T = T (X)1) при выполнении гипотезы H0 статистика T имеет известноераспределение или, по крайней мере, сходится по распределению кнекоторой случайной величине J с известным распределением;2) при выполнении гипотезы H1 статистика T сходится почти наверноек бесконечности с ростом объема выборки.Для того, чтобы получить критерий уровня α, задают критическоемножество в видеTα = {T ≥ C},где C — константа, определяемая условиемP{J ≥ C} = α,то есть FJ (C) = 1−α.
Ясно, что при таком выборе константы C вероятностьошибки нулевого рода α0 либо равна уровню критерия α (в случае, когдастатистика T при верной нулевой гипотезе распределена в точности какJ), либо, по крайней мере, сходится к α с ростом объема выборки.Сходимость статистики T почти наверное к бесконечности привыполненной первой гипотезе гарантирует состоятельность критерия, тоесть сходимость вероятности ошибки первого рода α1 к нулю с ростомобъема выборки.~ можно найти предельное значениеДля каждой конкретной выборки X~ при котором гипотеза H0 еще может быть принята.уровня α∗ = α∗ (X),Такое значение называется (реально) достигаемым уровнем значимости.Как сказано в [10], α∗ «имеет смысл вероятности получить худшее согласиес проверяемой гипотезой, чем реально полученное, если гипотеза H0верна». Поэтому чем меньше α∗ , тем более это говорит против гипотезыH0 .Достигаемый уровень значимости вычисляется с помощьюраспределения статистики J:~ = 1 − FJ (T (X)).~α∗ = P{J ≥ T (X)}В терминах достигаемого уровня значимости критическая областьимеет видTα = {α∗ ≤ α},то есть нулевая гипотеза отвергается на уровне α в случае, когда α∗ ≤ α.154Каждыйкритерийсогласияиспользуетсвоюстатистику,предназначенную для различения нулевой гипотезы и альтернативыи обладающую нужными свойствами: сходимостью к фиксированномураспределению при выполнении нулевой гипотезы и сходимостью почтинаверное к бесконечности при ее невыполнении.В качестве важных примеров критериев согласия рассмотрим критерииКолмогорова и хи-квадрат Пирсона.§ 15.5.Критерии согласия Колмогорова и χ2Пирсона~ ⊂Рассмотрим выборку X= F объема n с неизвестной функциейраспределения F и простую гипотезу H0 : F = F0 .