Лекции в электронном виде, страница 23
Описание файла
PDF-файл из архива "Лекции в электронном виде", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из , которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "теория вероятности" в общих файлах.
Просмотр PDF-файла онлайн
Текст 23 страницы из PDF
Если X — непрерывная случайнаявеличина, то в качестве Mk , k = 1, r, обычно берут множества вида(−∞, s1 ),[s1 , s2 ),...,[sr−2 , sr−1 ),[sr−1 , ∞),где s1 < s2 < · · · < sr−1 , sk ∈ R, k = 1, r−1.Определим дискретную случайную величину X 0 , принимающую значение k тогда и только тогда,когда X ∈ Mk , k = 1, r. В этом случае исходная задача проверки статистических гипотез сводится кпроверке основной гипотезы (18.1) при альтернативной гипотезе (18.2), где в случае непрерывностислучайной величины XZpk0 =p0 (t) dt —Mkвероятность попадания случайной величины X в множество Mk , а p0 (t) — плотность X при H0 .Если X — дискретная случайная величина, имеющая счетное множество возможных значенийz1 , z2 , .
. . , и P {X = zj } = qj > 0, j = 1, 2, . . . , то вместо проверки гипотезыH0 : qj = qj0 ,j = 1, 2, . . . ,где qj0 , j = 1, 2, . . . , — известные числа, при альтернативной гипотезеH1 : существуют такие j, что qj 6= qj0 ,j = 1, 2, . . . ,проверяют гипотезу (18.1) при альтернативной гипотезе (18.2), где вероятности pk0 , k = 1, r, вычисляют по формуламXpk0 =qj0 , k = 1, r.zj ∈MkДалее для выборки ~xn находят число nk (~xn ) ее элементов, принадлежащих множеству Mk , k =~ n в формулу (18.3), определяют реализацию χ2 (~xn ) случайной1, r.
Затем, подставляя ~xn вместо X2 ~величины χ (Xn ). Гипотеза H0 отклоняется в пользу гипотезы H1 , если χ2 (~xn ) > χ21−α (r − 1) ипринимается в противном случае.Недостатком использования критерия χ2 для случайных величин, принимающих бесконечноемножество значений, является некоторая потеря информации при переходе от X к случайной величине X 0 с конечным числом значений.Пример 18.1 При 4040 бросаниях монеты французский естествоиспытатель Ж.Л.Л. Бюффон(1707– 1788) получил 2048 выпадений “герба” и 1992 выпадений “решки”. Совместимо ли это с гипотезой о том, что вероятность выпадения “герба” при одном бросании равна 1/2?Здесь n = 4040, r = 2, n1 (~xn ) = 2048, n2 (~xn ) = 1992, p10 = p20 = 0,5, число степеней свободы r − 1 =1, и при α = 0,05 находим χ20,95 (1) = 3,841.Проверим гипотезу H0 о том, что вероятности p1 и p2 выпадения “герба” и “решки” равны 1/2.На основании (18.3) получаемχ2 (~xn ) =(2048 − 4040 · 0,5)2 (1992 − 4040 · 0,5)2+= 0,776.4040 · 0,54040 · 0,5Так как 0,776 < 3,841, то статистические данные не противоречат гипотезе H0 .87Критерий χ2 для сложной гипотезыПусть функция распределения дискретной случайной величины X, принимающей конечное множество значений u1 , .
. . , ur , зависит от неизвестного d-мерного вектора параметров θ. Тогда вероятность pk того, что X примет возможное значение uk , зависит от θ, т.е. pk = pk (θ), k = 1, r. А так каквероятности p1 (θ), . . . , pr (θ) полностью определяют функцию распределения случайной величиныX, то в рассматриваемом случае основная гипотеза принимает следующий вид:H0 : P {X = uk } = pk (θ),θ ∈ Θ ⊂ Rd .k = 1, r,Эту сложную гипотезу можно проверить при помощи модификации критерия χ2 Пирсона.b xn ) — значение оценки θ(bX~ n ) максимального правдоподобия для θ, а nk (~xn ) — количеПусть θ(~bX~ n ) получают в результате минимизацииство элементов выборки ~xn , равных uk , k = 1, r.
Оценку θ(логарифма функции правдоподобия¡¢~ n; θ =L XrY~ )n!n (Xpi k n (θ),n1 ! . . . n r !k=1rX~ n ) = n,ni ( Xi=1как решение системы уравненийrX~ n ) ∂pk (θ)nk (Xk=1pk (θ)∂θj= 0,j = 1, d.Можно показать, что при некоторых предположениях о гладкости функций pk (θ), k = 1, r, распределение случайной величины при n → ∞¢r ¡bX~ n ) − npi (θ(~ n )) 2Xni (X2 ~χ (Xn ) =bX~ n ))npi (θ(i=1сходится к χ2 -распределению с r − d − 1 степенями свободы.Если X — непрерывная случайная величина с функцией распределения F (t), то, разбивая множество возможных значений X на конечное число непересекающихся подмножеств и переходя кдискретной случайной величине X 0 , можно проверить сложную гипотезу© ¡ ¢ªH0 : F (t) ∈ F t; θ , θ ∈ Θ ⊂ Rd .bX~ n ) следует строить неНеобходимо только помнить, что оценку максимального правдоподобия θ(по наблюдениям X1 , .
. . , Xn случайной величины X, а по значениям частот n1 (~x0n ), . . . , nr (~x0n )случайной величины X 0 , что, как правило, гораздо труднее. Построение такой оценки для наиболее распространенных параметрических семейств распределений (нормального, экспоненциального,пуассоновского и т.д.) можно найти в специальной литературе (См. Г. Крамер ).Критерий независимости, основанный на выборочном коэффициенте корреляцииПусть (Xi , Yi ), i = 1, n — выборка из распределения нормального случайного вектора (X, Y ). ОбозначимnP(Xi − X)(Yi − Y )~ n, Y~n ) = s i=1sρb(XnnPP(Xi − X)2(Yi − Y )2i=1i=1выборочный коэффициент корреляции.При проверке статистической гипотезы H0 : ρ = 0 (т.е.
гипотезы о том, что нормально распределенные случайные величины независимы) используют статистику√~ n, Y~n ) n − 2ρb(Xt= q,(18.4)~ n, Y~n )1 − ρb2 (Xкоторая имеет распределение Стьюдента с n − 2 степенями свободы. Если окажется, что√|bρ| n − 2p≤ t1−α/2 (n − 2),1 − ρb2то гипотезу H0 принимают при уровне значимости α, где t1−α/2 (n − 2) — квантиль уровня 1 − α/2распределения Стьюдента с n − 2 степенями свободы.88Пример 18.2 В примере 16.1 лекции 15 найдено значение точечной оценки ρb = 0,313.
Проверимгипотезу H0 : ρ = 0 на уровне значимости α = 0,1.По таблице квантилей распределения Стьюдента находим квантиль t0,95 (13) = 1,77 и сравниваемсо значением√√n−213ρbp= 0,313 √= 1,19.20,9021 − ρbПоскольку 1,19 < 1,77, то гипотезу ρ = 0 принимаем.Таблицы сопряженности признаков и критерий χ2Пусть имеется случайная выборка~ n; Y~n ) = ((X1 , Y1 ); . . . ; (Xn , Yn ))(Xиз генеральной совокупности двумерной дискретной случайной величины (X; Y ), где случайная величина X может принимать значения u1 , . . .
, ur , а случайная величинаY — значения v1 , . . . , vs . Определим случайную величину~ n, Y~n ), реализация nij которой равна количеству элеnij (Xментов выборки (~xn , ~yn ) = ((x1 , y1 ); . . . ; (xn , yn )), совпадающих с элементом (ui ; vj ), i = 1, r, j = 1, s.~ n, Y~ n ) и nj ( X~ n, Y~n ), знаВведем случайные величины ni (Xчения ni и nj которых определим по формуламni =nXnij ,nj =j=1nXXu1u2...urv1n11n21...nr1n1v2n12n22...nr2n2Y..................vsn1sn2s...nrsnsn1n2...nrnТаблица 18.1.nij .i=1При этом ni — количество элементов выборки (~xn ; ~yn ), в которых встретилось значение ui , а nj —количество элементов выборки (~xn ; ~yn ), в которых встретилось значение vj .
Кроме того, имеютместо очевидные равенстваrsr XsXXXni =nj =nij = n.i=1j=1i=1 j=1В рассматриваемом случае результаты наблюдений удобно оформлять в виде таблицы, называемойтаблицей сопряженности признаков (18.1). Пусть далееpij = P {X = ui , Y = vj } , pi = P {X = ui } , pj = P {Y = vj } ,i = 1, r, j = 1, s.Дискретные случайные величины X и Y независимы тогда и только тогда, когдаP {X = ui , Y = vj } = P {X = ui } P {Y = vj } ,i = 1, r, j = 1, s.Поэтому основную гипотезу о независимости дискретных случайных величин X и Y можно представить в следующем виде:H0 : pij = pi pj , i = 1, r, j = 1, s.(18.5)При этом, как правило, в качестве альтернативной используют гипотезуH1 : pij 6= pi pj для некоторых i = 1, r, j = 1, s.(18.6)Для проверки основной гипотезы (18.5) при альтернативной гипотезе (18.6) К.
Пирсон пред~ n, Y~n ), называемую статистикой Фишера — Пирсона,ложил использовать статистику χb2 (Xреализация χb2 (~xn , ~yn ) которой определяется формулой³ni nj ´2r Xsnij −Xn.χb2 (~xn , ~yn ) = nnniji=1 i=1(18.7)Из закона больших чисел следует, что при n → ∞~ n, Y~n )nij (X→ pij ,n~ n, Y~n )ni ( X→ pi ,n~ n, Y~n )nj (X→ pj ,ni = 1, r,j = 1, s.Поэтому при истинности гипотезы H0 и больших объемах выборки (~xn , ~yn ) должно выполнятьсяприближенное равенствоnij ≈ ni nj , i = 1, r, j = 1, s,89~ n, Y~n ) должны быть “не слишком велики”.
“Слиши, следовательно, значения (18.7) статистики χb2 (Xком большие” значения должны свидетельствовать о том, что H0 неверна.Ответ на вопрос о том, какие значения нужно считать слишком большими, а какие — нет, даетследующая теорема.~ n, Y~n ) при n → ∞Теорема 18.2 Если истинна гипотеза H0 , то распределение статистики χb2 (X2сходится к случайной величине, имеющей χ -распределение с числом степеней свободы k = (r −1)(s − 1):kZz© 2ªt 2 −1 − t~~lim P χb (Xn , Yn ) < z =e 2 dt, z > 0. #k ³k´n→∞2Γ202В соответствии с теоремой 18.2 критерий независимости χ2 отклоняет гипотезу H0 науровне значимости 1 − α, еслиχb2 (~xn , ~yn ) > χ21−α ((r − 1)(s − 1)),где χ21−α ((r − 1)(s − 1)) — квантиль уровня значимости 1 − α χ2 -распределения с числом степенейсвободы (r − 1)(s − 1).
При этом считается, что критерий χ2 можно использовать, если ni nj /n > 5.Правую часть равенства (18.7) можно преобразовать к форме, более удобной для практическогоиспользования:r Xs³X´n2ijχb2 (~xn , ~yn ) = n−1 .(18.8)nni=1 j=1 i jВ частном, но очень распространенном случае таблиц сопряженности при r = s = 2 формула (18.7)для вычисления χb2 (~xn , ~yn ) имеет еще более простой вид:χb2 (~xn , ~yn ) =n(n11 n22 − n12 n21 )2.n1 n2 n1 n2(18.9)~ n, Y~n ) с реалиДля таблиц сопряженности при r = s = 2, как правило, используют статистику χe2 (Xзациями¡¢2n|n11 n22 − n12 n21 | − n/22χe (~xn , ~yn ) =,(18.10)n1 n2 n1 n2называемую статистикой Фишера — Пирсона с поправкой Йейтса на непрерывность,распределение которой лучше согласуется с χ2 -распределением.Цвет бровей Цвет волос на голове СуммаПример 18.3 В табл.