С.С. Валландер - Лекции по статистике и эконометрике (1160549), страница 16
Текст из файла (страница 16)
Тогда вся дробь, как случайнаявеличина, будет иметь распределение tn — распределение Стьюдента сn степенями свободы.Лемма Фишера позволяет утверждать, что дробь√√X̄−a√σ 2 /NX̄ − a √X̄ − aN − 1q= N −1 √= Nq2N S2S2Sиспр.2σимеет распределение Стьюдента с n = N −1 степенями свободы. Главноедостоинство стьюдентовской дроби — масштабная инвариантность —мешающий параметр σ благополучно сократился. Построим с помощьюэтой дроби доверительный интервал. Для этого по доверительнойвероятности 1 − ε найдем из таблиц распределения Стьюдента значениеz = zε так, чтобыP(|tN −1 | < z) = 1 − ε.(3.3)Решая теперь неравенство¯¯¯¯¯√X̄ − a ¯¯¯¯ Nq¯<z¯2Sиспр. ¯¯¯относительно a, получим искомый интервал¿ÀSиспр.Sиспр.X̄ − z √, X̄ + z √NNq2(здесь Sиспр.
= Sиспр.), который очень похож на асимптотический,полученный в параграфе 1. Отличие лишь в табличном значении,которое сейчас определяется по другой таблице. В асимптотическомсмысле оба интервала совпадают, т.к. при n → ∞ распределениеДоверительные интервалы95Стьюдента tn слабо сходится к нормальному N(0, 1). Это обстоятельствоможно объяснить так.
Распределение tn — это распределение дроби видаqX0X12 +···+Xn2n,где X0 , X1 , . . . , Xn — независимые N(0, 1)-распределенные величины.Поскольку среднее арифметическоеX12 + · · · + Xn2nсогласно закону больших чисел сходится к 1, общему значениюматематических ожиданий квадратов, то исходная дробь сходится к X0 ∈N(0, 1). Отсюда несложно вывести и слабую сходимость распределений,но мы на этом не останавливаемся.Обсудимтеперьвопрособоптимальностиполученногодоверительного интервала в следующем, довольно узком, смысле.Вместо выбора z из (3.3) можно было бы более общим образом взять z1и z2 из соотношенияP(z1 < tN −1 < z2 ) = 1 − ε.(3.4)Докажем, что интервал h−zε , zε i, использовавшийся ранее, самыйкороткий из всех интервалов вида hz1 , z2 i.
Тогда и построенный по немудоверительный интервал, как легко видеть, будет кратчайшим из всехподобных интервалов.Для доказательства воспользуемся тем, что плотность tn (x)распределения Стьюдента — четная функция (это почти очевидно),монотонно убывающая на положительной полуоси (это свойство мыдоказывать не будем, оно следует из явной формулы, которую можнонайти во многих источниках, например, [1]). Обратимся к соотношению(3.4) и заметим, что вероятность представляется геометрически какплощадь под графиком плотности.Предположим для определенности, что −zε < z1 < 0 < zε (остальныеварианты рассматриваются аналогично). Тогда, очевидно, zε < z2 .Площади под графиком плотности на промежутках h−zε , z1 i и hzε , z2 iдолжны совпадать.
Однако на первом из них минимальное значениеплотности есть tn (−zε ), а на втором — максимальное значение плотностиесть tn (zε ) = tn (−zε ). Поэтому на всем первом промежутке h−zε , z1 iплотность tn больше, чем на втором промежутке hzε , z2 i. Из равенства96Глава 3площадей вытекает, что длина первого промежутка меньше, чем второго.Таким образом, при переходе от h−zε , zε i к hz1 , z2 i вычитается болеекороткий промежуток, чем добавляется (см. рис).Перейдем теперь к построению доверительного интервала для σ принеизвестном a.
Опять воспользуемся леммой Фишера:N S2∈ χ2N −1 .2σВ этом соотношении мешающий параметр a уже отсутствует. Поэтомуберем χ2N −1 в качестве шаблонного распределения, выбираем hz1 , z2 i изсоотношенияP(z1 < χ2N −1 < z2 ) = 1 − ε(3.5)и, решая неравенствоN S2z1 < 2 < z2σ2относительно σ , находим доверительный интервал¿ÀN S2 N S2,.z2z1Плотность распределения χ2n , хотя и не симметрична, при n ≥ 3одновершинна — имеет единственный максимум — и монотонна с каждойстороны от него (см.
параграф 1.5, где имеется явная формула плотностигамма-распределения, частным случаем которого является хи-квадрат).Поэтому соображения, аналогичные изложенным выше применительнок распределению Стьюдента, сразу же говорят нам, что кратчайшийдоверительный интервал получается, если значения плотности в точкахz1 и z2 совпадают. Подбирать такие z1 и z2 с использованиемвычислительной техники несложно. В литературе докомпьютерногоДоверительные интервалы97времени обычно приводятся упрощенные рекомендации, позволяющиеобойтись двукратным заглядыванием в таблицу.
Именно, предлагается(3.5) заменить парой соотношенийεP(χ2N −1 < z1 ) = P(χ2N −1 > z2 ) = .2При не слишком малых N такой выбор z1 и z2 почти оптимален.В заключение отметим, что при известном a можно несколькоулучшить рецепт построения доверительного интервала. В качествеоценки дисперсии σ 2 естественно в этом случае братьN1 XSмодиф.
=(Xi − a)2 .N i=12Очевидно, что2N Sмодиф.σ2∈ χ2N .Доверительный интервал, основанный на этом соотношении,представляется явно более предпочтительным, т.к. формула явноучитывает информацию о математическом ожидании. Нетрудносообразить, что увеличение на единицу числа степеней свободыукорачивает этот интервал по сравнению с интервалом, основанномна (3.5). Впрочем, случай известного a представляет, главным образом,академический, а не практический, интерес.3.4Двумерные доверительные множествапараметров нормального распределениядляПродолжая обсуждениенормальнораспределеннойвыборки,рассмотрим построение доверительной области для пары параметров(a, σ 2 ). Для простоты мы ограничимся асимптотической доверительнойобластью (и даже в этом случае опустим громоздкие выкладки).По лемме Фишера величины X̄ ∈ N(a, σ 2 /N ) и N S 2 /σ 2 ∈ χ2N −1независимы.
Аппроксимируем распределение хи-квадрат нормальным(см. параграф 1.5). Асимптотически при N → ∞ можно написатьN S2σ2√−N2N≈∈ N(0, 1).98Глава 3Таким образом, случайные величиныr µ¶√ X̄ − aN S2N,−1σ2 σ2независимы и имеют асимптотически распределение N(0, 1). Длядвумерного нормального распределения с плотностью11exp{− (x2 + y 2 )}2π2по доверительной вероятности 1 − ε легко найти кругp(x, y) = ϕ(x)ϕ(y) ={(x, y) : x2 + y 2 < c2 },имеющий именно эту вероятность. Можно сосчитать, что c2 = 2 ln 1ε .Остается заменить x и y нашими случайными величинами и получитьнеявное описание асимптотического доверительного множества"r µ·¸¶#2√ X̄ − a 2N S2N+< c2 .(3.6)−12σ2 σ√S2Положим t = N X̄−aS , q = σ 2 . Тогда неравенство (3.6) можно переписатьв видеNt2 q + (q − 1)2 < c22илиt22c22q − 2(1 − )q + 1 <.NNРешая его относительно q, получаемq− < q < q + ,гдеrt4t22(c2 − t2 )±+ 2.q± = 1 −NNNНесложные, но скучные выкладки показывают, что (с точностью домалых более высокого порядка)p2(c2 − t2 )√q± ≈ 1 ±при t2 < c2 .NНеравенство t2 < c2 дает нам интервалcScSX̄ − √ < a < X̄ + √NN(3.7)Доверительные интервалы99для тех a, для которых q± вещественны (и положительны).
Для этих aинтервал hq− , q+ i изменения q записывается в видеpp2(c2 − t2 )2(c2 − t2 )√√1−<q <1+.NNДля σ 2 при этом получаем (асимптотически)µ¶µ¶d(a)d(a)S2 1 − √< σ2 < S 2 1 + √,NNpгде d(a) =2(c2 − t2 ) зависит через t от a, изменяющегося впромежутке (3.7).3.5ДоверительныепараметрахинтервалыигипотезыоПерейдем, наконец, к обещанной связи с проверкой гипотез. Имеютсяв виду гипотезы вида θ = θ0 , где θ0 — некоторое заданное конкретноезначение параметра. Проверять их с помощью доверительныхинтервалов очень просто. Если гипотетическое значение θ0 не попадаетв доверительный интервал, гипотезу следует отвергнуть, в противномслучае, с обычными оговорками, принять.
Природу этих оговорокв рассматриваемом примере очень легко понять. Доверительныйинтервал всего лишь показывает, что, приняв гипотезу, мы не вступаемв отчетливо видимое противоречие с эмпирическими данными. Однако,приняв альтернативное, но близкое, предположение о θ, мы такжене вошли бы в такое противоречие. Отличить гипотезу θ = θ0 отблизких гипотез, тем самым, невозможно. Отвержение же гипотезыпроизводится как раз на основе явного (хотя и не абсолютного)противоречия с эмпирическими данными.Отметим, что традиционно при проверке гипотез задается малоеположительное число ε > 0 — уровень значимости.
Получить изнего доверительную вероятность можно вычитанием из 1 ("переходомк противоположному событию"). Впрочем, А.А.Боровков предлагаетуровнем значимости называть прямо 1 − ε (см. [1]). Поскольку такоесловоупотребление расходится с принятым, мы, с некоторым сожалениеми колебанием, не принимаем его предложение.Изложенный рецепт привлекает своей общностью, однако не стоитзабывать о том, что нам при этом не потребовалось даже уточнить,100Глава 3как выглядит альтернативная гипотеза.
Надо думать, в различных болееузких задачах возможны и более оптимальные рецепты.Приведем три простых примера не столь прямолинейногоиспользования доверительных интервалов для проверки гипотез.Критерий знаков.Предположим, что у нас имеются две независимые между собойвыборки одинакового объема N — X1 , . . .
, XN и Y1 , . . . , YN . Основнаягипотеза состоит в том, что эти две выборки одинаково распределены.Критерий знаков дает грубый способ, который иногда позволяет сразуже отвергнуть основную гипотезу. Правда, если это не удается, доводовв пользу ее почти не появляется.Способ этот состоит в рассмотрении последовательности знаков:пишем +, если Xi > Yi , пишем -, если Xi < Yi , ничего не пишем,если Xi = Yi . Получаем последовательность знаков длины N 0 ≤ N ,т.е.
выборку из успехов и неудач. Заметим, что если основная гипотезасправедлива, то обе вероятностиp+ = P(Xi > Yi |Xi 6= Yi )иp− = P(Xi < Yi |Xi 6= Yi )равны 1/2. Если это значение 1/2 не попадает в доверительныйинтервал для вероятности успеха p+ , гипотезу можно отвергнуть.В противном случае рекомендуется продолжить исследование болееточными методами.Сравнение двух независимых нормально распределенныхвыборок с одинаковыми дисперсиями.Пусть X1 , .
. . , XN — независимые величины, имеющие нормальноераспределение N(a, σ 2 ), X10 , . . . , XN0 0 — независимые между собой и сX1 , . . . , XN величины, имеющие нормальное распределение N(a0 , σ 2 ).Основная гипотеза заключается в совпадении двух теоретическихраспределений, т.е. в совпадении средних: a = a0 . Подчеркнем, чторавенство дисперсий предполагается, хотя само значение σ 2 считаетсянеизвестным. Для проверки гипотезы образуем стьюдентовскую дробьДоверительные интервалывида√N + N0 − 2³X̄−aσ101X 0 −a0σ−qN S2σ2=´¡+√1N+¢1 −1/2N0N 0S02σ2N+N0r−2N N 0 (X̄ − X 0 ) − (a − a0 )p,N + N0N S 2 + N 0S 02имеющую распределение tN +N 0 −2 (проверьте!), и построим с ее помощьюдоверительный интервал для разности a − a0 .