А.Н. Бородин - Элементарный курс теории вероятностей и математической статистики (DJVU) (1115320), страница 24
Текст из файла (страница 24)
Используя формулы Х„= -'~ХИ получим следующие численные значения выборочного сред- 1 него и выборочной дисперсии: У„= — ° ( — 6.00) = -0,15; в' = — ° 31.1328 — — ° 0.0225 = — ° (31.1328 — 0.9) в 0.80 1 40 1 39 39 39 (для обозначения реализаций используются соответствующие строчные буквы). Так как дисперсия неизвестна, то мы используем следующую формулу для доверительного интервала, основанную на реализации случайной выборки: где 3 — квантиль порядка и = 0.9 функции Лапласа Ф(в). Из таблиц для функции Лапласа можно найти, что зр 9 ж 1.684.
Тогда — ъЯ 91 ''~ 40.8 А1 0.24, еаза .Ь~~~ 1Яо м — 0.15 ~ 0.24. Следовательно, доверительный интервал для математического ожидания имеет вид (-0.39, 0.09). Таким образом, для данной выборки наблюдений с вероятностью приблизительно равной 0.9 математическое ожидание т удовлетворяет неравенству -0.39 < т ( 0.09. ЗАдачи Задача 21.1. По результатам измерений, приведенных в задаче 19.1, требуется: а) вычислить доверительный интервал для математического ожидания начальной скорости с доверительной вероятностью 0.9; б) вычислить доверительный интервал для дисперсии с доверительной вероятностью О. 92.
165 тт. НЕРАВЕНСТВО РАО-КРАМЕРА Задача 21.2. Произведено пять независимых измерений для определения заряда электрона. Получены следующие значения (в кулонах): 1.594 ° 10 1в,1.597 10 1в, 1.596 ° 10 вв,1.593 ° 10 'в,1.590 ° 10 1в. Предполагая, что ошибки измерения распределены по нормальному закону, оценить величину заряда электрона и найти для нее доверительные границы при доверительной вероятности 0.99. ~ 22.
НВРАвкнство РАо-КРАмкРА Меру качества оценки можно выбирать по-разному. Наиболее часто используемой мерой качества служит среднеквадратичное отклонение оценки от оцениваемого параметра. Чем меньше величина среднеквадратичного отклонения Е(7„(Х) — д), тем оценка 7„(Х) параметра д лучше.
При определенных условиях существует нижняя граница для величины среднеквадратичного отклонения, которую улучшить нельзя. Вычислим эту границу. Пусть случайная величина Х имеет плотность распределения,вв(я), в Е (-оо, оо), которая является дифференцируемой по д. Поскольку величины ХНХз,...,Х„независимы, то согласно формуле (11.3) совместная плотность распределения случайного вектора У = (ХНХз,...,Х„) имеет вид Ь(й) = Ь(*1)Ув(ят)" Ув(*п) (22.1) Предположим, что оценка 7„(Х) является несмещенной. По определению это означает,что Е(7а(Х)) = / ' '' / Тп(х)1вЯяй= д.
Продифференцировав это равенство по д, получим 1 = я ' ' ' 7п(з)вв(й)з* = ' ' ' 7э(в)явв(д)о* = 1 т,(е — (ьу азу (ею = е~у„(х) — В ф (хя. (22.2) МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В силу первого свойства совместной плотности распределе- ния (1 11) Д(х)дх = 1. (22.3) Продифференцировав по д это равенство, получим (22.4) Ломножая вто равенство на д и вычитая результат из (22,2), будем иметь Е((7 (Х) — д) Р 1п Уу(Х)) = 1 ° Воспользуемся четвертым свойством математического ожи- дания и неравенством Гельдера (12.2). Тогда 1 = Е((7«(х) — д)$1пу (х)) < Е~(7 (х) — д)Д1ву (х)~ < ~< (Е(7«(Х) — д) ) (Е(~В1п|е(Х)) ) Возведя левую и правую части етого неравенства в квадрат, получим неравенство Рао-Кремера Е(7«(Х) — д) ~ )—, 1«( ) (22.5) где 1„~о=«~,— ',«ь(тз'= 1 "~(,— ',1 /я) ьяж. Величина 1«(д) называется информ~щиониым количеством Фишера относительно параметра д, содержащимся в и на- блюдениях Хы Хз,..., Х«.
72. НЕРАВЕНСТВО РАО-КРАМЕРА 167 Согласно неравенству Рао — Крамера среднеквадратичное отклонение оценки от оцениваемого параметра не может быть меньше величины, обратной к информационному количеству Фишера. Определение 1. Оценка 7„(Х) параметра д, для которой выполняется равенство В(7 (Х) — д) называется аффективной оценкой. Пусть функция Д(я) дважды непрерывно дифференцируема по Р. В етом случае можно получить следующее выражение для информационного количества Фишера (22.6) которое часто является более удобным для вычислений.
Оно следует из цепочки равенств где для получения последнего равенства использовано соотношение (22.3). Величина 1„(0) возрастает с ростом и. Выразим информационное количество Фишера, содержащееся в в наблюдениях, через информационное количество Фишера, содержащееся в одном наблюдении, т. е. через величину МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Лля функции Ях) дважды непрерывно дифференцируемой по О, используя (22.1), (22.6) и свойство, что логарифм от произведения величин равен сумме логарифмов, получим л е 1„(0) = — Е~ —, ) !пув(Х«)) = — ~~ь Е( — !п)в(Х«)) = «=« «=1 дв = -пЕ( — !пув(Х«)) = пв«(0). В случае, когда функция Д(х) не имеет второй производной по 0, аналогичное равенство получается следующим обра- зом: е е 4ъ(0Л= Е( — 'Е! )в(Х«))' = Е(') — '!пЬ(Х«)) ««ц ««ц о » «-« Е( — !пУв(Х«)) +2~~~ ~ Е(( — !пЯХ«))( — в!вД(Х~))).
««ц ш1 1,(0) = п1«(0)+2 ~ь ~~ Е( — !и ~в(Х«))Е( — !пав(Хв)) = п1«(0). ««н в=« Таким образом, информационное количество Фишера, содержащееся в и наблюдениях, равно информационному количеству Фишера, содержащемуся в одном наблюдении, домноженному на число наблюдений и. С учетом этого неравенству Рао-Крамера можно придать следуюший вид: Е(Т„(Х) — 0) ' ~,'„,. Оценка Т„(Х) будет эффективной, если (22.7) Е(Т„(Х) — 0) е11 !в! Величины Х», !в = 1, 2,..., и независимы и одинаково распре- делены.
Воспользуемся третьим свойством математического ожидания (з 12) и равенством (22.4) для и = 1. В результате получим 22. НЕРАВЕНСТВО РАО-КРАМЕРА 169 Эффективные оценки можно построить лишь в редких случаях. Чаще бывает так, что оценка лишь с ростом и приближается к неулучшаемой.
Определение 2. Оценка у„(Х) называется асимптотически эффективной оценкой параметра д, если пЕ(у„(Х) — д) й(в) ' (22.8) Замечание 1. В 2 20 мы рассматривали асимптотически нормальные оценки с дисперсией Ь2. Если Ь2 = 11 1(д), то асимптотически нормальная оценка будет и асимптотически эффективной. Действительно, согласно определению асимптотической нормальности, функция распределения величины 1/и/1(д)(1„(Х) — О) сходится при и - оо к функции распределения стандартного нормального закона, который имеет дисперсию 1. Если, например, у оценки существует абсолютный момент порядка больше, чем два, то сходимость распределений влечет и сходимость дисперсий, т. е.
Р(1/и/1(д)(у„(Х) — О)) -+ 1. (22.9) Поскольку оценка у„(Х) предполагается несмещенной, то Щ1/и/1(д)(уп(Х) — д)) = и/1(д)Е(уи(Х) — О) . у ( .) 1 -(~-з) /2~~ ~/2~пг где математическое ожидание О является неизвестным пара- метром, а дисперсия 11(Х1) = Р2 известна. Тогда С учетом этого равенства соотношение (22.9) эквивалентно (22.8). Пример 1. Пусть выборка Х1,Х2,...,Х„отвечает нормальному распределению с плотностью мдтнвлтичкскдя статистика 1то Среднеквадратичное отклонение выборочного среднего Х„ от среднего 0 вычислялось при доказательстве закона больших чисел.
Согласно (16.5) Е(Хэ — В) — 1з(х,) <Р э о пй(В) Таким образом, выборочное среднее для выборки, отвечающей нормальному распределению с известной дисперсией, является эффективной оценкой для математического ожидания. Это один из тех редких примеров, когда можно явно указать эффективную оценку параметра.
Лругой пример связан с показательным распределением. Пример 2. Пусть выборка ХВХз,..., Х„отвечает показательному распределению с параметром д ~,д > О, т. е. распределенную с плотностью Г'-ув -е, при х) О, О, при х < О. Тогда, принимал во внимание следуюшие выражения для математического ожидания и дисперсии (т 14, п. 2) Е(Х1) = = И, П(Х1) = вт, получим 11(В) = — Е(И1пУв(Х1)) = -Е( Ф, Ов- — Ь)) = г1 ах 1 1 т = — Е~ — — — ( = — — + — Е(Х1) = — = —.
~в в ) в в в гз(х,)' В этом примере информационное количество Фишера зависит от параметра д и не является постоянным, как это было в примере 1, однако тоже является обратно пропорциональным дисперсии. Отсюда, как показано в примере 1, следует, что выборочное среднее Х„является эффективной оценкой параметра В.
2З. ПРОВЕРКА СТАТИСГИЧЕСКИХ ГИПОТЕЗ з23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Предположим, что функция распределения случайной величины Х нам неизвестна, но мы располагаем случайной выборкой Х = (ХИХз,...,Х„). По наблюдениям выборки Х мы хотим дать ответ на вопрос: совпадает функция распределения г"(х) с некоторой наперед заданной функцией распределения гз(х) или нет. При такой постановке задачи говорят, что речь идет о проверке статистической гипотезы согласия. Используя наблюдения выборки Х, нужно либо принять гипотезу о том, что функция распределения г'(х) совпадает с заданной функцией распределения Ро(х), либо ее отвергнуть. Правило принятия одного иэ етих двух решений называется статистическим критерием или просто критерием. В качестве функции Ро(х) обычно выбирается одно из известных распределений, например, нормальное, равномерное или показательное распределение с известными параметрами.
Рассмотрим две конкретные задачи. Методы решения этих задач предложены А. Н. Колмогоровым и К. Пирсоном. 1. Критерий согласия Колмогорова. Рассматривается гипотеза о том, что функция распределения г'(х) совпадает с непрерывной функцией распределения Ге(х). Обозначим ету гипотезу символом Но. Символом Н1 обозначим противоположную гипотезу о том, что Р(х) ф Ро(х) хотя бы при одном значении х. Проверка гипотезы о распределении состоит в том, чтобы по наблюдениям выборки Х1, Хз,..., Х„сделать вывод, что функция распределения г"(х) совпадает с го(х), т.