XVII Математическая статистика (1081432), страница 14
Текст из файла (страница 14)
Завершая рассуждения, заметим, что фактически построение доверительного интервала сводится к выполнению следующих действий: 1) построение центральной статистики Т(Х„,В) с известной функцией распределения Рг(8); 2) представление заданного коэффициента доверия у в виде т= 1 — о — В; 3) нахождение квантилей Ь и Ь1 р уровня е и 1 — ~3 функции распределения Рг(1); 4) нахождение значений нижней В(х„) и верхней В(х„) границ искомой интервальной оценки путем решения уравнений Т(х„,В)=Ь., Т(х„,В)=Ь, д (3.3) соответственно в случае, когда Т(х„, В) — возрастающая функция параметра В.
Если же Т(х„,6) — убывающая функция параметра В, то В(Х ) и В(Х„) получают путем решения уравнений Т(х„, В) = Ь1 д, Т(х„, В) = Ь (3.4) соответственно. 121 3.3. Примеры построения интервальных оценок 3.3. Примеры построения интервальных оценок Рассмотрим построение интервальной оцеи1си для параметров некоторых часто используемых распределений. Зкспоненпнальпое распределение. Пусть Մ— случайиал выборка объема и из генеральной совокупности Х с экспоиеициальиым законом распределения, имеющим плотность распределения ( Ле х-", ж ) О; р(*;Л) = О, ж ( О, где Л > 0 — неизвестный параметр. Требуется построить интервальную оценку для параметра Л по данным случайной выборки Х„. В данном случае у = Л.
Рассмотрим стаатистику Т(Х„,Л) = 2ЛпХ, где Х вЂ” выборочное среднее для Х„. Эта статистика имеет 1<я-распределение с 2п сгаепепями свободы (см. Д.3.1), т.е. является центральной статистикой. Уравнения (3.3) в данном случае принимают вид 2Лпж = Х (2п), 2Лпк=рД д(2п), Л(Х) Х'- ('п) 2пХ Л(- ) Х'( ) 2пХ Нормальное распределение. Пусть Х вЂ” случайная выборка объема п из генеральной совокупности Х, распределенной по нормальному закону с параметрами р и а~. Рассмотрим где Хяз(2п) — квантиль УРовнЯ а длЯ Хз-РаспРеделениЯ с 2п степенями свободы. Получаем, что ниэкилл и верхплл границы интервальной оценки с коэффициентом доверил у = 1 — сх — /3 для параметра экспоненциального распределения Л имеют вид 122 3.
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ некоторые варианты построения интервальных оценок для параметров р, о. В ар и акт 1 — оценка для математического ожидания при известной дисперсии. В данном случае статистика Т(Х„,р) = ~/и имеет стандартное нормальное распределение с параметрами р = О, аз = 1, т.е. является центральной статистикой. Функция Т(Х„, р) является убывающей функцией по р, и система урав- нений (3.4) принимает вид где ич — квантиль уровня о стандартного нормального распределения.
Учитывая, что для нормального закона и~ = -и, получаем следующие нижнюю и верхнюю границы .у-доверительного интервала для параметра р при т = 1 — о — ~3: ~~(ж„) =х — — ия в, т/п о р(х„) = ж+ — и~ т~/п В а р и а н т 2 — оценка математического ожидания при неизвестной дисперсии. При неизвестной дисперсии статистика является центральной, так как имеет распределение Стьюден- та с п — 1 степенями снободы (см. Д.3.1), которое не зависит от р и аз.
Система уравнений (3.4) в данном случае принимает вид ~/й(х — р(ж„)) =1~ д(п — 1), ~/й(х — р (х„) ) =1 (п — 1), /й(х — н(х„)) =п~ л, а ~/й(ж — р(х„)) = на~ и З.З. Примеры построения ввтероаеьных оценок 123 где ~ч(н — 1) — квантиль уровня д распределения Стьюдента с в — 1 степенями свободы. Поскольку плотность распределения Стьюдента — четная функция, то 1 (и — 1) = -~, (и — 1). Отсюда заключаем, что нижняя и верхняя границы интервальной оценки с коэффициентом доверия у = 1 — о — 11 для параметра р в случае с неизвестной дисперсией можно определить по формулам р(Х„)=Х вЂ” $1 Л(п-1),,и(Х„)=Х+ 11 (в — 1).
— Я(Х„) - — З(Х„) В а р и а н т 3 — оценка среднего квадратичного отклонения. Рассмотрим статистику (и — 1)5з(Х„) ,г Эта статистика является центральной, так как имеет Хз-распределение с и — 1 степенями свободы (см.
Д.З.1), которое не зависит от р и аз. При этом Т(х"„,о) — убывающая функция параметра и. Исходя из этого, согласно (3.4), находим нижнюю и верхнюю границы интервальной оценки для параметра о с коэффициентом доверия 7 = 1 — о †,В: ~т(Х„) = ", сг(Х„) = Я(Х„)~/и — 1 - Я(Х )~/и - 11 ( -1) Х'.(и-1) ' где Х~ч(а- 1) — квантиль уровня д для Хз-распределения с и — 1 степенями свободы.
Приближенные интервальные оценки. Сначала рассмотрим два частных случая построения таких оценок. Пусть требуется найти интервальную оценку для математического ожидания в случае, когда закон распределения генеральной сонокупности Х неизвестен. Предполагаем, что существуют конечные математическое ожидание ~и = МХ и дисперсия сгз = РХ. 124 з. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ Рассмотрим статистику Т(Х„) = — ~/и. и В соответствии с центральной предельной теоремой эта статистика при больших объемах и случайной выборки Х„имеет закон распределения, близкий к стандартному нормальному. Поэтому при достаточно больших и неравенства Х-р — и1 и < ~/й<и~ о выполняются с вероятностью, близкой к величине у = 1 — о — ~3, где ич — квантиль уровня д стандартного нормального распределения.
Приведенные неравенства эквивалентны следующим: — и — о Х вЂ” — и1 <р<Х+ — и| д. Эти неравенства не дают еще интервальной оценки для параметра р, так как их левая и правая части содержат неизвестный параметр о. Применяя еще одно приближение, а именно: подставляя в указанные неравенства вместо неизвестного точного значения н его оценку 5(Х„), получаем нижнюю н верхнюю границы (приближенной) интервальной оценки с коэффициентом доверия т = 1 -а -8 для математического ожидания и: ДХ„) = Х+ и1 — 5(Х„) Пусть проводится серия из и испытаний по схеме Бернулли и Хо 1 = 1, и, — исход й-го испытания („успех" или „отказ"). По данным случайной выборки Х„= (Хм ..., Х„) построим доверительный интервал для вероятности р „успеха" в каждом отдельном испытании.
З.З. Примеры нестроения интерваа ных ° цевок 125 рассмотрим суммарное число „успехов" в серии из и испытаний, т.е. введем случайную величину К(Х„)= Х +...+Х„, которая имеет биномизльное распределение с параметром р. Для построения доверительного интервала для р воспользуемся статистикой т(Х„,р)ее ( "'-"'. пр(1 — р) В соответствии с предельной теоремой Муавра — Лапласа статистика Т(Х, р) при больших объемах и случайной выборки Х„ имеет закон распределения, близкий к стандартному нормальному.
Тем самым неравенства К(Х„) — ар -и1 и< <кч пр(1 — р) выполняются с вероятностью, которую при больших и можно считать приближенно равной у = 1 — о-~3. Указанные неравенства могут быть записаны в виде — "-= lкг-веют — „"+=„Бн:ю К(Х„) н1 К(Х„) кч в и ~/й п,/й Эти неравенства еще не дают интервальной оценки параметра р, так как их левал и правая части содержат этот параметр. Поэтому на практике в указанные части неравенств часто подставляют вместо неизвестного точного значения р его оценку р(Х„) = К(Х„)/и.
В результате получают следующие верхнюю и нижнюю границы интервальной оценки с козффи- 126 3. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ циентом донерия у = 1 -о- Р для параметра р: К(х ) р(х„) = и /й (х) ( )+ 1 о п ~/я Подчеркнем, что зти доверительные границы являются приближенными и могут использоваться при достаточно больших объемах наблюдений п. Приведенный способ построения приближенного доверительного интервала для параметра р биномизльиого распределения может применяться и в следующей более общей ситуации.
Пусть В(Х„) — тпочечнал несмеи1енная оценка для параметра В, построенная по данным случайной выборки Х„. Обозначим через р„(в) = м(в(х„) — в)' значение дисперсии оценки В(Х„). Предположим, что оценка В(Х ) имеет асимп1потически нормальное распределение. Другими словами, нормированная случайная величина в(У„) -в ,/РДв) имеет распределение, которое при п -+ оо сходится к стандартному нормальному распределению. В этом случае неравенства в(х„) — в и1-О 'ч ~~ и1-а1 Г~.(в) где ил — квантиль уровня о стандартного нормального закона распределения, выполняются с вероятностью, которую при достаточно больших и можно считать приближенно равной 128 3. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ Значение точечной оценки параметра р определяется как дисперсия этой оценки [ХЪ'Ц Р[1 Р) Применяя приведенные выше формулы, получаем следующие значения для нижней и верхней границ доверительного интервала: Р[1 — Р) р=р-иоде — — 0,294, Р[1 — Р) Р = Р+ ио ев = 0,706.
3.4. Метод доверительных множеств Пусть Մ— случайнал выборка обьена п из генеральной совокупности Х, закон распределения которой зависит от г-мерного вектора параметров д. Каждому фиксированному значению вектора параметров б поставим в соответствие такое множество Н- из выборочного пространсгава Х„, что где 7 — заданный наэ4фициент доверия. Как известно [см. 3.1), нижняя и верхнлл границы интервальной оценки [множества в К) являются случайными величинами, поскольку они функции случайной выборки. Теперь в Ж' рассмотрим такое множество Рв со случайной границей, чтов бы при каждом фиксированном значении вектора параметров б случайные события (и б Рй )) (Х„Е Нб) 129 Злк Метод доверительных множеств были эквивалентны, т.е. Р~В~В~ )> г.