Теория вероятности. Вентцель Е.С (4-е издание) (1082431), страница 56
Текст из файла (страница 56)
Такого рода случайные величины играют большую роль в математической статистике; оии наиболее подробно изучены для случая нормального распределения величины Х. Например, доказано, что при нормальном распределении величины Х случайная величина ОБРАБОТКА ОПЫТОВ 1гл. 14 Пусть произведено и независимых опытов над случайной величиной Х, распределенной по нормальному закону с неизвестными параметрами т и О.
Для этих параметров получены оценки л п ч', х, ~ (хс — е) Требуется построить доверительные интервалы для обоих параметров, соотзетствуюсцие доверительной вероятности р, Построим сначала доверительный интервал для математического ожидания. Естественно этот интервал взять симметричным относительно е1 обозначим а половину длины интервала.
Величину е нужно выбрать так, чтобы выполнялось условие Р(1т — е~ < е)=р. (14.4.5) Попытаемся перейти в левой части равенства (14.4.5) от случайпой величины е к случайной величине Т, распределенной по закону Стьюдента. Для этого умножим обе части неравенства 1т — е~ < з Па положительную величину =1 ~~6 ' пли, пользуясь обозначением (14.4.1) 1Т~ < (14.4.6) (14А.8) Найдем такое число гз, что Р(~ Т! <4з)=Р. (14 АЛ) В' 'Рн.на г найдется цз услозсе Р сз Р ( ~! Т! < га) = ~3 З„ъ (Г) с)С = 8 сз Из формулы (14А.2) видно, что О„,(с) — четная функция; поэтому (14А.8) дает сз 2~ 5„~(с)ссс=р. (1 4.4,9) з МЕТОДЫ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ 322 !АА1 Равенство (14.4.9) определяет величину 1а в зависимости от р.
Если иметь в своем распоряжении таблицу значений интеграла 'кг (л) = 2 ~ О„, (г) кгг, о ./в з =г )/ з — ВУ (14.4. 1О) мы найдем половину ширины доверительного интервала У и сам интервал У, — ( — ь 1 —; Й-~. ь 1 — ) . (144. 1 3 Пример 1. Произведено 5 независимых опытов над случайной величиной Х, распределенной нормально с неизвестными параметрами гл и ю Результаты опытов приведены в таблице 14.4.1. Таблица 14.4.1 — 2,5 3,4 — 2,0 1,0 2,1 Найти оценку лг для математического ожидания и построить для него 90%-и доверительный интервал /ч (т. е. интервал, соответствующий доверительной вероятности 3 = 0,9).
" с ш с ц ч е, 1гкееч 7н = 0,4; ь = 6,6. По 1зб,шце 5 прцаожишк дкя и — 1 = 4 и Р =0,9 находим Уз=2,13, огкуда к/ /Т к З = Г З 1/ — 2 45. и Доверительный интервал будет / =(т — к; лг+за) =( — 2,05; 2,85). то величину Ра можно найти обратным интерполированием в этой таблице. Однако удобнее составить заранее таблицу значений Такая таблица дается в приложении (см. табл.
5). В втой таблице приведены значения га в аависимости от доверительной вероятности р и числа степеней свободы и — 1. Определив /з по таблице 5 и по- лагая ОБРАВОТКА ОПЫТОВ [ГЛ 1а Пример 2. Для условий примера 1 и'14.3, предполагая величину Х распределенной нормально найти точный доверительный интервал. решение. По таблице 5 приложении находим прил — 1 19 и з=0,8 та — — 1,328; отсела ха — — Г, 1' — = 0,0704.
° / 7) Сравнивая с решением примера 1 и'14.3 (еа 0072), убеждаемся, что расхождение весьма незначительно. Если сохранить точность до второго знака после запятой. то доверительные интервалы, найденные точным и приближенным методами, совпадают: 7а=(10,71; 10,83). Перейдем к построению ловерительного интервала для дисперсии. Рассмотрим несмещенную оценку дисперсии л ~ч~"„(Хг — т)" г=! л — 1 и выразим случайную величину 0 через величину Ъ' (14.4.3).
имеющую распрелеление уз (14.4.4): 77 6=У . (14.4.12) Зная закон распределения величины 1г, можно найти интервал то в который она попадает с залаиной вероягностью р. Закон распределения й„ ,(о) величины 1' имеРие. 14.4.1. ет вид, итобра1кеиный иа рис. 14.4.1. Возникает вопрос: как выбрать интервал 1 7 Если бы взкон распределения величины 1' был симметричным (как нормальный закон илн распределение Стьюдента), естественно было бы взять интервал 1 симметричным относительно математического ожидания.
В данном случае закон л„,(О) несимметрнчен. Условимся выбирать интервал тз так, чтооы вероятности выхода величины У за пределы интервала вправо и влево (заштрихованные плошали на рис. 14,4,1) были одинаковы и равны методы поствоения довевительнык интеввалов 329 зал! Построим такой интервал 1„=()'.)Р Е)а), который накрывает точку аг тогда и только тогда, когда величина )г попадает в интервал г . Покажем, что интервал (14.4.13) удовлетворяет атому условию. Действительно. неравенства Х) (и — 1) 5 (и — 1) тз В Хз равносильны неравенствам а зги неравенства выполняются с вероятностью В. Таким образом, доверительный интервал для дисперсии найден и выражается формулой (14.4.13).
Пример 3. Найти доверительный интервал аля дисперсии в условиях примера 2 и' 14.3, если известно, что велпчииа Х Распределена нормально. а Решение. Имеем з9=0,8; а=0,2; — =О,1. По таблице 4 приложения ''2 ьзьодик ьна г = и — 1 = 19 для Р,= — =0,1 2 а~ -††27,2," 2 а для Р. =1 — — =0,9 2 Чтобы построить кнтервал 1 с таким свойством, воспользуемся таблицей 4 приложения: в ней приведены числа у' такие, что гз0' ) Х)=Р для величины (г, имеющей Хз-распределение с г степенями свободы.
В нашем случае г=и — !. Зафиксируем г=и — 1 и найдем в соответствующей строке табл. 4 два значения уа: одно. отвечающее и а вероятности Р,= —; другое — вероятности Р,=1 — —. Обозначим ати значениЯ Хт! н Х2 2ИнтеРвал Га имеет Хза своим левым. а Х2— правым концом. Теперь найдем по интервалу га искомый доверительный интервал 1 для дисперсии с границами Х), и йт, который накрывает точку О с вероятностью р: Р(оз < 1) < Х)з) = Р. 330 ОБРАБОТКА ОПЫТОВ [ГЛ, 14 По формуле (14ук13) находим доверительный интервал 'для дисперсии Уз = (0,045; 0,104). Соответствующий интервал для среднего квадратического отклонения: (0,21; 0,32). Этот интервал лишь незначительно превосходит полученный в примере 2 п' 14,3 приближенным методом интервал (0,21; 0,29). 14.5.
Оценка вероятности по частоте На практике часто приходится оценивать неизвестную вероятность р события А по его частоте р" в п независимых опытах. Эта задача близко примыкает к рассмотренным з предыдущих и'и'. Действительно, частота события А в в независимых опытах есть не что иное. как среднее арифметическое наблюденных значений величины Х, которая в каждом отдельном опыте п;:ринииает значение 1, если событие А появилось, и О, если не поязилосгл р = (1 4.5.1) Напомним, что математическое ожидание величины Х равно р; ее дисперсия рд, где д = 1 — р.
Математическое ожидание среднего арифметического также равно р 4И 1Р*! = Р (14.5.2) т. е. оценка р' для р является несмещенной. Дисперсия величины р* равна 1)(р*] = ~~, л (14.5.3) Можно доказать, что зта дисперсия является минимально возможной, т. е. оценка р' для р является аффективной. Таким образом, в качестве точечной оценка для неизвестной вероятности р разумно во всех случаях принимать 1астоту р*.
Возн11- и г вопрос о точности и надежности такой оценки, т. е. о построении доверительного интервала для вероятности р. Хотя эта задача и представляет собой частный случаИ ранее рассмотренной задачи о доверительном интервале для математического ожидания, все же целесообразно решать ее отдельно. Специфика здесь в том, что величина Х вЂ” прсрывпая случайная величина только с двумя возможными значениями 0 и 1, Кломе того, ее математп ческое ожидание р и дисперсия рз = р (1 — р) связаны функциональной зависимостью.
Это упрощзст задачу построен41я доверительного интервала. 331 оценка невнятности по частоте шл» = „о; ол» вЂ” — 1,г - l" Ря л (1 4.5.4) Предположим сначала, что величина р нам известна. Назначим доверительную вероятность р и найдем такой интервал (р — е, р+а ), чтобы величина р' попадала в этот интервал с вероятностью р: ул(~ р' — й < «) =~. (14.5.5) Так как величина р* распределена нормально, то / »« Р ( ~ р" — р ~ < а«) = 2Ф' ~ — «1 — 1 = ~, (а» 7 откуда, как и в и'14.3, «ол»а«к Ф ~ 2 »/1+«1 где агй'Ф' — функция, обратная нормальной функции распределения ф". Для определения р, как и в п' 14,3, можно обозначить « =агкФ" ( + ).
в« = ««ая», Тогда (14.5.6) где «определяется из таблицы 14.3.1. Таким образом, с вероятностью р мо«кно утверждать, что «1' л (14.5.7) Фактически величина р нам неизвестна; однако неравенство (14.5,7) будет иметь вероятность р независимо от того, известна нам или неизвестна вероятность р. Получив из опыта конкретное значение частоты р*,можно, пользуясь неравенством (14.5.7), найти интервал 7, который с вероятностью 9 накоывает точку р.
Действительно, ') Частота события при л опьыах представляет собой ирерывную случайную величину; говоря о близости ее закона распределения к нормальному, мы имеем в виду функцию распределения, а не плотность. Рассмотрим сначала наиболее простой случай, когда число опытов и сравнительно велико, а вероятность р не слишком велика и не слишком мала. Тогда можно считать, что частота события р' есть случайная величина, распределение которой близко к нормальному').