М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 8
Текст из файла (страница 8)
(1) Из формул (9) н (11) н того факта, что кз события 5„+~~(х вытекает 5„~~х, получаем Р(М, =п) =Р(5„<х,5„.~~)х) =Р(5„<х) — Р(5„< х,5,+~<х) = =Р(5„< х) — Р(5л+~ <х), т. е. Р(5„<х) — д (5 <х)+ 1 )л 4 (17) Последовательно нспользуя (17) при и=1, 2,... и принимая во внимание, что 5~=Хо имеем для ф.р. сл.в. 5: Р(5„<х]=! — е-' (1+ — + ...
+ 1. (18) н (~ — 1)! / Дифференцируя (18) по х н производя сокращения, находим плотность распределения сл.в. 5„: 1, — е-', х~О. (19) (и — !) $ (П) Пусть 0 уи<уз«... у„+ь Выберем 6>0 таким, что у,+6)ум уз+6<уз, ..., у„+6)у„+ь Тогда с учетом леммы 1 получим Р (У~< 5~ < Ую + 6 Уз <5з ~ Уз + 6 ° ° ° ~ Ук+~ < 5а+~ < Уе ы + 6) = := Р (У<км) = 0 й)м„м+ь) = 1.
)Уь,+ь.м) = О ° ° ° )))м„,.з„,+з) = 1) = з =е — ьм(Ме-ьз)"+' П е ~'") ")~' =(Аб)"+'е-ые ~""+~. (20) / ! Поделив выражение (20) на 6"+' и устремнв 6 к нулю, получим 18, 3 (У„,..., У„+ъ) =).леча-"т, О( У,(... (У„+,. (21) Поскольку с вероятностью единица 0<5~<... <5„+„то для значеннй уь...,у,+ь не входящих в (21), совместная плотность )навяз нулю. Поделив плотность (21) на выраженнедля ~з~, (х~~л), найденное в (1), получаем требуемый результат.
(П1) Прн 0<х~<хз<... <х <! н 6)0 таком, что хс+6< <х ь 1=1,...,л — 1, имеем Р (х,< — < х~+6,1=1, ... л) = дт ла,~ 41 1 Ь, га (у>, ...,у„+,)Фу,... Фу„е!. (22) вь где интегрирование ведется по (л+1)-мерному множеству В,=((у!,..., у«м): х,<уг(у„з!(х!+б, !=1,..., л). Подставляя (21) в (22), легко видеть, что интеграл (22) сводится к повторному О !«,+Ые««, !«» "Ьт« ~ '1 А«+! е !'" ° !(у,з. ] ь(у, ...
] ь(у„=. «и Уь«1 «м«,1 =-б" 1 Ка !! е "У«"ул+Ауп+! =-Рл1, ь (23) ! « ги! =-- ! ~~~ х! ]/ [! х?, ! = 1,.... л — 1, (24) 7 ! можно рассматривать. в соответствии с замечанием к лемме 2, как порядковые статистики для независимой выборки из равномерного на [О, 1] распределения. Отсюда возникает возможность применить различные способы проверки согласованности наблюдений с заданной (известной) теоретической ф. р. 4. Пример. Стедующпе даииыс представляют гобой количество летных часов между последовательными отказами установки для кондицнонирования воздуха на самолете типа «Боинг-720» [4]: 26 26! 87 ? !20 !Ь 6« 47 2«З 7! 2!6 2! 42 20 6 !2 !20 !! 3 !4 7! !! !4 !! !6 90 ! !6 62 96 42 где мы использовалн, что интеграл от плотности ?з,„,(у)-"-7!«+! ".
7Се-'»у"/л! равен 1. Из (22) и (23) вытекает, что совместная плотность 5;/5»+ь !'=1, ..., и, на множестве 0<х!(...<х»<1 постоянна н равна л!. Очевидно, оиа равна нулю для остальных значений переменных. (ГЧ) Это утверждение доказывается аналогично (И), Из утверждения (Ш) леммы 2 вытекает следующий критерий проверки гипотезы об зкспоиенциальиостн случайной выборки. Допустим, наблюдаются результаты л независимых испытаний х!, хь...,х, н имеется предположение, что соответствующие сл.в.
Х!, Хь...,Х„независимы и имеют одну и ту же зкспоиенциальную плотность Хе '", х~О с неизвестным 7.. Если предположение верно, то значечия Считая промежутки между отказами неэависимымн, проверим предположение об экспоненциальном законе распределения этих промежутков с помощью графического приема, описанного в предыдущем параграфе (вероятностная бумага). На рнс. 6 отмечены точки (х, „— !и(1-(!-0,5)/л)); !'=1, 2, ..., л; л=30, Д4 ат аа Д4 Дг гг аа вр ат) яд ггд гад лв д " "," гг да ду да дг дд ад Рис У. Эмиирическая фуикиия расиредслсния для точек э,(а„, э!-х,и+ —...+х!! х! — времена между отказами установки кондиииоиирования воздуха Рис.
а. Точкч (х,и, — )и(1 — (! — цэ)( ,и)) и ирилсгаюкиая ирямая для от. кидов установки для коидвиионировм!ия воэдуха Прямая х=пр; о=59,1 проведена на глаз„и согласие с экспоненциальным распределением можно считать удовлетворительным, Эмпирическое среднее. равно я ) %"% х= — '>;х! =59,6, н так что графическая оценка и параметра масштаба о близка к ииеике этого параметра с помощью выборочного среднего.
Отклонение по вертикали выборочных точек от прямой достигает наибольшего значения около 0,2! для х,!и=23 (см. рис. 6 н учтите неравномерность масштаба по вертикали). Хотелось бы использовать статистику Колмогорова: 0„=- зцр (Е„(х) — Е (х) (, чтобы оценить значимость наблюдаемого отклонения э.ф.р. от теоретической ф.р. Однако этому мешает то обстоятельство, что теоретическая ф.р. г(х/о)=1-е-ха содержит неизвестный параметр о. Можно применить критерий Колмогорова к данной зада! че используя лемму 2.
Вычислим значения Д7=~ х;, где х!— 7=! следовательные значения времен между отказамн, 1=1, .... 30: 43 846 1397 1693 284 371 1184 1ххо 1493 1507 23 1163 1482 0,3210 0,3473 0,6996 0,7063 0,8428 0,84М Э.ф.р. для хаь 1=1, ..., 29, представлена иа рис. 7. Далее имеем 0»=0,6604 — — =0,2086, Р 290»= 1,107, Р(Р'и 0„)1,107) ив 1 — К(1,107) =0,173, т. е. примерно в 17 случаях из 100 могло бы наблюдаться такое же или большее отклонение. й 6. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ЭКСПОНЕНЦИАЛЬНОГО РАСПРЕДЕЛЕНИИ 1, Оцениваиие параметра сдвига при известном параметре масштаба. Пусть Хь 1=1, ..., л, — независимые сл. в.
с плотностью а-7((х — р)/а), где х)0, 10, х< 0. Распределение вероятностей сл.в. Х1 сосредоточено на (р, +со), н, как мы уже видели в $3, п. 4, оценить р можно с помощью статистики Хаь Распределение вероятностей Хгц легко находится У(Хсц>х) =У(Х~>х, ..., Ха>х) =е- < -"и; х>р, (1) среднее н дисперсия равны МХц1=р+а/л, ОХц1=09лт. (2) Считая параметр а известным, смещение оценки Хсц можно исправить, рассматривая вместо нее Х01 — а/и. Если а неизвестно, то можно попытаться заменить в формуле Хгц — а7л неизвестное а его оценкой по той же выборке.
2. Оценнванне параметра масштаба нри известием параметре сдвига. Рассмотрим задачу оценнвання а, предполагая, что и известно. Поскольку МХ;=И+а, (3) После деления х1ц=зу/3», 1=1, 0,0128 О, 15М 0,4731 0,5128 0,7734 0,7796 О,М79 0,9082 378 478 512 574 621 917 1246 1251 1263 1383 1394 г411 1518 1534 1624 1625 1641 17М на з»=1788 получаем следующий ряд значеняй ..., 29: О,%74 0,2114 0,27М 0,2863 0,6504 0,6621 0,68% 0,6968 0,7813 0,7891 0,8288 0,8350 0,9088 0,9177 0,9468 з качестве оценки о можно предложить Т(Х) =Х вЂ” р= — э (Х,-р).
! к"ч к 1 ! Опенка Т(Х) — несмещенная, ее дисперсия равна ог/л. Так как Уг= (Х! — р)/о, ! 1, 2, ..., л, (4) — сл.в. со стандартной экслоненциальиой плотностью /(х), то для плотности распределения сл.в. ~~' 'г! можем воспользовать- ся формулой, выведенной в $5: Распределение с плотностью а(р/2)/2 играет важную роль в статистике и называется хн-квадрат распределением с 2л степенями свободы; обозначение угг,. Отметим, что экспоненциальное распределение с плотностью 1/2е еа ЯвлЯетси в то же вРемЯ Угг-РаслРеделением.
Подробнее о Х'-распределении будет идти речь в следующем параграфе. Из сказанного следует, что статистика 2Я 'г'! имеет тге«-рас. ! ! пределение, и поскольку « Т(Х) = — 2 э'К„ 2« ! ! го, используя обозначения хе для р-квантили распределения угг„ получаем Зе(2лТ(Х)/о~хр) р. Таким образом, а-доверительный интервал для о можно записать а форме х, ° < 2лТ (Х)/о < х! „а или 2лТ (Х)/х! «гг < о < 2лТ (Х)/х,а. указанный интервал является симметричным в том смысле, что зллнаково вероятно, окажется истинное значение о слева или справа от этого интервала. Легко построить тем же способом н несимметричный а-доверительный интервал. Функция распределения Х'„табулнрована (см. (1)), там же указаны квантилн к, распределения Хг, для большого набора зиагс гпй р н л =! (1) 100 (л от 1 до 100 с шагом 1).
Пример 1. Построим искусственную выборку объема а=20 - и;.;:л!истрами и=1, о=2 с помощью таблицы случайных чисел 45 ]1]. Если (/ — равномерно распределенная сл.н,, то при 0(х(ьь вт( — !п (/ х) =.У((/)е-") = 1 — е-, т. е. сл. в. — 1п (/ имеет стандартное зкспопенциальное распределение. Выборку хь 1=1, ..., п, из равномерного на ]О, 1] распределения получим группировкой по 4 цифры табл.
7.1,а ]1]. Затем строим выборку х„<'=1, ..., п, по формуле х, — 2!их<+1: 7,442 2.900 4,481 3,239 1,725 3,844 1,982 3,372 7,550 2,458 2,009 1,353 3,219 4,288 5,374 3,294 1,244 3,340 3,949 1,491 Вычисляем хо<=1,244; Х: 3,4283, Если предположить, что значение параметра 0=2 извес'по. то в качестве несмещенной оценки 1< получаеь< х„,— о/20=1.244— — 0,1=1,144. Если предположить, что и известно, то получаем несмещенную оценку о: Т(х)=х — и=2,4283. По табл, 2.2,а (1] находим значения кваптилей распределения 7',,: хна„- — — 24,433; хкзт„= 59,342 и вычисляем границы доверительного интервала с коэффициентом доверия 0,95: 2п Т(х) /к< э<4=1.636; 2п Т(х) /хк<пь 3,975.
3. Точечные оценки и и а. Когда оба параметра неизвестны, оценку о л<ожно получить. заменяя в (4) 14 на его оценку Хо>. о=У-Х<». Из (1) и (3) вытекает, что о — смещенная оценка: т ьт п — 1 й40 =. р 8 и — ~р —, — /1 — — о, ь / и поэтому несмещенной оценкой будет л и 1 о' =. — и = — — ьз (Х<о — Х<»). и-1 н-1 Несмещенной оценкой параметра 1<, очевидно, будет служить мь =Хо < — о" /и.