М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 9
Текст из файла (страница 9)
(6) (5) 4. Распределение интервалов между порядковыми статистиками. 46 Л ем м а 1. Пусть Уь <=1, ..., и, — неэависимь<е сл. в, со ствндвртнои экспоненциольной плотностью /(у) =е-ь, у>0, а У<» У<м(...(У«0 — порядковые статистики, Тогда сл, в, Я<= =(и — !+1) (Уси — Уа-и), 1=1, ..., и, Ум=О, независимы и имеют гу хс плотность 1(г).
Доказательства. Легко видеть, что события У, ( У, (...(Уы, где (!ь (ь ..., 1,) — перестановка из чисел (1, 2, ..., л), равновеРоЯтны. ПоэтомУ, полагаЯ У1м — — У»=0 и выбнРаЯ х;>О, 1 1, ..., и, получаем Р((и — 1+ 1)(Уа1 — Уи и))х;, (=1, ...,п) = = и! уь (У < У«(... (Ул, (и — 1+ 1) (У1 — У~ 1) )хь ( = 1, . „, л) = = и1 Р (У1 — Ус-ю )хДл — 1 + 1), Е = 1, ..., л) = =л1 ~е-едут ~ е еч(у»...
~ е "'.1ду„-, ~ е елду„=- »1 и и+илии И уи-г+лл ге Хл-1+ил' =и1 ~ е-ен!у,... ~ е л-~ду, ! — е — ее 1 — л 1 л,'л »л л«лл 1э -=п1 ~е-еду, ... ~ е лы дул з — е "- — е з, 2 ! «еи и„ вЂ” Е-и~г-ив Е лл. Замечание. Лемму 1 можно рассматривать как одно из «;идствий свойства отсутствия иоследействия экспоненциального расгределення. Представим себе, что Уь 1=1, ..., п, — времена жизни и приборов. поставленных одновременно на испытания. Тогда Усн — вРемЯ до отказа самого «плохого» пРибоРа н, как следует из (1), имеет плотность п е-'", у>0.
Момент Уа1 ввиду свой. ства отсутствия посчедействня экспоненциального распределения можно рассматривать как начальный момент работы для оставшихся 'в живых» и — 1 приборов. Следовательно, У<о †! — время до отказа самого «плохого» из этих и — 1 приборов имеет распределение с плотностью (и — 1) е-ы" '1, у>0, и т. д. Эти рассуждения мсжно сделать строгими, ио приведенное выше доказательство короче.
Теор е»1а 1. Пусть сл. в. Хь Г 1, ..., л, независимы и одинаково распределены с плотностью о-'е 1л™н, х>а. Тогда сл. в. пХ«» (л — 1+1) (Хги — Хи и), 1=2, ..., и, Налал:'Пал1Ы, ИХИ! иМЕЕт ПЛОтНОСтЬ О-'Е-<'-л"Н", Х>пан и (и- Ь !) (Хщ — Х<, и), 1=-2, ..., и, имею~ одинаковую плотность о-'е """, х>0.
47 Доказательство. Из формулы (4) нмеем, что к сл.в. У<и= (Х<о — ><)/о, ( 1, ..., л, применима лемма 1. Используя ее, получаем, что сл.в. л(Х«> — ><)/о, (л — <+1) (Х<о — Х«,>)/о, <=2, ..., и, (7) независимы н одинаково распределены с плотностью е *, х>0. 6. Днсперснн несмещенных оценок )<', о'! внтервальное оце- ннванне р, о, Легко проверить, что л л 1 %"$ 1 — ~ ~(л — < + 1) (Х«> — Х«») = — д Х<о — Х<п = о" . л — 1 л — 1 (8) Применяя теорему 1, находим днсперснн несмещенных оценок: л ~ — '> (л — (+ 1)(Х«> — Х«-»)~ =- ° < 1 1- 1 %< о> — 0((л — <+ 1)(Х<о — Х«<>)) = (л — 1) ° л — 1 (9) 1 ° ! О)<'=0~Х< > — — о ) =ОХ«> + — Оо = л лл (л — 1)л, 2(л — 1) ол/х< >т(о~2(л — 1) ол/х ль (10) Для построения доверительного интервала для р рассмотрим сл.в.
2 (л« вЂ” ») 2л(Х«> — р)/о 2(л — 1)о' 2(л — 1)о'/а (11) Сл. в. (11) представлена как отношение двух независимых сл.в., нмеюшнх хн-квадрат распределения, домноженная на и — 1, она имеет распределение Фншера Гьт<, »(см. п. 7 $7). Пусть х,— 48 Из (7) вытекает, что сл. в. 2(л — !)о'/о имеет распределенне )(т „„(см. п. 2), а независящая от ол сл, в. 2л(Х<,> — »)/о имеет )(тт>-распределение (т. е. распределение с плотностью </,е-"т, х>0). Отсюда вытекает следующая процедура построения доверительных интервалов для р н о. ПУсть хл — Р-квантнль РаспРеделениЯ )(тт«„>, тогда а-доверительный интервал для о имеет вид р-квантпль этого распределения.
Тогда получаем 6-доверительный интервал для 1<: Х<о — к, ыэо~/»<1<«Х«< — хэ<э«~/». (121 П р и м е р 1 (»родолжение). Для зкспоненцнальной выборки с и=1, о=2 имеем ко< — — 1,244; ~ (х<о — х«>) = 44,93; < т 1 о'=- — дам(х<о — к«>)=2,364; р'=х<п — — о =1,125. 19 20 < э С помощью таблиц квантнлей уз находим по формуле (1О) доверительный интервал для о с а 0,05: 2 44,98/56,895(о(2 44,93/22,878, нлн 1,579(о(3,927. Кваитнли ха распределения Еэл«для р,-0,025 н р<-0,975 рассчитаны в примере $7, п. 7: к„, 0,025; х„, =4,071. Отсюда н из (12) получаем доверительный интервал для 1< с 6= = 0,05: 1,244 — 4,071 2,364 0,05(1<~1,244 — 0,025 2,364 0,05, или 0,7628< 1«1,2410.
б. Оцеиивание по первым г порядковым статистикам. До сих пор рассматривалнсь статистические процедуры. осно. ванные на результатах х<, 1=1, . „, », независимых одинаково распределенных наблюдений. Фактически все статистические выводы завнселн от наблюдений через порядковые статистики кьь <= 1, ..., ». В некоторых приложениях возникает задача оценпвання по некоторому подмножеству порядковых статистик. Например, прн испытании изделий иа надежность может быть применен следующий план испытаний: выбирается определенное г(», и испытания продолжаются до момента появления г-го по порядку отказа.
Результатами наблюдений в таком случае оказываются значения первых г порядковых статистик х<о, <'= 1, ..., г. Проведенные выше построения для полной выборки легко переносятся н иа эту ситуацию. Итак, пусть Хпь <= 1, ..., г, г », — первые г порядковых ста. тистик для случайной выборки Хь <= 1, ..., », нз экспоненциального распределения с параметрамн !< н о. Из теоремы 1 вытекает, что сл. в. Я<=(« — <+1) (Х<о — Х<,: и), <=2, ..., г, (13) 49 независимы и имеют плотность — е-*~.
Оценкой о, теоретнчес! а кого среднего, служит выборочное среднее наблюдений Е,: г Р Х = — ~Я! = — ( ~(Хп> — Хсц) .г (л — г)(Хю — Хгц) ) = г — ! г — ! Г ! =- — (д Хп! — (и — г) Хо! — г!Хп!), г — ! ! ! (14) ! Хо, — — г. л (15) Эта опенка также несмещенная, нее л!юперсия равна о'г!((г-1) Х хпа). (ср. с (9)). довсрнтельпыс интервалы для р и и строятся па основании теоремы 1 и имеют тот же впд (!О) прп и г и (12) со следующими изменениями: вместо о', определяемой формулой (5), берется У, определяемое в (!4); квантнли х, и х'„ а (10) н (!2) берутся соответственно для распределений )!'.-'„ ц н Ртл„-ц .
!1 р имер 1 (ародолхгеппе!. Проведем по формулам (14), (!о) вычисление оценок. построенных по хоь 1=1, ..., г, для трех случаев г=5. г=10. г= !5 и обьедппцм результаты в таблицу вместе со случаем погцюй выборки (г=20); 2,22в 2,3ба 2,9!4 з,!в! 1еоретцческие зпачеипь: р=- 1, о=-2. 50 Прп г=л формула (14) совпадает с (5). Отметим, что переход от наблюдений Хпь 1 1, ..., г, к Ею (и-!+1)(Х<о-Хо-ц), ! =2, ..., г, приводит к некоторой потере информации, так как, чтобы восстановить последовательность Хпь 1 1, ..., г, из Еь 1=2, ..., г, необходимо еще знание Х,ц. На самом деле, как мы увидим в гл. П!, вся нужная для оценки а информация содержит- в г-(г„...,'г,). Оценка Л, очевидно, несмещенная, ее дисперсия равна от!'(г-1).
В качестве оценки и естественно взять (ср. с. (6)) й т . сведения о влжнеиших непрерывных РАСПРЕДЕЛЕНИЯХ В йи 1. Гамма-распределение. Стандартная плотность задается формулой Г (р) г х~ 'е —" х > О, О, «~О, где (2) х/ (х) дх = р, (5) (х — р)' ~ (х) дх хя1 (х) дх — р' = р. центральный момент )х'! (х) дх порядка т> — р О(1., р) получается домножением выражения (3) и дисперсия равны соответственно р9 и рПР. Лемма 1. Пусть Х; — иезавпсимые сл.в. с о(1; р), (=1, 2, ..., и. Тогда Хг+...+Х„гтмеет ао,", р,~,,'р„'~ "" распределения на Х '; среднее распределеиием распределеиие ' Н мьтсриолт итого параграфа можно обращаться по морс необхопнмосги. Г(р) х~ 'е — хдх (1) — галгма.функция Эйлера, р — параметр, называемый параметром форлгы. Обычно рассматривают гамма-распределение, содержащее еше н масштабный параметр Х.
Примем обозначение 6(1., р) для распределения с плотностью АГ (Хх) = — хг' — 'е-", х > О. хи Г (р) Центральные моменты распределения б(1, р) равны х'г (.т) дх = — ~ х'х~'е-'дх = —, т > — р. (3) 1 г Г(л+ г) -Г(р) 3 Г (р) о о !(з формулы (1) интегрированием по частям легко получить Г(р+1) =рГ(р). (4) Отметим также известную нз анализа формулу Г(1/2) =)гл.
Принимая во внимание (4), из (3) находим среднее и дисперсию С(1, р): Доказательство. Без ограничения общности положим й 1. Достаточно рассмотреть случай л=2. По формуле свертки ([2[, т. 2) плотность сл. в. Х~+Хз равна при х>0 + Р /х,+х, (х) = ~ /х, (1) /х, (х — () т(1- 1 В' в-4(х — 1)ьт е-( а Й. Г (р,) Г (рД о Сделав замену переменных з=х(, приведем выражение для ~х,.~х, (х) к виду 1 св-*хи+я~', с = [ Фь-' (! — а)" ' бз. (6] Г~р,)гйь) „~ ь Так как интеграл от плотности равен 1, то постоянный множитель с равен !/Г(р~+рз) (см.
(1)), что и доказывает лемму при л 2. Отметим попутно доказанную формулу 1 я,, ~(! з)м-~~ йн) (ь) >0 Г(ь+)ь) о Из леммы 1 вытекает, что распределение 6(Х, р) при больших р приближается нормальным с темп же средним и дисперсией. Действительно, если р л — натуральное число, то соответствующая сл.в. распределена как сумма л независимых сл.в, с распределением 6(Х, 1) и применима центральная предельная теорема для одинаково распределенных слагаемых. Если р не натуральное, то к сумме добавляется еще одно слагаемое с распределением 6(), р — [р[), где [р[ — целая часть р, которое асимптотнчески пренебрежимо.
2. Экспоненциальное распределение. Экспоиенциальное распределение с плотностью Хв-", х>0, является частным случаем гамма-распределения с параметром формы. равным 1, н обозначается 6()., !). Из леммы 1 вытекает, что сумма л независимых 6()., 1)-распределенных сл.в. имеет распределение 6()., л). Этот результат был получен ранее другим способом (ья 5. лемма 2).
Среднее и дисперсия зкспоиенцкальпого рапп),еделсппя 6(й, 1) !ъаапы ).' и и-' соответственно. 52 3. Нормальное распределение. Нормальное распределение в стандартной форме имеет плотность ф(х) =се-"ч*, — оо<х<+оо, где константа с 1/У2и находится из условия нормировки: 1 = ~ ф(х)бх р'2с е-"~'~à — д— ет 2 о 1 =')/2 с~и 'е-"~Ь=!/2сГ ! — ! = р'2с)/а. 1 2) о (8) = " (',-м ( = — "Г~й+ — '), Принимая во внимание формулы Г(р+1) рГ(р) и Г(Чг) =уп, получаем рекуррентное соотношение Г(й+ Чт) = Г((й — '6) +1) (й — Ч ) Г(й — Ч ) = =(й '!т)Г((я — 1)+Ч).