Ю.П. Пытьев, И.А. Шишмарёв - Курс теории вероятностей и математической статистики для физиков (1134036), страница 31
Текст из файла (страница 31)
Дело в том, что в атом случае Пеа=0 (если а случайный 'вектор, то П,а=0 с вероятностью единица). Аналогично утверждения следствия 2 справедливы не только длв векторов ЙЯ и П4, но также и для любых векторов П.(3+а) и П~($+Ь), если векторы а и Ь ортогональны Р, и Р~ соответственно. Следствие 3. Пусть П~ — оператор ортогонального проектирования на одномерное подпространство Яе, натянутое на единичный вектор е, т.
е. П4= ($, е)е. Если случайный вектор $ удовлетворяет условиям теоремы 1, то случайная величина ч=( — „~~~(ь — р)) —,", э/е ! 1 и, следовательно, вероятность е Р()21(~ е) = =) е — "'/'//х =Ф(е) — Ф( — е), 1 Уял где Ф(я) — функция нормального распределения Ф (з) — е — х'/2 //х Э! 222,) Задав и, 0(р(1, н воспользовавшись таблицей нормального распределения, определим а>0, для которого Р ( — е(~ — ~$/ — р ) — ~ е) =Ф(е) — Ф( — а)=1 — сс.
(2) ! 2/а э о / ! При этом случайная величина 2! (1) может оказаться вне интервала ( — е, е) лишь с вероятностью а. Соотношение (2) можно записать иначе: л. л Р ~ „,~/й/ ~э~р< „Хй/+, „— ) =' / ! /=! Согласно (3) истинное значение математического ожидан !2 покрывается случайным интервалом л й ~1 ~~ е// 1 ~~1 + ео) /=! / с вероятностью 1 — а.
Вне этого интервала /2 может оказаться с вероятйостью и. Найденный случайный интервал (4) называется интервальной оценкой параметра !2, или 100 (1 — 22)% доверительным интервалом для параметра !!. Понятие интервальной оценки впервые встречается у Лапласа (1814) в связи с задачей определения параметра р биномнального распределения. Однако Лаплас рассматривал (3) ия (4) 188 ность й2, ..., $~ называется случайной выборкой из нормального распределения Л/(!2, а2) объема л. л 1 %'т Так как случайная величина — ~$/ .нормальна Л/(р, э ! а2/и), то нормальна й/(0,1) случайная величина Р в указанных задачах как случайную величину. Правильную интерпретацию процедуры интервального оценивания, в которой речь идет о случайном доверительном интервале„ предложил Е.
Б. Уилсон более чем через 100лет,в 1927году. 2'. Интервальная оцеина дисперсии при известном математическом ожидании Пусть в аналогичной ситуации известно математическое ожидание 1а, но неизвестна дисперсИя оа. Тогда случайные величины й! — 1а, 1'=1, ..., и, нормальны М(0, оз) и независимы в совокупности.
Следовательно, статистика * а Е (й! — р)' у=! имееет распределение окуне с а степенями свободы. Для заданных е!>О и ез>е! по таблице 2'-распределения можно подсчитать вероятность Р(е!<тз„<ев)=1 — а. Однако при заданном а, 0<а<1, величины е! и ез вычисляются неоднозначно. Поэтому обычно полагают Р(т,з м е!) = Р(таз =.веа) = а/2 так, чтобы Р(е!(плв(еа)=1 — Р(уае) еа) — Р(т в — е!)=! — а. Подсчитав таким образом е! и еа, получим а Р ~ет< — у ($1 — р)а< ев ) =1 — а.
1 Щ оа / ! Соотношение (5) можно переписать в виде л и Р ~ — '~'(ай1 — р)а< о'< — ар (в! — )а)в~ = 1 — а, 1 еа е, 1=! ! ! или, если воспользоваться обозначениями предыдущего па- раграфа Р ! — Ц вЂ” и! (' < о' < — 11 $ — т ~~ ~ = 1 — а. (6) 1 еа е! Соотношение (6) показывает, что истинное значение дисперсии оз покрывается случайным интервалом — ) й — л! (~, — '1 $ — лт 1з) (7). ее (' е, ' В дальнейшем случайную величину, которая является функцией выборки 5ь ..., 1, условимся называть статистикой.
189 с вероятностью 1 — а. Соответственно с вероятностью а дисперсия о' может оказаться вне этого интервала. Найденный случайный интервал (7) называется интервальной оценкой дисперсии о', илн 100(1 — а) е!е доверительным' интервалом для ае. 3'. Интервальная оценка математического ожидания при неизвестной дисперсии Как показано в следствии 3 теоремы 14.1; статистика т,, (14.15) имеет распределение Стьюдента с и — 1 степенями свободы.
По таблице распределения Стьюдента по заданному а, 0<а<1, можно определить е так, чтобы Р()т„!) <е)= 1' — а. Иначе это можно переписать в виде 1=! (8) Соотношение (8) показывает, что истинное значение р с ве- роятностью 1 — а покрывается случайным интервалом л л ( — „т,$ — — ~,$ + 1 чч е1(1-П!)$1 1 С1 е1(/ — П!)$1) — ~,Ь— т/л(л-1) ' л ЛЕ Г'л(л-1) , — д,В!+ 1=1 1=! называется интервальной оценкой математического ожидания при неизвестной дисперсии. 4'. Интервальная оценка дисперсии при неизвестном математическом ожидании Как отмечалось в следствии 3 теоремы 14.1 !1 (Х вЂ” П!) (~ — т) !Р !((7 — П!)$!Р=о!)(е, !.
(9) Используя статистику (9) так же, как в пункте 2' была. использована статистика Ц вЂ” тР=о!)(,', по заданному а, 0<а<1, определим е! и ее из требований Р (т„' ! < е!) = Р ()(е ! )~ ее) = а/2 Тогда Р (е! < — '1(1 — ПД)ч< е, ~ = 1 — а, 1 ле или, что то же самое Р ~ —,П(1 — П!) $((е < Ое< — !!(1 — П!) $!!!е~ = 1 — а. (10) Случайный интервал ~ — ')(7 — П)Ц, — ')(7 — П,)Ц ) е! е, 190 является интервальной оценкой для дисперсии юа прн неизвестном математическом ожидании р.
В дальнейшем пространство )г, с некоторым фиксированным базисом будем называть выборочным пространством. При этом векторы из й~ задаются наборами своих координат Яь ...,$ ), образующих выборки. а 16. ОБшАя зАНАчА интеРВАльнОГО ОнениВАния Предположим, что $Ь ...,4, — случайная выборка из рас- пределения Р(х, 0), хеег(ь Параметр 8 функции распределе- ния Р(х, 8) считается неизвестным. Для простоты будем счи- тать, что 8 меняется на действительной прямой.
Пусть функ- ции 8=0(х„...,х,) и О=О(хь...,х) таковы, что Р(8(В„-.,В.) <8<в(В„-'В.) (8)=у. где Р(А рО) — вероятность события Яь ..., Б,) ~Ас:1г„причем случайные величины $ь ..., к, контролируются совместной функцией распределения Р(хь 8) ...Р(х„О). В данном слу- чае событие АыЯ„состоит из тех (фь ...,$,), для которых '0(4ь -,$ )<0<8($ь...,а ). Пара случайных величин О, О называется интервальной оценкой параметра О, или !ООТ%-ным доверительным интервалом для О. Случайные ве- личины 8 и 0 называются доверительными границами, ниж- ней и верхней соответственно.
Как и в случае нормального распределения, 0 и 0 определяют случайный интервал (О, 8), покрывающий истинное значение параметра 0 с веро- ятностью р. Рассмотрим один из методов построения интервальных оценок. Лемма 1. Пусть функция д(хь ...,х~, 8) определена для — со<х;<со, 1=1,,п, и для любых фиксированных х„...,х„ непрерывна и монотонна по О. Пусть, кроме того, НЯЬ...,$„, 8) является случайной величиной, функция распределения которой не зависит от О, если йь..„$, контролируются функ- цией распределения Р(хо О) .... Р(х„О).
Если (дь йз) интервал, для которого Р(а <й(ВЬ...Д., 8) <а,!8)=р, то Р(8<8<8 ~8)= р, (1) где 0<0 — решения относительно 0 уравнений д($Ь...,В„, 8) = 01 к2. Д о к а эа т е л ь с т в о. Для определенности будем счи- тать, что д(., 8) монотонно не убывает по О. Поскольку распределение ~=0(сь...,$, 8) от 0 не зависит, то для вся- кого р, 0<у<1, и Ом — со<ОО<со, можно указать д~ н дь 191 Я~<йг, так чтобы Р(а~ < "ь<кг (Ос) = у, (2) причем и, и дг можно указать (вообще говоря не единственным способом), если задано лишь у, а истинное значение Ос параметра 0 неизвестно.
Неравенства а <к(э - э,, 8)<к (3) для каждой выборки $ь...,$, из распределения Р(х, Ос) эквивалентны неравенствам Оаь ..:Д.) <8,<8(Вь..., В.), (4) где 8(йь...Д„) и ОЯь...,й„) — решения относительно 0 .уравнений д(фь-'К„О) =д1 и д($ь- В, 8) =пг соответственно. Поэтому события (3) и (4) совпадают.
Следова-тельно, Р(Ойь —,й.) <Ос<Вин ..., й„) ~8,)=у, Однако всегда ли можно найти функцию д(~~ -,4~, 8) с указанными в лемме свойствами? Если функция распределения Р(х, 8) непрерывна по х, — оо<х<оо, для каждого О, — со<8<со, непрерывна и монотонна по О,,— со<0<со, для каждого х, — оо<х<оо, то ответ на поставленный вопрос утвердительный. Для доказательства заметим вначале, . что для всякой случайной величины $ с непрерывной функцией распределения Р(х) случайная величина г1=РЯ) равномерно распределена на [0,11. Чтобы не прерывать изложение, этот факт докажем й последнюю очередь. Рассмотрим функцию ааь...,~., О) =Ра„О) ...Ра., О).
Согласно замечанию ее распределение не зависит от 8, если Р(х, О) — функция распределения ~, (=1,..., и, и случайные величины $ь...,я„независимы в совокупности. Кроме того, по условию д($ь ..., $„0) монотонна и непрерывна по О. Следовательно, д(.) удовлетворяет условиям леммы.
Докажем теперь, что случайная величина г)=Р($), где Р( ) — непрерывная функция распределения й, равномерно распределена на 18, 11. Действительно, Р(х) =РЯ<х)=РЯ~х), (Б) поскольку функция распределения Р(х) непрерывна, и, следовательно, РЦ=х) 8. Событие $~х, очевидно, влечет событие Р($) сР(х), поэтому в согласии с (5) Р(х) =РЯ<х)(Р(Р($) ~Р(х)). С другой стороны, (РЯ) <Р(х))=(й(х)()(РЯ) =Р(х)), 192 Р(Р(~) ~Р(х)) -РЯ~х)+Р(Г($) =Р(х))=РЯ<х), (7) так как функция распределения Р(х) непрерывна и, следова'- тельно, Р(ГЯ =сопз1)=0.
Из (6) и (7) получаем Р(Р(й) <Р(х))=Р(Р(й) ~Р(х))=РЯ<х)=Р(х), что иначе можно записать следующим образом: О, г<О, Р(т)< г) =, О< <1, 1, г ) 1, т! = РЯ). Равенства (5) означают, 'что т!ь Р($) равномерно распреде- лена на [О, 1!. В заключение заметим, что если д(~п...,$,, О) обладает всеми свойствами, перечисленными в лемме, кроме монотон- ности по О, то неравенства (3), будучи разрешенными отно- сительно О, эквивалентны включению ОоевА (4ь -, $ ) где случайное множество А(фп...,$л) определяется выборкой и в данном случае может и не быть интервалом, 'Вполне аналогично рассмотренному случаю равенство (2) эквивалентно Р(ОоевА(ВП-. ял) !Оо)=у.