Б.В. Гнеденко - Курс теории вероятностей (1115334), страница 60
Текст из файла (страница 60)
11. Элементы статистики По формуле Стирлинга л-з /и — 1ь л — 3(п — 31 г л-з Г ~ ) = гя — ~ — ) е [1+о11)], ) г ~ г следовательно, л л — — л-з л 3 /л — 3 тг — — — е! Ул /зя з ' и г в г а[1+о[1)]л 7 '1л л 3 л л;/я 1 — — ) г е г г [1+о(!)] = з]не г [1+о(1)]. л (12) Равенства (10), (11) и (12) доказывают теорему. Из теоремы 3, очевидно, следует такой результат: Теор ем а 4. В условиях теоремы 3 имеют место следующие соотношения: М1о [х, „ха „..., хе; а) = Х + о (1 1л) — г М[(о — 3) ~х,,хг,..., хл;а] = — [1+оО~с/и )].
гл Эта теорема позволяет нам заключить, что при больших л имеет место приближенное равенство л о- — 2; (ха — а)', 2 — )е 'с11 е о находится в границах Х 1 — — <о(Х 1+— 4п чул В отношении третьей поставленной нами задачи мы ограничимся только формулировкой результатов, так как их получение ничем не отличается средняя квадратическая ошибка которого приближенно равна Тг((гл) . Теорема 3 может быть использована также для определения вероятности того, что о будет находиться в заданных границах.
Так, пренебрегая величинами порядка 1/,/л, мы можем утверждать, что при заданных х,,хг,...,хл и а свероятностью ЗЬ5 а Ь1. Классяческмя метод оценки параметров от доказательства теоремы 3. Введем обозначения я — х о — з~ аг = — ч/л, бг = —;/и, Т, з, где з,= з,ч/— п — 1 Т е о р е м а 5. Если априорнцч плотность распределения рэ(о, о) имеет ограниченные первые производные по а и о и рз(х, з~) чьО, то равномерно относительно а1 и 1) г фэ(аг ])г ]х!,хз ° ° хн) е з [ 1+ 0~ [1+ ]аз 1+ ]рг]]), я~/2 ъ/п где фз означает апостериорную плотность распределения поры (аю В,). Из теоремы 5 вытекает такой результат.
Т е о р е м а 6. В условиях теоремы 5 /1' М(о]хм хз... х„) = х + О~ — ( МНа — х)э]х,, х,... х„] = — 1[1+ О 1) ) чтй '1'т М[о]хм хз,..., х„] = з1 1 + 0[ — ) М[(о — Х) ]х,, хз,..., х„) = — ~ 1 + О 2п ~, тп Как н теоремы 1 н 3, теорема 5 может быть использована для определения вероятностей того, что а и о будут находиться в ззданных границах при условии, что наблюденные значения оказались равными х,, хз,..., х„. Практическое значение теорем 1, 3, 5 неодинаково. По теореме 1 точность приближенных формул (5) и (5') увеличивается не только с увели.
чением п, но н с уменьшением о. Поэтому для определения о при известном о имеется основание пользоваться формулами (5) н [5) даже при малых и, если только мало о. В случае же теорем 3 и 5 остаточные члены полученных формул убывают только с возрастанием п, и поэтому при малых значениях п они нс дают ничего, Только что доказанные теоремы являются в некотором смысле обращениями следуюших элементарных предложений. Если случайная величина $ Гл. 11. Элементы статистики 366 нормально распределена, параметры а и о известны, х,, хт,..., х„являются результатамии независимых наблюдений $, то 1. Плотность распределения величины ~/и о= — (х — а) о равна -х 2 ~Х(х~а о) и е-х /2 ч/2я 2. М(х ! а, о) = а и 0(х ! а, о) = от/и. 3. Плотность распределении величины Х вЂ” о В = — т/2п о асимптотически равна 1 ~Х2(х ~а, о) = — е " / .
ч/2и о2 4. М(Х~а, о) = о(1 + 0(1/и)); 0(Х1а, о) = — ( 1 + 0(1/и)) . 2п 5. Величины а и б независимы, и плотность распределения величины (а, б) асимптотически равна хесус 1 фз (х, у! а, о) = — е 2и о2 6, М(х !а, о) = а; 0(х !а, о) =— и о' М(т ~а, о) =о; 0(Х!а, о)— 2п Предложения 1 и 2 не требуют доказательства.
Локажем 3. В з 20 мы нашли, что плотность распределения величины Х равна ,/2п / у х/й '1 " оГ(п/2) т о /2! 367 й 62. Исчерпывающие статистики Легко проверить, что плотность распределения о есть о; ох пт(х~а, о) = — ~а~ — + о чгп ч/и Несложные преобразования приводят нас к равенству -хе 2 п,(х~а, о)= — е " 1 ч/2п Для доказательства 4 заметим, что злементарные подсчеты приводят нас к равенствам "Г) à — +1 о2 о2 Г2 МТ,Г п Г(п1'2) Г(п!2) Отсюда Му=о 1— Независимость х и Г будет нами показана позднее. После того, как зто будет сделано, остальные утверждения.
содержащие я в 5 н б,. стан гятсч очевидными. й б2. Исчерпывающие статистики Английским статистиком Фишером было введено весьма важное понятие, которое мы поясним сначала на частном примере. Предположим, что нами решается задача определения параметра а при известном о по и наблюдениям над нормально распределенной случайной величиной. Если априорная плотность распределения параметра а существует и равна ~е,(а), то полученная нами в предыдущем параграфе формула (2) показывает, что условная плотность распределения р,(а!х,, х,,..., х„; о) полностью определяется знанием у1(а), о и средним арифметическим результатов наблюдений х, „х,,..., х„, Таким образом, каково бы ни было априорное распределение вероятностей параметра а, все то новое (в случае известной дисперсии), что вносят в оценку а наблюдения, заключено в одной единственной величине х. Говорят позтому, что х является и с ч е р п ы в а ющей статистикой для параметра а.
Гл. 11. Элементы статистики Точно так же при известных а и рг(о) все то новое, что вносят результаты наблюдений в определение параметра о, заключено в одной величине и г = — 2' (х„— х)' 1см. (3) 5 61]. В задаче определения о при изи ь=г вестном а, таким образом, исчерпывающей статистикой будет величина е.
Общее определение исчерпывающей статистики мы дадим, следуя А.Н. Колмогорову. Пусть наблюдаемая случайная величина имеет функцию распределения, зависящую от й параметров В,, В„..., Вь, значения которых нам неизвестны. Любую функцию х(хг,хг,...,хп) от результатов наблюдений и от параметров, значения которых известны, называют статистикой. Определение исчерпывающей статистики получает следующее естественное обобщение: система функций уг(хг, хг,..., х„) (1 = 1, 2... г) называется исчерпывающей системой статистик длл системы параметров В,, Вг,..., В„, если условное 1г-мерное распределение для этих параметров при известных хг, хг,..., х„полностью определяется априорным распределением параметров В „В г,..., Ва и значениями статистик хг, г г,..., х,.
Из формулы (4) 5 61 мы заключаем, что для параметров а и о исчерпывающей системой статистик ЯвлЯютсЯ фУнкции юг = х и )сг = гг. Понятно, что для каждого параметра а и о в отдельности система статистик Хг и Х, также является исчерпывающей. Беэ большого труда читатель может самостоятельно убедиться в том, что если случайная величина $ подчинена закону Пуассона аье-ч РД=/с) = — (й= 0,1,2,...) к1 с неизвестным параметром а, то исчерпывающей статистикой для а будет х — среднее арифметическое результатов наблюдений.
Точно так же, если двумерная случайная величина (й, г1) распределена нормально, но параметры а, Ь, о,, ог и г неизвестны, то исчерпывающей системой статистик для указанной системы параметров будут следующие пять функций: л Хг(х,, хг,..., х„) — — ч хь = х, и а=г п Хг(ум уз, Уп) = — Е уа =у, и к=г г 63. доверительные гранвиы а Хз(хг хг...,х„) = — Э'.
(х х)г =г л к=г к Хя(Уг, Уг.,Ув) = — Е (уг, — у) = г и к=г 1 Хг(хг,...,х„, Уг,...,У„) = — а (хк — «) (Ук — У) = г- П к=1 Здесь (х,, у,), (хг, уг)... (х„,у„) — резулыаты наблюдений. В качестве упражнения рекомендуем читателю самостоятельно определить исчерпывающие системы статистик для параметра 1) а, 2) Ь, 3) о,, 4) о„5) г. $ 63. Доверительные границы и доверительные вероятности Во вводном параграфе к настоящей главе мы указали, что задача определения неизвестных параметров иногда ставится следующим образом: требуется определить такие две функции 0'(х,, хг,..., х„) и Ва(х,, х,,...
..., х„) от результатов наблюдений, чтобы была практическая уверенность в том, что неизвестный параметр В находится в пределах между В и В . Функции В' н 0 ' называются д о в е р и т е л ь н ы м н г р а н и ц а м и для параметра В. Для того чтобы доверительные границы дляВ были удовлетворительны, нужно, очевидно, потребовать, чтобы условная вероятность Р(0' ( В ( В"!хг, хг,..., х„ » параметру В находиться в промежутке от В и 0 при заданных х,, хг,... ...,х„ была достаточно близка к единице. Степень близости при этом определяется той практической задачей, с которой связано определение неизвестного параметра В.
Если известна априорная плотность распределения для параметра В, то для определения доверительных границ 0 (х,,хг,... ..., х„) и В"(х,, хг. , х„) естественно выбрать те 0' и В", нри которых для заданного сг, близкого к единице, выполняется равенство а" )' )(х,,х, х„~В)ч(0) 10 в' щ= Р(0 < В < 0'Ьг,хг,...,х„) = /' г(хг хг ... ха ~В)гг(0)ггВ и при этом разность 0"-0' будет минимальна. Задача определения доверительных границ в такой постановке сложна не только потому, что она приводит к сложным аналитическим операциям, 370 Гл. 11.
Элементы статистики но в первую очередь потому, что априорная плотность Р (8) лля параметра В нам обычно бывает неизвестна. Мы видели, что задача получает осмысленное и простое решение не зависящее от априорного распределения для параметров, если число наблюдений и настолько велико, что имеется возможность пользоваться предельными теоремами.
Можно, правда, идти по другому пути, а именно искать правила такого рода; каковы бы ни были результаты наблюдений х,, хт,..., х„, требуется указать такие доверительные границь| В (х„х,,..., х„) и В (х,, х,,, ..., х„), чтобы с заданной уверенностью (вероятностью) можно было считать,что 0'(хых,,...,х„)<: В < 0"(х,,хт,.,х„). Так как заранее неизвестно, каковы будут результаты наблюдений, то при решении вопроса о том, следует рекомендовать зто правило или нет, нужно обращаться нек рассмотрению условньех вероятностей Р(В'< В < В"!х,, хт,..., х„), а к рассмотрению безусловной вероятности Р(0'< В < 0 ) того, что при применении правила не произойдет ошибки.
При заданном виде функций В (х,, х,,..., х„) и В" (х„х,,..., х„) вероятность (1) зависит, конечно, от функции распределения величин хм х„..., х„. Если это последнее распределение зависит от х параметров Ве, Вт,..., Вь и безусловная плотность распределения этих параметров дается функцией р(В,,..., Ве), то Р(8'< В< 0 ) = = 1'...
1'Р(8'~. :0< 0" ~0„0,,...,0„) р(0„...,8„)18„...,08„. Особенно важным на практике является тот случай, когда условная вероятность Р(в'< 0 < В"~в,,в,,...,в,) (э) при любых значениях В„ О,„ , 0„ остается неизменной, равной некоторому числу ш.
В этом случае также Р(8' < В < В" ) = ьэ, т.е, безусловная вероятность (1) не зависит от априорного безусловного распределения параметров В,, Вт... В„. Сама гипотеза о существовании априорного распределения параметров не всегда осмысленна. В самом деле, как можно говорить о распределении параметра а в законе Пуассона для любой задачи, в которой характеризующая зту задачу случайная величина распределена по закону Пуассона? Од- зтг а 63. доиерительные гранины пако, если условная вероятность (2) не зависит от значений параметров и равна одному и тому же значению сг, то естественно считать безусловную вероятность (1) существующей н равной ы даже в тех случаях, когда существование априорного распределения параметров не предполагается.