Б.В. Гнеденко - Курс теории вероятностей (1119912), страница 57
Текст из файла (страница 57)
Классический метод оценки параметров Из теоремы 3, очевидно, следует такой результат: Теорема 4. В условиях теоремы 3 имеют место следующие соотношения: /11 М(а~хм хз,..., х„; а) = з + о ~ — ) 'ч и) щ~ -ч1*,., ~;.1= — 11~.( — )1. 2п ~ 'ч, з/й) Эта теорема позволяет нам заключить, что при больших п имеет место приближенное равенство 1 (х, а)2 к=~ средняя квадратическая ошибка которого приближенно равна вз/(2п).
Теорема 3 может быть использована также для определения вероятности того, что о будет находиться в заданных границах. Так, пренебрегая величинами порядка 1/зЯ, мы можем утверждать, что при заданных хм хм, хь и о с вероятностью — / ехр (-1 ) а1 ,ж/ ь с" находится в границах в 1 — — <а<з 1+— В отношении третьей поставленной нами задачи мы ограничимся только формулировкой результатов, так как их получение ничем не отличается от доказательства теоремы 3. Введем обозначения о — х а — з~ а| — — ь/й, Д = — ~/й, з~ ' з~ где з~ — — з~ Тг — . Теорема б. Если априорная плотность распределения ьтз(а,а) имеет ограниченные первые производные по а и а и 1оз(х, з|) ф О, то равномерно относительно а~ и Д Фз(ам Д(хн хз,..., х„) = ,(-ф-п)(~+о( — ')в+~.,~;-и). где фз означает апостериорную плотность распределения пары (а и Д ).
342 Глава 11. Элементы статистики Из теоремы 5 вытекает такой результат. Теорема б. Вусловшп теоремы 5 /1~ М(а[хи хз,..., х„) = х + О 82 1 п 1+0 1+0 М[(а — х) [хм хм...,х„~ М[о [хи хм..., х.[ =в, равна 1 Г х21 гр(х[а, о) = — ехр ~ — — ~. ~/22х ~ 2 ) ,„г 2. М(х!а, е) = о и 0(х[а, о) = —.
и 3. Плотность распределения величины р = ч'2п о асимптотически равна 1 Г х21 35!(х[а, о) = — ехр ~- — ). ~/2я х( 2 ) Как и теоремы 1 и 3, теорема 5 может быть использована для определения вероятностей того, что а и о будут находиться в заданных границах при условии, что наблюденные значения оказались равными хихон. ",х .
Практическое значение теорем 1, 3, 5 неодинаково. По теореме 1 точность приближенных формул (5) и (5') увеличивается не только с увеличением п, но и с уменьшением о. Поэтому для определения о при известном о имеется основание пользоваться формулами (5) и (5') даже при малых п, если только мало о. В случае же теорем 3 и 5 остаточные члены полученных формул убывают только с возрастанием п, и поэтому при малых значениях п они не дают ничего. Только что доказанные теоремы являются в некотором смысле обращениями следуюших элементарных предложений. Если случайная величина ( нормально распределена, параметры а и о известны, хп хз,..., х„ являются результатами независимых наблюдений (, то !.
Плотность распределения величины ,/й а = — (х — а) о б б!. Классический метод оценки параметров 343 4. М(з!а,о) = а !+Π—; О(в(а,о) = — !+О 5. Величины а и !5 независимы, и плотность распределения величины (а, )5) асимптотически равна 1 Г хз+У2) трз(х,у!а, о) = — ехр ~- 2я ( 2 от оз б. М(х!а,е) =а; О(х!а,а) = —; М(з!а,о) во; О(з!а,о) в —, Предложения 1 и 2 не требуют доказательства.
Докажем 3. В а 21 мы нашли, что плотность распределения величи- ны з равна Легко проверить, что плотность распределения !т есть т)~з(х~а, о) = — !т — + о ~/2п ~, ~/2п Несложные преобразования приводят нас к асимптотическому равенству 1 Г хз1 фз(х(а, о) = — ехр ~ — — ). ~/2я ( 2 ) Для доказательства 4 заметим, что элементарные подсчеты приводят нас к равенствам П" Мв= 1,!— о ехр 4 — — )о Чп и ~! 4п) Отсюда Мзаз 1 — — „ Ов = — 1 —— Независимость х и з будет нами доказана позднее.
После того, как зто будет сделано, остальные утверждения, содержашиеся в 5 и б, становятся очевидными. Глава 11. Элементы статистики 9 62. Исчерпывающие статистики' Английским статистиком Фишером было введено весьма важное понятие, которое мы поясним сначала на частном примере. Предположим, что нами решается задача определения параметра а при известном е по и наблюдениям над нормально распределенной случайной величиной. Если априорная плотность распределения параметра а существует и равна уз~(а), то полученная нами в предыдущем параграфе формула (2) показывает, что условная плотность распределения <р~ (а~хи хм..., х„; е) полностью определяется знанием 1о~(а), е и средним арифметическим результатов наблюдений хн хм..., х„. Таким образом, каково бы ни было априорное распределение вероятностей параметра а, все то новое (в случае известной дисперсии), что вносят в оценку а наблюдения, заключено в одной единственной величине х.
Говорят поэтому, что хд является исчерпывающей статистикой для параметра а. Точно так же при известных а и уз»(а.) все то новое, что вносят результаты наблюдений в определение параметра е, заключено в одной я величине з = — 2 (х» — х)» [см. (3) 5611 В задаче определения е п»=~ при известном а, таким образом, исчерпывающей статистикой будет величина з. Общее определение исчерпывающей статистики мы дадим, следуя А.
Н. Колмогорову. Пусть наблюдаемая случайная величина имеет функцию распределения, зависящую от 1с параметров Ун Рм..., е», значения которых нам неизвестны. Любую функцию т(хи хз,..., х„) ог результатов наблюдений и ог параметров, значения которых известны, называют статистикой. Определение исчерпывающей статистики получает сл»дующее естественное обобщение: система функций Ъ(хн х2, ° ° хи) (» = 1, 2... ° з) называется исчерлыеаюи»ей сиспземой статистик дея системы лоромемроо рн рз,..., р», если условное й-мерное распределение для этих параметров при известных хн хм..., х„полностью определяется априорным распределением параметров рн д»,..., И» и значениями статистик 21н Хг, ", Хв. Из формулы (4) $61 мы заключаем, что двя параметров а и о исчерпывающей системой статистик являются функции у~ — — х и у» = вн Понятно, что для каждого параметра а и е в отдельности система статистик 21~ и тз также ЯвлЯетсЯ исчеРпывающей.
Без большого труда читатель может самостоятельно убедиться в том, что если случайная величина с подчинена закону Пуассона Р(С =к) =, (к=0,1,2,...) Сейчас принято название »остаточные статистики». б 63. Доверительные границы и доверительные вероятности 345 с неизвестным параметром а, то исчерпывающей статистикой для а будет х — среднее арифметическое результатов наблюдений. Точно так же, если двумерная случайная величина (С, г)) распределена нормально, но параметры о, Ь, о!, оз и т неизвестны, то исчерпывающей системой статистик лля указанной системы параметров будут следующие пять функций: и х» = х, 1 Х (хи хь ", хи) =— й=! 1 Хг(У! Ут ' Уи) й=! Хз(х! хг " хя) = Хй(У! Уз Уи)— я — ~~> (хй — х)т = в! " й=! в (уй у) = вг й=! я Хз(х! ° . ~ хи У! Уь) ~ (хй х)(Уй У) и й=! Здесь (х!, у!), (хм уз),..., (х„, у„) — результаты наблюдений.
В качестве упражнения рекомендуем читателю самостоятельно определить исчерпывающие системы статистик лля параметра 1) а; 2) Ь; 3) !т!, 4) оз1 5) т. В 63. Доверительные границы и доверительные вероятности Во вводном параграфе к настоящей главе мы указали, что задача определения неизвестных параметров иногда ставится следующим образом: требуется определить такие две функции д'(х!, хз,..., х„) и дн(х!, хь... ..., х„) от результатов наблюдений, чтобы была практическая уверенность в том, что неизвестный параметр д находится в пределах между д' и д". Функции д' и Ьм называют доверительными границами для параметра д.
Для того чтобы доверительные границы лля Р были удовлетворительны, нужно, очевидно, потребовать, чтобы условная вероятность Р(й' < 9 < !Г )х!, хм..., х„) параметру е находиться в промежутке от д' и д'! при заданных х!, хм... ..., х„была достаточно близка к единице. Степень близости при зтом определяется той практической задачей, с которой связано определение неизвестного параметра д. Если известна априорная плотность распределения для параметра д, то для определения доверительных границ 346 Глава 11.
Элементы статистики д'(хн хм..., х„) и д"(хм хм..., х„) естественно выбрать те д' и д", ири которых для заданного ы, близкого к единице, выполняется равенство х ) ~(хн хм..., х„!В)ср(д) М ы = Р(д' < д < д")хм хм..., х„)— ),Г(хн хм..., х„!В)1о(д) дд и при этом разность д" — д' будет минимальна. Задача определения доверительных границ в такой постановке сложна не только потому, что она приводит к сложным аналитическим опера- циям, но в первую очередь потому, что априорная плотность Р(д) лля параметра д нам обычно бывает неизвестна.
Мы видели, что задача по- лучает осмысленное и простое решение, не зависяшее от априорного распределения параметров, если число наблюдений гг настолько велико, что имеется возможность пользоваться предельными теоремами. Можно, правда, идти по другому пути, а именно искать правила тако- го рола: каковы бы ни были результаты наблюдений хн хн..., х„, требу- ется указать такие доверительные границы В'(хн хн..., х„) и д" (х~, хм...
..., х„), чтобы с заданной уверенностью (вероятностью) можно было счи- тать, что В'(хнам...,х„) < В < д"(хм хм...,х„). Так как заранее неизвестно, каковы будут результаты наблюдений, то при решении вопроса о том, следует рекомендовать это правило или нет, нужно обрашаться не к рассмотрению условных вероятностей Р(д <д<д !!хнхм...,х„), а к рассмотрению безусловной вероятности Р(д' < д < д") (!) того, что при применении правила не произойдет ошибки.
При заданном виде функций д'(хнхм...,х„) и ди(хнхы...,х„) вероятность (!) зависит, конечно, от функции распределения величин хн хы..., х„. Если зто последнее распределение зависит от й параметров д~,дз,...,В» и безусловная плотность распределения этих параметров дается функцией х(дн..., В»), то Р(д'<В<д") = = ~... ~ Р(В' < В < д" ~В„В,,..., В,) у (В„В,,..., В,) дд, ВВ,... ВВ».
Особенно важным на практике является тот случай, когда условная веро- ятность Р(д' < д < В"~дндм...,В») (2) ири любых значениях дн дм..., В» остается неизменной, равной некото- рому числу ы. В этом случае также Р(В'<д<д") =ы, б 63. Доверительные границы и доверительные вероятности 347 т.е. безусловная вероятность (1) не зависит от априорного безусловного распределения параметров в(, вм..., вь.