Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 43
Текст из файла (страница 43)
л Х. Оценка параметров по наблюденним частотам по предположению, непрерывна, следовательно, в замкнутой области она имеет максимум. Этот максимум не может достигаться на границе области, так как функция д(х ~ о) >ам равна нулю, Кроме того, из приведенного выше доказательства следуе~, что если ~очка с координатами (х,,..., хт) находится достаточно близко от подпрострапства 6, то решение уравнений правдоподобия единственно. Действительно, если бы р>о> и в>в> были двумя различными решениями уравнений правдоподобия, то выполнялнсь бы равенства р>о> = рп> = ра> =...
и Ф> = ап> = ва> = Но первая последоватслы>ость, по доказанному, должна сходиться к в,".>, что возможно лишь тогда, когда при всех е имеют место равенства рм> = 4'>. С небольшими изменениями это доказательство применимо н к случаю, когда р, являются нелинейными функциями параметров, если только множество точек с координатами х,(О).. р (ъ) является замкнутым, или если оно не замкнуто, но все его несобственные предельные точки расположены на границе области р;ь О, ~~Р р> = 1. Если множество точек с координатами р>(О),, р (о) не замкнуто и некоторыс его несобственные предельные точки расположены внутри области р>~ О, ~р> = 1, то в доказательстве могут возникнуть осложнения. Для приложений особенно важно то, что последовательные приближения хорошо сходятся.
А именно: разности р)е> — аео> стремятся к нулю как степенная функция е+>=п-<"е»>з. Если нулевое приближение ров> выбрано не слишком плохо, то спокойно можно довольствоваться первым приближением р<'>: все дальнейшие приближения будут отличаться от рп> лишь величинами порядка е' = !(п. Так как неизбежные статистические отклонения о от истинного значения Ю* являются величинами порядка е = =Цп, то бессмысленно добиваться дальнейшего повышения точности.
Результаты, установленные для методов А, Б и В, позволяют сделать вывод: Оценки А и Б оп>личаюп>ея оп> оценки наибольшего правдоподобия В лишь величинами порядка 1/я. Все эти соображения сохраняют силу и тогда, когда наблюдается не один, а несколько рядов частот, причем в каждом ряду сумма частот равна единице, например: Ь, + Ь, = 1 или х, + хе = в„ Ьв + Ьв — 1 или хв + хв = яч и т. д.
Выражения Хе, Х'„... останутся неизменнь>ми, с той только разницей, что каждую вероятность р, нужно будет умножить на соответствующий множитель ян например; и > х а 49. Асимитотииесиое расиредееение Х' и Ъ 2 49. Асимптотическое распределение 4и и д при те— 239 р(в) = ~ р(х), лев Где р(х) = — "-' — р*,'...р . и ~ ° ° ° ион (2) При этом р, = ре(б) представляют собой истинные вероятности р,*,..., р*. В дальнейшем эти вероятности мы будем обозначать без звездочек, Для больших и выра жение (2) можно преобразовать с помощью формулы Стирлинга и получить — (*,э ) — (еи- -) иэ— р(Х) х ° ° ° хт и (2 ) Ф ° ° ° р (5) 1 1 ; р(х) -("-р — *) * '...("р ) где у = ((2яп) -тр,... р„,) .
(4) Логарифм у р(Х) равен 2) и (5) Для простоты мы ограничимся случаем одного параметра д и постараемся исследовать поведение функции распределения оценки К Оценка о, найденная методом паименыцих квадратов,представляла собой линейную функцию результатов наблюдений хе Так как предполагалось, что все х, распределены нормально, то и оценка Ю имела нормальное распределение. В данном случае, однако, хе являю1ся дискретными случайными величинами, распределенными лишь приближенно нормально, а сцепка й представляет собой лишь приближенно линейную функцию результаэов наблюдений хр Поэтому мы можем ожидать, что распределение й будет лишь асимптотически нормальным при и- Вероятность того, что наблюденная точка Х с координатами будет принадлежать области В пространства иксов, равна сумме всех вероятностей, соответствующих отдельным точкам области В: 240 Гл.
л Х. Оценка параметрое по наблюденным чостота.ч причем остаток, обозначенный отточием, представляет собой величину порядка 1/я, Положим снова яе = яре + ап (б) то~да а, с вероятностью, сколь угодно близкой к единице, будут ЯвлЯтьсЯ величинами поРЯдка )спРп ПозтомУ 1и (ос Р(Х)1 = — ~ (яр + г + — ) 1и — — +... = 11 пр+е яр = — ~( р+ а+-2')(„— ' —,;, + —,',— )+, 1 Ы 1 е 1 Ы = — -~ — — --2': — +- ~ — +"" 2 пр 2 пр б л" п*ре где остаток, обозначенный отточием, с вероятностью, сколь угодно близкой к единице, представляет собой величину порядка 1/я, Если теперь обозначим ее Х вЂ” =х' яр то получим асимптотическое равенство: 1 1 е 1 е' — -х' — — л,— + — л,—,, Р(Х) е о 2 па 6 пчп 1 -е (1 — - ~ — +-~,' —,,), (7) Последние два члена в круглых скобках являются величинами порядка !фи, Эти члены мы рассмотрим несколько позднее, а пока ограничимся главным членом а — - Х у Р(Х) е где 'Ч (а — нр)е х Формула (8) показывает, что вероятность, соотвеаствующая точке Х (хы ..., х ), будет тем меньше, чем больше х, отличаются от математических ожиданий ярн так как с ростом абсолютных величин разностей х, — пр, функция Хе возрас1ает.
Как мы уже видслн раньше, функция та определяет эвклидову метрику в пространстве переменных хы..., л: зта функция, с точнссаью до множителя я, представляет собой квадрат расстояния между переменной точкой Х с координатами х,/я н постоянной точкой Р с координатами ро Согласно (8), чем дальше Х удалена от Р, тем меньше будет вероятность, соответствующая В 49. Асимдтотинесксе распределение Х' и д 241 же — ьяе У;= )ааР~ (1О) где все у; являются величинами порядка единицы. Тогда, в новых координатах, выражение для квадрата расстояния (а = (РХ)а будет согсем простым: = ~У ° (11) Следовательно, у, являются обычными прямоугольными коордииатами в пространстве с метрикой (11).
Множество точек Х с целочисленными координатами х,, удовлетворяющими условию е,' я, = я, определяет решетку в гиперплоскости э'у, )Глр, = О. Размерность этой гиперплоскости равна ев — 1. В метрике (11) длины всех векторов базиса решетки являются величинами порядка !!1и, следовательно, объем каждой элсментариой клетки представляет собой величину порядка и — ! -ПР. Вероятность того, что точка Х прииадлсжит какой- либо области В, ранна сумме вероятностей, соответствующих тем точкам решетки, которые принадлежат В, Лсимптотическая формула для этой вероятности легче всего выводится в случае а), когда область Ра определяется неравенством (а < и. В метрике (11) В является шаром.
Величину суммы (1) по точкам решетки, расположенным внутри шара, оценивал в свое время К. Пирсон, который впервые использовал в математической статистике квадратичную форму 1еа. Метод оцепки суммы (!) заключается в следующем: 16 в. л. аан дер Варден ° 1ои точке Х. В этой метрике поверхиости с уравнениями т = сопзФ являются сферами с центром в точке Р. Если эти сферы (в случае ги = 3) пересечь плоскостью к, + ха+ ха = я, проходящей через точку Р, то в пересечении получатся концентрические окружности с центром в точке Р, Так как с большой всроятиостью разности х — яр являются лишь величинами порядка ~п, то ха с большой вероятностью является величиной порядка единицы, т, е.
для всякого а) > О найдУтсЯ такие Ла и Яа, что пРи всех Я > Яа веРоЯтность событиЯ те ( )аа будет больше, чем 1 — а). Поэтому при выводе асимптотичсских формул для вероятностей всегда можно ограничиться такой окрестностью точки 1', где ха ( Ва. В частности, мы хотим вычислить следующие вероятности: а) функцию распределения квадратичной формы 74, т.
е. вероятность события Ха ( и; б) функцию распределения оцеики наибольшего правдоподобия й. В указашюй окрестности точки Р введем новые координаты 242 Гт гХ. Оценка нараметроо по набкюденнмм частотам Сначала вероятности Р(Х) заменяют, по формуле (8), приблнженнымн выражениями т, — е (12) 'у (2я) и ...
е а Н)г (13) где интегрирование производится по области Хв ( и, Как мы уже видели в 9 27, вычисление этого интеграла приводит к известному распределению Ха с т — 1 степенями свободы. Более подробный вывод можно найти в работе Пирсона'. До сих пор в формуле (7) мы пренебрегалн поправочнымн членами порядка 1фа. Но если учесть эти члены, то окажется, что они никак не влияют на результат. Действительно, т е и ( — -'У вЂ” '-1- —, и — ! 2 пр 6 перв! (14) является нечетной функцией от ат,..., в: при замене всех уг на — у, эта функция лишь меняет свой знак. Интеграл от нечетной функции по симметричной области тв ( и равен нулю. Следовательно, асимметрия распределения точек Х почти не оказывает влияния на результат. Единственной ошибкой, которая при определенных условиях может стать величиной в точности порядка 1фв, является ошибка, возникающая вследствие замены суммирования интегрированием вблизи границы области у* ( и.
б) Исследуем теперь распределение оценки наибольшего правдоподобия 0. Сначала вместо д мы рассмотрим оценку 0', полученную методом минимума Х'„где ч. [е~ — нт(Е))г х (15) г Реагв о и К., Оп тьс снтспоп Сьав а дтнеп вувтсп1 ог Неч1ае1опв ... Ы висЬ СЬаа ГЬ сап Ье геавоппЫу вирровсс1 то Ьасе аг Чеп Гготп гапнопт ваптр11пи, РЫ1ов. Маа., 50 (1900), 167. См. также К р а м е р Г., Математические иетсам статистики, ИЛ, М., !940, тл.