Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 45
Текст из файла (страница 45)
перев. 248 Г*. еХ. Оценка лараметрое ло наоеюаеннмм частотам где ](' = у,'+... + у~„. Все точки решетки, по которым нужно производить суммнр~ ванне лежат в гиперпласкасти ~н, Ь, = 1, следовательно, интегрирование распространяется лишь на э]у гиперпласкость. Соответствующим ортогональным преобразованием величин у„можно добиться, чтобы эта гиперпласкость имела уравнение у = О, тогда плотность вероятности будет задаваться формулой 1 — — (е; -~ " + е' ,> йу,, .,у-,)=се ' ' (12) Эта формула справедлива тогда, когда в пространстве Ь, в качестве начала прямоугольных координат у,,...,у выбрана точка (р,(д),...,р ((])). Если же началом координа( является постоянная точка, не зависящая от (], то (12) нужно заменить формулой 1 2 Иа Р1>ч+ ~ (а 1 дн 1)] Щ,...,у,) =Се где у равны математическим ожиданиям у. (13) В качестве оценок, конкурирующих с е, мы рассмотрим лишь такие оценки У, которые являются дифференцируемыми функциями ат Ьр Эти оценки мы будем называть регулярными.
Таким образом, пусть У вЂ” асимптотическн несмещенная, регулярная оценка. Мы хотим сравнить асимптотическис дисперсии оценок Т и е, Как нам уже известно, точка (Ь„..., Ь ) с большой вероятностью расположена в некоторой окрестности точки (р„...р„), причем диаметр окрестности при и- является бесконечно малой величиной.
В такой окрестности каждую днфференцируемую функцию можно аппроксимировать линейной функцией. Полезным линейным приближением для (] является ранее определенная оценка д'; пусть Т' =.е; а,Ь] (1О) — линейная аппроксимация для У. Асимптотическое распределение дифференцируемой функции 2' совпадает с асимптотическим распределением линейной функции У' так же, как совпадают асимптотические распределения д и д'. Доказательство проводится тем же методом, что и раньше, причем асимптотическая формула для функции распределения У' выводится так же, как и для (]'. Мы снова должны просуммировать вероятности р(Х) по всем точкам некоторого полупрастранства.
Суммирование заменяется интегрированием, а верояпюсть Р(Х)— плотностью нормального распределения Се (11) Э Эв. Леимятотическоя эффективность Отсюда следует, что Т' обладает асимптотически нормальным распределением. Асимптотическое среднее значение и асимптотическая дисперсия оценки Т' равны, по определению, среднему значению и дисперсии асимптотического нормального распределения, т.е.
равны среднему значению и дисперсии линейной функции Т'=~;с,й, = оо 1-~ 'скую (14) вычисленным в предположении, что у„..., у, имеют плотность вероятности (13). Так как коэффициенты с, не зависят от и, а среднее значение и дисперсию Т' через эти коэффициенты можно выразить точно, то между асимптотической формулой для дисперсии и асимптотической дисперсией не будет никакого различия. 31о же самое справедливо и для о'.
Таким образом, мы имеем ту же самую ситуацию, что и в теории наименьших квадратов. у„..., у, являются независимыми нормально распределенными случайными величинами с единичными дисперсиями и математическими ожиданиями уо представляющими собой линейные функции одного параметра о.
Оценка Ю' по методу наименьших кнадратов является несмещенной и имеет минимальную дисперсию. Оценка Т' также не имеет смещения, следовательно, ее дисперсия не меньше дисперсии оценки и'. Равенство дисперсий будет осуществляться лишь тогда, когда соответствующие коэффициенты линейных функций Т' н Ю' равны. Следовательно: Среди всех регулярнеях псимптотически несмеи(енных оценок Т оценка наиболыиего правдоподобия о имеет наименьшую асимптотическую дисперсию. Если Т и 6 обладают равными асимптотическилш дисперсиями и если в окрестности точки с координатами Ь, = р,(й) обе эти функции разлагиются в ряд по степеням Ь, — ро то по крийней мере линейные члены эпшх рядов совпадают; следовательно, Т с вероятностью, сколь угодно близкой к единице, отличается от В величиной высшего, чем 1ф и, порядка малости.
Для того чтобы эту теорему можно было сформулировать короче, мы введем следующие определения: Лсимптотическн несмещенная регулярная оценка Т называется асимптотически эффективной, если среди всех оценок с теми же свойствами она обладает наименьшей асимптотической дисперсией. Две оценки, Т,, и Т„называются асимптотически эквивалентными, если их разность Ю = Т, — Т, с вероятностью, сколь угодно близкой к единице, является величиной высшего, чем 1фп, порядка малости, т. е. если В)'и стремится, по вероятности, к нулю. 250 !"л.
1Х. Оценка параметров ло наблюденным чаев!етом Теперь укаэанную теорему можно сформулировать так: Оценка наиболыиего правдоподобия 9 является аагмптотически эффективной, и каждая регулярная аатмптотически эффективная оценка ей асимнтотически эквивалентна. Асимлтотическая дисперсия такой оценки равна 1/1(9) — обратной величине информации. Прн более общих предположениях и, в частности, без предположения линейности функций рг(9) эта теорема была доказана Нсйманом'. Пример Эе.
Согласно общепринатой гипотезе Ф. Бсрнштсйназ, наличие у людей четырех групп крови: 0 (1 группа), А (11 группа), В (Ш группа) и АВ (1Ч группа), вызывается тремя генами А, В н О, причем А и В доминируют над О. Если индивидуум имеет генную пару 00, то его кровь относится к группе О. Генные пары АО и АА приводят к группе А, а ген. ные пары ВО и В — к группе В. Наконец, генная пара АВ приводит к группе АВ. Пусть х, зч Ь,— —,..., Ь„=— и и — известные частоты групп крови в выборке, состоящей нз п нндивилуумов, и пусть р, д ну'(р + д + г = !) — частоты генов А, В и О в крови населения, Требуется найти асимптотическн эффективные оценкиз длн р, д и и Мы предположим, что население хорошо перемешано, т.
е. что оно не распадается на почти замкнутые группы с различными распределениими частот генов. При этом предположении вероатность образования генной пары 00 равна г', точно так же вероятность образовании генной комбинации АО (или ОА) равна рг и т. д. Следовательно, вероятности того, что выбранный наугад представитель населения будет иметь группу крови О, 4, В или АВ, равны соответственно: з и = 2рг -1- рз = (р+ г)з — гз, рз = 22г + 2* = (2+ г)' — гз, рч = 2уху. Этн уравнения можно разрешить относительно р и йч р = 1 — (2+ ) = ! — Уу~ + р * ( х =- ! "- (р + и) = ! — гр ', рп 1 ' 1Ч е у го ап Ю., Сопепьпноп !о !Ье !Ьеогу оурйе х'-теве, Вегйе1еу Яузв.
ров. оп МаФЬ. Я!ап, 1949, 239. а Ве гав 4 суп У., а. Г. шйпиите АЬв!ашшцпив- шм1 ЧегстЬцпйп1еьгев 37 (1928), 236. а Общее определение совместно асимптотическн эффективных оценок дли нескольких неизвестных параметров см. в книге К р а м е р Г., Мате. магические методы статистики, ИЛ, М., 1948. — Прим. перев. Э бр. Асимитотическия эффектиеносзпе 251 С целью получения для р н д предварительных оценок можно в (16) вероятности рз, рз и рз заменить наблюденнымн частотами Ь, Ьз и Ьз. Таким образом, находим ре = 1 — )7Ь + ззз, д, =1 — )1Ь,- Ь,.
(17) Соответствующее условие ортогональности имеет нпд ' рз(0) (20) где и = (1, — 1; — 1, 1) — направляющий вектор прямой (18) и в — произвольный вектор, лежащий в касательной плоскости к поверхности (15). Лва таких вектора, с и е', получаются дифференцированием (15) по р и д. Если координаты этих векторов подставим в левую часть (20), то убедимся, что условие ортогональиостн не выполняется даже приближенно. Асимптатнчески эффективные оценки можно получить с помощью отыскания максимума логарифмичесной функции правдоподобия 7(я)р, д) = я! 1п гз + яз 1п (2рг + рз) + яз 1ц (2д + дз) + зз 1п (2рд).
(21) Лнфферепцирован не Б по р и д (при этом следует положить г = ! — р — д) приводит к уравнепяям зз + за зз яз яз яз + р ' 2г+р д 2г+д Для отыскания решения этих уравнений можно, например, р и д замени!ь навыин ненззес!ными и н е по формулам Р=ре+и д= де+ в (23) н затем дроби в уравнениях (19) разложить в ряды па степеням м и з, удерживая лишь линейные члены. В результате возникнут два линейных уравнения, которые нужно будет разрешить относи~ельно м н а.
Как показано в 4 48, для отыскания асимптотичсски эффективны: ! оценок вместо метода наибольшего прзвдополобня люжно также воспользоватьси методами минимума Хе н Х! Убеди~ься в том, что этн оценки не являются аснмптотически эффективными, можно, например, так. Пусть Ь„Ь„Ьз — координаты в пространстве наблюдений, тогда частота Ь, будет являться функцией этих координат: Ьз = 1 — Ьз — Ьз — Ьз Все точки Н с координатами Ьз, Ьз Ьз для которых оценки (17) остаются постоянными, расположены на прямой "з + Ьз = (! Ре) (18) "! + Ьз = (! — де)' Эта прямая пересекает поверхность, заданную параметрическими уравнениями (15), в точке Ре с координатами рз(0), которым соответствуют значения параметров р = р„д = д,. Если бы оценки (17) были аснмптотически аффективными, то прямая (18) была бы перпеиликуляраа к этой поверхности (илн, по крайней мере при больших я, приближенна перпендикулярна к ней) в смысле метрякн, определяемой квадратичной формой (! 48) Хз %, [Ь вЂ” Р!(ОН' (19) р;(0) 252 Гл.
1Х. Оценка параметров по наблюовннам частотам 2 51. Критерий )(а В 2 49 мы вычислили асимптотичсскую формулу дтя функции распределения случайной величины у (а — ир)е х в предположении, что р, равны истинным значениям вероятностей: Выражение ч (а — ир)' Х ир (4) построенное с помощью таких оценок рр оказывается, вообще говоря, меньшим, чем Хе, и имеет другую функцикв распределения.