Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 42
Текст из файла (страница 42)
При этом вместо максимума функции л.(х ~ 6) нужно найти минимум квадратичной формы Ч» (х — пр)ь х Форма а лишь незначительно отличается от известного выражения (2) Щ> Для отыскания оценки параметра д можно воспользоваться условием тв = ш)шшцш. Однако этот метод в большинстве случаев приводит к сломаным вычислениям, так как для отыскания точки минимума приходится дифференцировать знаменатели про Но если в знаменателях нсе р заменить некоторыми подходящими оценками р<в), то дифференцирования знаменателей можно будет избежать, в этом случае будет идти речь о минимуме выражения 2 ь" (х р) )(о =;., прешь> Вычисление этих различных оценок мы исследуем несколько подробнее и докажем, что они отличаются друг от друга величинами порядка )/н. При этом мы рассмотрим лишь следующие ори метода отыскания оценок: Л.
Метод минимума у,'ь Б. Метод минимума В. Метод наибольшего правдоподобия. Для упрощения выкладок мы, далее, будем предполагать, что р, являются линейными функциями параметров ь. Результаты 2З4 Гл. ХХ. Опенка параметров но наблюденным чаетатал могут быть распространены на нелинейные дифференцируемые функции, так как в окрестности истинных значений парамстров б =с* эти функции можно приблизить линейными. Поэтому функции рр встречающиеся в примерах этой главы, часто являются пелинейными, хотя теория излагается лншь для линейных функций'.
А, МЕГОД МИНИМУМА Хч Квадратичная форма (х — л')э Х вЂ”,! нр>е> (4) в НРсстРанстве (х„..., х ) опРеделЯст эвклидовУ метРикУ: Хеа— квадрат расстояния между точками Х(х„..., х ) и Х'(х,',...,х'). Если положим х, = яре(б), (э = 1...,, тп), где ЗР! %. =- зе,, (б) Рис. 24. ' Здесь имеются в виду лишь такие функции Р! (б), которые являются линейными в некоторой ограниченной области изменения параметров б. ()оэтому определяемое далее множество 6 ье является линейным подпространс~вом (хотя бы потому, что оно ограничено). Выводы этого параграфа нельзя признать строгими, оливке они правильно отражают действитечьную связь рассматриваемых методов.
Обс~оятельное и строгое изложение данного вопроса сл!., например, в книге Крамера !'., Математические методы статистики, ИЛ, М., (948, гл. ХХ Х. — Прил. перев. где рг(б), как указано выше, — линейныс функции параметров б,, бт то множество всех точек Х' с координа >ами (х,,..., х ) будет представлять собой линейное подпространство 6. Условие Хзв = ш1шшшп означает, что точка Х' этого нодпРостРанства выбирается таким с>бразом, чтобы расстояние между Х' и наблюденной точкой Х было наименьшим.
Следовательно, из Х нужно опустить перпендикуляр на линейное подпростраяство 6; основание этого перпендикуляра является точкой Х* (рис. 24), Тот жс самый результат получается и с помощью вычислений. Если (3) продифференцировать по всем б. и производные приравнять нулю, то получим систему уравнений д 48. Наибольшее правдоподобие, минимум Хе и наименьи<ие квадраты 235 Если йо бв,..., б, — решение системы (5), то вектор, направленный из точки Х с координвта.ии х>(п, в точку Х' с координатами р,(ь), будет перпендикулярен ко всем векторам, касаюшимсн множества 0 в точке Х'. В эзсй формулировке наше утверждение справедливо даже и тогда, когда <е не является линейнь<м подпрострапством пространства всех Х.
Однако, по предположению, р(й) — линейные функции параметров д„поэтому производные д<. равны постоянным и мы можем положить Р,(д) = Р<(0) + ~ дыд,. (7) р Изменением начала отсчета в пространстве параметров можно добиться, чтобы при ье — — О соответствующие значения верьятностей р, равнялись начальным приближениям р)о> в формуле (31, т. е. р<(0) = р<о1; это несколько упростит выкладки. Если (7) подставим в (5), то получим г линейных уравнений с г неизвестными ьи,..., ь,: <о> где ее кн <от Коэффипиенты Ь, имеют тот же самый вид, что и суммы (даа)„(дай),...
в теории метода наименьших квадратов. Таким образом, задача отыскания минимума квадратичной формы Д совпадает с задачей теории метода наименьших квадратов, причем в данном случае веса д; наблюденных частот равняются п<р<о>, Попытаемся теперь выяснить, в какой степени выбор начального приближения р<<о>,..., р<о! влияет на точку Х'. В качестве координат точки Х мы примем не хи а частоты Ь, = хь<п, и расстояние определим формулой (10) Р> Предположим, что точка Х с координатами Ь, и гочка Р, с координатами р<о! находятся в окрестности вистинной точкио Р" с координатами р,*, причем радиус этой окрестности является величиной порядка 1>1'и, и, кроме того, координаты р, всех точек Р этой окрсстпости ограничены снизу некоторым положительным числом: р,~. д ~ О.
Если чеперь Ро заменить точкой Я из той же окрестности, то все разности соотвезству<сщих координат р<о' — в<а будут величинами порядка е = 1<)>п. Так как точка Х и линейное подпро- 236 Гл. тд. Оценка нарамеа>ров но наблюденным часеаоенам Б. МЕТОД МИНИМУМА Хк Если р)о> выбрать равными наблюденным частотам Ь, = х,/и, то Д перейдет в Х~.
Отсюда следует, что минимум Х~ вычисляется точно так же, как и минимум ув, а именно, по методу наименыиих квадратов. При этом с вероятностью, сколь угодно близкой к единице, точка Р„минимума квадратичной формы у~ находится от ранее введенной точкн Х' на расстоянии порядка 1/и, В. метОд нАиволъшего пРАвдоподовия Если логарифмическая функция правдоподобия л.(х ! У) = ~ х, 1п р>(б) дифференцируема и достигает максимума внутри области допустимых значений параметров о, то в точке максимума производные от е обращаются в нуль.
Таким образом, координаты точки максимума должны удовлетворять уран~синям (11) где у„=бр>/оо„. Так как сумма всех р, равна единице, то суммы соответствующих производных равны нулю: ч, 0 е (12) странство О нс зависят от выбора Р„то от замены Р, на 8, изменится лишь квадрат расстояния (10), причем г'(8в) отличается от е'(Рв) на величину порядка е, Направление перпендикуляра ХХ' также может измениться, однако угол между новым и старым направлениями является лишь величиной порядка е. Но, по предположению, длина старого перпендикуляра представляет собой величину порядка е, следовательно, координаты точки Х' при замене Р, на 8, изменятся на величину порядка ьа = 1/я, Вообще, если разности координат р>о> — в(о> являются величинами порядка т>, то при замене Р, па 8, координаты ~очки Х' изменятся на величину порядка ет>.
Или, точнее, если для всех в имеют место неравенства ~ р>о> — в)о> ~< т>, то абсолютные величины разностей координат точек Х((Р,) и Х'(Б,) будут меньше, чем се>>, где с ) 0 — постоянный числовой множитель. Теоретическая оценка постоянной величины с нс приносит значительной пользы. Такие оценки всегда оказываются слишком грубыми, так как они в большинстве случаев значителы>о превосходят те разности, которые встречаются па практике. Для практических целей достаточно установить, ч>о точка Х' лишь в очень незначительной степени зависит от выбора исходного приближения р>о> 4 гг.
Наибольшее аравдооодобие, минимум Хь и наименьшие квадрата 237 Если (12) умножнм на и и результат вычтем из (11), то полу- чим (14) (16) ' — О (1з) Р> При этом р> в числителях и знаменателях являются линейными функциями от д. Решение системы (13) представляет собой оценку наибольшего правдоподобия д, следовательно, ~ 1и> — иРЙ) ! чм = О. > Р>(д) Решение системы уравнений (14) можно очень легко найти методом последовательных приближений.
Для этого сначала заменим д в знаменателях каким-либо приближенным значением иго>. Соответствующая система уравнений (ьп — иР~(б>! Чм 0 (15) Р Оиь>) представляет собой систему (5) метода минимума то' и, следовательно, ее можно легко решить как систему нормальных уравнений метода наименьших квадрагов. Если решение ьп> системы (15) снова подстави~ь в знаменатели (!4), то тем же самым способом получим улучшенное приближение д<'> и г, д. Последовательность приближений й<"> сходится, и предел этой последовательности не зависит от выбора исходного приближения р!" = р,(дм>). Действительно, если р,"> и г~'> — два различных исходных приближения, отличающихся друг от друга лишь величинами порядка е = 1/~и, то, согласно ранее доказанному, первые приближения рш и г>1> отличаются друго> другалишьвеличинами порядка е', вторые приближения — лишь величинами порядка ев н т.
д. Если теперь в качестве г)о>вь>брать рыненне уравнений правдоподобия, то будут выполняться равенства г>о>=г~»=г~ь>=..., н так как для любых р,'о> из г-окрестностей г'," справедливы неравеяства (р)ь> — г)е>! =()>)ь> — г)о>(~иге+~, то псследовательнссти р)о>, ро>, р)в>,...
сходятся к решению г)о>, независимо от выбора рм> из г-окрестностей г>о>. При доказательстве предполага,чось, что решение уравнений наибольшего правдоподобия сущсствует. Это предполо>кение выполняется в том случае, когда все х, строго положительны. Действительно, условия ~ р, = 1, р, ~ 0 определяют в пространстве всех (р„..., р ) некоторую замкнутую ограниченную область. Часть линейного подпространства ге, принадлежащая этой области, также является замкнутой и ограниченной. Функция правдоподобия 238 Гл.