XVII Математическая статистика (1081432), страница 7
Текст из файла (страница 7)
Нужно найти приближенное значение параметров по результатам наблюдений хь ..., х„, полученным в эксперименте (по реализации случайной выборки). Как уже отмечалось (см. 1.2), в математической статистике существуют два вида оценок: точечные и интервальные. В этой главе будут рассмотрены точечные оценки, а интервальным оценкам посвящена следующая глава. 2.1. Состоятельные, несмещенные и эффективные оценки Пусть Х„= (Хь ..., Х„) — случайнал выборка из генеральной совокупности Х, функция распределения Р(х;И) которой известна, а И вЂ” неизвестный параметр, т.е. рассматривается параметрическая модель (Г(х; И), И б 9) (для простоты изложения будем считать пока, что И вЂ” скаляр). З.П Состовтевьные, несыенкнные н эффективные оцеммм 55 Требуется построить сшаиэисиэикр д(Л„), которую можно было бы принять в качестве точечкой оценки параметра д.
Интуитивно ясно, что в качестве оценки параметра д можио использовать различные статистики. Например, в качестве точечной оценки для р = М Х можно предложить такие статистики: Х, +Х„ Х=-'~ Х;, д'(Х„)ее и 2 1à — ~Х1 «> + Х1 в+11), и — четное; д(Х„) = 2 Х ве1, 1 э )! и — нечетное. Какую же из зтих статистик предпочесть? В общем случае нужно дать ответ иа вопрос: какими свойствами должна обладать статистика д(Хм..., Х„) = д(Х„), чтобы оиа была в некотором смысле наилучшей оценкой параметра д? Рассмотрению требований к оценкам и методам их нахождения посвящена иастоящая глава. Заметим, что в дальнейшем, как правило, будем говорить об оценке параметра д параметрической модели, хотя все сказаииое можно перенести и иа функцию от д.
Определение 2.1. Статистику д(Х„) называют сосеиоятиельной оценкой параметра д Е 9, если с ростом объема выборка и оиа сходится по вероятности к оцениваемому параметру д, т.е. д(Х„) — + И. Иными словами, для состоятельной оцеики д(Х„) отклонеяие ее от д иа величину л и более становится маловероятным при большом объеме выборки. Это свойство оценки является очень важным, ибо несостоятельная оценка практически бесполезна. Однако следует отметить, что иа практике приходится г. точкчныя оцннкн оценивать неизвестные параметры и при малых объемах выборки. Естественным является то требование, при выполнении которого оценка не дает систематической погрешности в сторону завышения (или занижения) истинного значения параметра В.
Определение 2.2. Статистику В(Х„) называют месмем1емноб оиеимоб параметра В, если ее математическое ожидание совпадает с В, т.е. МВ(Х„) = В для любого фиксированного в. г)0 1пп Р(~В(Х ) — МВ(Х„)~ <г1 = 1. Предположим, что имеются две несмещенные оценки В(Х„) и В(Х„) для параметра В. Если дисперсии РВ(Х ) и ПВ(Х„) удовлетворяют условию РВ(Х„) < РВ(Х„) (2.1) для любого фиксированного и и В б 9, то следует предпочесть оценку В(Х„), поскольку разброс статистики В(Х„) относитель- но параметра В меньше, чем разброс статистики В(Х„).
Определение 2.3. Если в некотором классе несмещенных оценок параметра В, имеющих конечную дисперсию, существует такая оценка В(Х„), что неравенство (2.1) выполняется для всех оценок В(Х ) из этого класса, то говорят, что оиенка В(Х„) является эффеяпзивноб е денном и аессе оцемом.
Если оценка является смем1емиоб (т.е. последнее равенство не имеет места), то величина смещения Ь„(В) = МВ(Х„) — В. Как мы увидим далее, смещение оценки часто можно устранить, введя соответствующую поправку. Говорят также, что оцемма В(Х„) является асимвтотвечесми несмещенной, если при и -+ со она сходится по вероятности к своему математическому ожиданию, т.е. для любого 2Л. Состоятельные, неемещенные и ырфыегннные оиенкн 57 Иными словами, дисперсия эффективной оценки параметра в некотором классе является минимальной среди дисперсий всех оценок из рассматриваемого класса несмещенных оценок.
Замечание 2.1. Эффективную оценку в классе всех несмещенных оценок будем называть эффективной оцеииой, не добавляя слов „в классе несмещенных оценок". Замечание 2.2. В литературе по математической статистике при рассмотрении параметрических моделей вместо термина „эффективная оценка" в классе всех несмещенных оценок используют и другие: „несмещенная оценка с минимальной дисперсией", „оптимальная оценка". Теорема 2.1. Оценка (выборочное среднее) математического ожидания в=мх=р генеральной совокупности Х с конечной дисперсией является несмещенной, состоятельной и эффективной в классе всех лииейыыи оценок,т.е.
оценок вида В(Х„) = ~~» олХ;, где ) сн = 1, для произнольной параметрической модели. 1м! И Напомним, что элементы Х;, е = 1,и, случайной выборки Х„являются независимыми случайными величинами и распределенными так же, как и сама генеральная совокупность Х. Следовательно, МХ; = МХ = р и Р Х; = П Х = и, 1 = 1, и. 58 2. ТОЧЕЧНЫЕ ОЦЕНКИ В силу свойств математического ожидания имеем МХ=М(-~) Х;! = — ~ МХ;= — им=,и, о. и, и в=1 1=1 что и доказывает несмещенность оценки Х.
Далее, поскольку последовательность Хм ..., Х„состоит из независимых одинаково распределенных случайных величин с конечной дисперсией, то в силу закона больших чисел в форме Чебышева для любого с > 0 РОХ вЂ” 14 < е) — ~ 1, в -+ оо, т.е. оценка Х сходится по вероятности к оцениваемому параметру,а зто и означает ее состоятельность.' Покажем теперь, что ФЪ и 11 И Вд(Х„) =В ~) о;Х;=~) В(оиХ) =~~~ о; ВХ;=о ~~~ о; достигает своего минимального значения при о; = 1/и, т.е.
когда оценка 0(Х„) = Х, что и означает зффективность оценки Х в классе линейных оценок. Для отыскания условного минимума функции Щ и 2 у(ом" ° 1оа) = 7 о~ ьм при ограничении о;=1 составим функцию Лагранжа [Ч) И а Цо~,...,о„;Л) = ~~) а~+Л(~ оч — 1), в=1 2!. Сост овтельные, несиен!енные и эфФективные оценки 59 где Л вЂ” множитель Лагранжа. Необходимые условия существо- вания условного экстремума имеют вид дЬ вЂ” =2о!+Л=О, дгц дЬ вЂ” сц — 1= О.
дЛ !=1,п, Решив зту систему, находим Л=-2/п и сц = 1/п, ! = 1, п, и убеждаемся в том, что при этих значениях аргументов функция д(ол,...,он) имеет условный минимум. !ь Замечание 2.3. Можно доказать состоятельность оценки Х для математического ожидания (если оно существует), не предполагая существования конечной дисперсии ВХ. 4! Свойства выборочной дисперсии дз(Х„) = — ~~! (Х; — Х) < Действительно, !т (Х„) = — ~~~ (Х; — Х) = — ~ ((Х! — 1!) — (Х вЂ” !!)) ю=! л=! о и =-',! (Хл-д)'-2(Х-р)-'~ (Хл-д)+-~~ (Х-д)'= п п. п ю=! в=! в=! н = — ~~! (Х; — 1!) — 2(Х вЂ” л!) + -п(Х вЂ” !н) п . п л=! о — 1 Е(Х, !н)2 (Х И)з отражены в следующей теореме.
Теорема 2.2. Если Մ— случайная выборка из генеральной совокупности Х с конечной дисперсией !тз, то выборочная дисперсия аз(Х„) — смещенная состоятельная оценка оз. г. точкчнын оцкнки Используя свойства математического ожидания, получим М<т~(Х„) = -М~) (Х; — р) — М(Х вЂ” р) п ° =1 М(Х; — р)г — М(Х вЂ” р)г = — ~) ПХ; — ОХ = и п в=1 в=1 2 и и 1 2 г = — пи — — = — н фо, й й п т.е. ог(Х„) — смещенная оценка для дисперсии. Докажем, что сиз(Х„) является состоятельной оценкой. Доказательстио пронедем для случая, когда генеральная совокупность имеет моменты до четвертого порядка включительно н нулевое математическое ожидание.
Последнее допущение не является принципиальным, так как дисперсия не зависит от значения ее математического ожидания (от точки отсчета). Применяя второе неравенство Чебьппева, имеем Р гх 1 (~е'~х„)-"— ','~< ) >~- Найдем дисперсию ог(Х„): ст~(Х ) = — ~~) (Х, — Х) = — ~~> (Хг — 2ХХ+Х ) = 1=1 " $=1 = — ~~) Хг — 2Х вЂ” ~~~ Х;+ — иХ = — ~~) Х; — Х . г — 1 1 — г 1 г и п и п в=1 юю1 Воспользуемся изнестным равенством, согласно которому дисперсия скалярной случайной величины равна математическому ожиданию ее квадрата минус квадрат ее математического ожидания: Во~(Х„) = М(й~(Х„)) — (Мо~(Х„)) а!.
соетавтехьные, несмел!енные н эффективные аценки 61 Поскольку (Ф(Х„))'= Я 1Х!-Х)2) = ю=! = — '., ("~~.Х,') -2Х -'~~;Х,-'+Х, "!и! заключаем| что М(оз(Х„))'= 1, М(~Х~) — ~ М(х'~Х~)+МХ . юм! вм! Получим выражения для математических ожиданий трех слагаемых, используя свойства математического ожидания в независимость случайных величин Х;, ! = 1,п, каждая из которых имеет нулевое математическое ожидание и дисперсию о~. Для первого слагаемого имеем м(~х,') =мфх/~. ~ х,'х,') =1 мх,'+ Ж н е и + ~! МХ2 МХ2 — ~~! т4 + ~ <тзоз — и хйе +п(п 1)о~ в,утэ! !А7 Чтобы вычислить второе слагаемое, преобразуем его: м(х 1 х,') = 1, мфх;) ~ х,'.1) = = ',мфх, ~- 2 х,х,) ~х,*) = ил=! зм! эф/с = —,мфх,'~х,') + —,фх,.' 1 х,х,).
1=! з=! э=! йь=! 2 ТОЧЕЧНЫЕ ОЦЕНКИ 62 Так как и М Х1 МХй = О, вм1 вой м') хх,= вой с1 = 1, и, то мкх,2 Е х;хй= ° =1 У,й=1 у~й — ,'> м(х,'х,х,)+2,'1 м(х,'х,)=о. в„вм1 ° М в,~,й=1 в111,вой,1сйй Следовательно, м(х'2 х,')= —,мфх~~х,') = и и = —,м(2 х,'в 1'хйх,') = —,( й,в,с -ц 'в. в=1 в,1си1 Аналогично можно показать, что — 4 1 ц )~ т4+З(а — 1)и в=1 ПОаКОЛЬКу М4с2(Хи) = О2 — О2/а, ОКОНЧатЕЛЬНО НаХОдИМ в 4 в в 1 Во (Хи) — — + т4 -о 2(т4 — 2о ) т4 -Зо' В итоге получаем а т4 +а(а — 1)а4 2(а т4 +а(а — 1)о4) 2 3 + З„4,', З„4 2 т 6„4 т +З(„1)„4 + аз а =о+ а 2 + а з Яль соетовтеввкые, весмещенвые и эФфективные оценки 63 откуда с учетом второго неравенства Чебышева и следует состоятельность оценки оз(Хо) для дисперсии оз генеральной совокупности Х.