Дженкинс, Ваттс - Спектральный анализ и его приложения (выпуск 1) (1044211), страница 19
Текст из файла (страница 19)
е. (0,31; 5,1! ), Отсюда следует, что 95о!о-ный доверительный интервал для о имеет вид (0,56; 2,26). Доверительные интервалы для отношения двух дисперсий. Если 5' является оценкой для о' с иь степенями свободы, а Зв — незавиь ь г симая оценка о', с ив степенями свободы, то, как показано в равд. 3.3.4, выборочное распределение случайной величины является г"в -распределением Фишера. Следовательно, как показано в равд. 3.3.4, Подставив г е =ов5',!о'5'„в (4.2.5) и перегруппировав члены, Следовательно, 100(1 — а) ого-ный доверительный интервал, осно- ваный на выборочных оценках зв и зв, полученных из двух неза- висимых выборок, имеет вид < и в2 — — и.е.сь 2) Гл.
4. Введенссе в теорию етатиетичеекик вьсводов 124 4.2. Применение метода выборочнвск раеаределенисс 125 4.2.3. Свойства оценок В разд. 4.2.1 было показано, что лучшую оценку параметра можно выявить, сравнивая выборочные распределения различных оценок. Иногда невозможно вывести точное выборочное распределение, и в таких случаях необходимо прибегнуть к помощи приближенных методов для отбора оценок. Эти методы используют свойства, определяемые младшими моментами оценок. Важнейшими из этих свойств являются смещение, дисперсия и среднеквадратичная ошибка.
Смещение. Смещение оценки 19 параметра 0 определяется как В=Е [(т~ — О. (4.2.7) Если В=О, то плотность вероятности оценки имеет своим центром в точности истинное значение О, и оценка называется несмещенной. Естественно выбирать оценку с малым или нулевым смещением, однако, как мы вскоре увидим, не всегда разумно настаивать на том, чтобы оценка была несмещенной. Дисперсия.
Дисперсия оценки Чаг [Й) = Е[(Й вЂ” Е [с>Ц (4.2.8) измеряет рассеяние плотности вероятности случайной величины В относительно ее математического ожидания, и, следовательно, вообще говоря, дисперсия должна быть небольшой. Однако требования малого смещения и малой дисперсии не обязательно совместимы, и часто уменьшение одной из этих величин влечет за собой увеличение другой. Рассмотрим, например, оценки В = — 2', (Х вЂ” Х) (4.2.9) 1=1 Например, для данных о токах транзисторов з'=,0,86, а число 1' степеней свободы т1=8.
Для выборочной дисперсии другой вы- борки из 100 транзисторов была получена величинй за=1,025, причем число степеней свободы те=99. Из рис. 3.12 находим, что /в,ее(0,95) =2,05; /е>е(0,95) =3,01, и поэтому, подставив эти значе- ния и отношение з2/з2,=1,025/0,86= 1,!6 в (4.2.6), получаем 90%- нын доверительный интервал для о'/о'1 2 1 116 зо, ' 1,16 2,05), илн >ке (0,39; 2,38). Так как этот доверительный интервал вклю- чает отношение о2/о',= 1, то возможность де= па пе должна исклю- 1 2 чаться. для дисперсии о2 нормальной плотности вероятности. Так как и (1/о') ~ (Хс — Х)2 является случайной величиной 112 с т = и — 1, 1 1 то, воспользовавшись (4.2.7) и (3.3.6), получаем, что смещение этой оценки равно (4.2.10) а нз (3.3.6) получаем, что (4.2.11) Таким образом, несмещенная оценка для о2 получается при й= = и — 1, и в этом случае Чаг !о~ С другой стороны, дисперсию оценки (4.2.9) можно уменьшить, сделав й большим.
Однако увеличение /с приводит к увеличению смещения, которое стремится к — о', когда й — нов. Ясно, что необходимо найти компромисс между дисперсией и смещением. Среднеквадратичная ошибка. Один из видов компромисса между дисперсией и смещением дает минимизация среднеквадратичной ошибки оценки, а именно Е[(Й вЂ” О) ) = Чаг [Й1+ В'-'. Для упомянутого выше примера среднеквадратичная ошибка равна (4.2.12) 2 (о — 1) 4 ! (л — 1 — Се)" в2 ст> Это выражение достигает минимального значения 2ос/(п+1) при й =и+ ! по сравнению со среднеквадратичной ошибкой 2о' (и — 1) для несмещенной (Й =п — 1) оценки.
В некоторых случаях среднеквадратичная ошиока достигает минимума прн нулевом смещении, т. е, одновременно с дисперсией. Такие оценки называются несмещенньони оценками с минимальной диене/>гссей. Одна из трудностей, связанных с использованием критерия среднеквадратичной ошибки, состоит в том, что он дает нам возможность лишь сравнить данные классы оценок, но он не говорит нам, как следует выбирать эти оценки. Впрочем, один класс оценок, удовлетворяющих свойству минимальности среднеквадратичной ошибки для больших выборок, можно найти из функции 126 Гк 4. Введение в теорию стоп!стических выводов 4.2.
Применение методе выборочных распределений 12! правдоподобия, введенной Фишером. Эти оценки обсуждаются в равд. 4.2. Они сыграли важную роль в статистическом оценивании, так как становятся несмещенными для выборок большого объема н имеют также минимальную дисперсию среди всех возможных оценок. Следовательно, для выборок большого объема оценки максимального правдоподобия являются оценками с минимальной среднеквадратичной ошибкой. Состоятельность, Другим свойством оценок, опирающимся на выборочное распределение, является состоятельность.
Предположим, что смещение и дисперсия оценки стремятся к нулю, когда объем выборки и становится большим. Это означает, что выборочное распределение концентрируется вокруг 6 и точность оценки безгранично возрастает. Оценка, обладающая этим свойством, называется состоятельной оценкой. Например, если выборочное распределение стремится к нормальному, что обычно справедливо при довольно общих условиях, то оно будет для больших и близким к У- (О; О) = — ехр ~ — —, ~(0 — О) ) .
Когда и стремится к бесконечности, эта функция ведет себя подобно б-функции, сосредоточенной в О, 4.2.4. Оценки максимального правдоподобия Функции правдоподобия, зависящие от одного переменного. Задача нахождения хорошей оценки для статистического параметра была решена для многих случаев Фишером [2, 31, который ввел класс оценок максимального правдоподобия. Чтобы проиллюстрировать этот метод, рассмотрим задачу оценки среднего срока службы партии осветительных ламп.
Предполагается, что срок службы одной лампы хорошо описывается с помощью случайной величины Х с плотностью вероятности (х; Л) = Л ехр( — Лх), 0 ( х ( со. Ото!ода выборочная плотность вероятности для случайной выборки, состоящей из п ламп, будет иметь вид До того как произведен эксперимент, плотность вероятности (4.2.13) дает частоту получения различных выборок при условии, что Л задано.
После того как эксперимент произведен, его можно интерпретировать по-разному. В нашем случае значения выборки хь хз, ..., х„известны, а параметр Л неизвестен. Зависящая от Л функция, которая получается при подстановке выборочных значений в плотность вероятности (4.2.!3), называется функцаей правдоподобия Т. (Л) для параметра Л. Она выражает предпочтительность различных значений Л. 000010 0,00200 0,00!25 2 д Л Р и с. 4.2. Функпия правдоподобия для выборки объема 3 из показательного распределения. Например, предположим, что три лампы выбраны случайным образом пз партии, проверены, и в результате проверки оказалось, что их сроки службы равны 2,6; 1,9 и 1,5 час соответственно. Так как 2„',х! =6, то функция правдоподобия имеет вид .(. (Л) =Л'ехр( — 6Л), (4.2.14) График функции (4.2.14) приведен на рис.
4.2. Он представляет собой одновершинную кривую с максимумом при Л= 0,5. Значение Л параметра Л, которое максимизирует Ь (Л), называется выборочной оценкой максимального правдоподобия параметра Л. Она дает 128 Гл. 4. Введение в теорию статиспьческих выводов 42. Применение метода вь!борочньи распределений 129 предпочтительное значение параметра Л, поскольку при этом значении вероятность получения данной выборки максимальна. Как правило, для гладкой функции правдоподобия оценку максимального правдоподобия можно получить, решая уравнение = — О 1ЕЛ Для правдоподобия, полученного из плотности вероятности (4.2.13), это уравнение дает выборочную оценку максимального правдоподобия л = 1/х. В приведенном выше примере х =-2 и, следовательно, Л == О,о. В некоторых случаях, например если максимум достигается на границе возможных значений параметра, нельзя найти этот максимум дифференцированием.
Чтобы не получать лишенных смысла результатов, нужно построить график функции правдопо добин. Функции правдоподобия от многих переменных. В случае, когда функция правдоподобия зависит от я параметров 01, 01, ..., 01„выборочные оценки максимального правдоподобия должны максимизировать Е(01, Оь . Од) одновременно по всем переменным. Если этот максимум можно найти с помощью дифференцирования, то выборочные оценки максимального правдоподобия являются решением системы и уравнении: т! (0!' 00' ''" 0ь) — О (' — 1 2 й) д04 т (4.2.15) Пример 7, Рассмотрим функцию правдоподобия для среднего значения и дисперсии нормальной плотности вероятности, причем предполагается, что выборка состоит из п наблюдений: 1 7,(!ь, а')=- и ехр~ —,, хы (х! — Р)', (4.2,17) так что логарифмическая функция правдоподобия имеет вид л 4(!ь, а~)= — 2 1п2-. — п!па — 2 т хв (х, — 11)'. (42 18) и 1 1=! Иногда удобнее находить максимум логарифма функции правдоподобия 1(01, 01, ..., Оь) = — 1и !.
(01, 01, ..., Оа). Тогда уравнения максимального правдоподобия имеют вид да до 1 до. О (7=1, 2, ..., й). (4,2,16) Выборочные оценки максимального правдоподобия, получаемые нз (4.2.18), являются решениями системы уравнений л — — (х, — Р.) =О, а 1-.! л + ~,~ (х, — !с) =О, а 1=-1 (4.2.1 9) т. с Х =Х, ~Ч ! == ! л, (Х,— Х) . 1=-! (4.2.20) 14 1!ь! !ьз а1, аа, Р!0)=- — п!п2я — п1па! — П1паа — — 1п(1 — Р1,)— 2(! — 0!1) 4=1 (Х11 — Я2 ) ) (4.2.21) Функция правдоподобия (4.2.2!) зависит от пяти параметров, и выборочные оценки максимального правдоподобия можно получить, дифференцируя зту функцию по очереди по всем пяти параметрам и решая полученные уравнения. Можно убедиться, что оценки среднего значения и дисперсии те же самые, что и полученные из правдоподобия (4,2.!7), а выборочная оценка максимального правдоподобия для коэффициента корреляции р!х имеет вид (Х!1 — Х!) (Ха! — ХЗ) 1=1 Гм.
(4.2.22) ! ~! л )'1а (Х!1 — Х!) л Е (Х21 — ХЯ) 1=1 1=! Б Заказ Ж !Мо Пример 2. Предположим, что имеется п пар измерений (хп, хм), 1=1, 2, ..., и, как это было для данных об акселерометре на рис. 3.7. Если предположить, что онп могут быть описаны парой случайных величин, совместная плотность вероятности которых является двумерной нормальной плотностью, то логарифмическая функция правдоподобия для и пар наблюдений имеет вид 131 130 с1в Г12 /— (4.2.23) 4.2.5. Критерии значимости где с,.„= — „,~', [хи — х1) (х„— хт) ! (4.2.24) — 1 ! ) Е [дзг (О),'дбз) в (4.2.25) (4.2.26) Гл.