В.И.Тихонов Статистическая радиотехника (2-е издание, 1982) (1092037), страница 85
Текст из файла (страница 85)
Методика применения критерия Х' для оценки расхождения теоретического и статистического распределений сводится к следующему: 1. По формуле (6) подсчитывают значение Х'. 2. Определяют число степеней свободы т = г — з — 1, где г— число интервалов группировки результатов; з — число параметров теоретического распределения, оцениваемых по результатам наблюдений. 3. В зависимости от характера задачи назначают достаточно малую (обычно порядка 5; 1 или О,! %) вероятность и, называемую уровнем значимости.
Считается, что событие с такой вероятностью является практически невозможным. 4. По имеющимся таблицам находят величину Х„' (см. рис. 4.2), определяемую уравнением (4.2.8) Абсцисса ХД иногда называется доверительной границей, а вероятность Р(Х' ) ХД) — доверительной вероятностью, 5. Если значение Х', вычисленное по формуле (6), больше Хе, то теоретическое распределение считают плохо согласующимся с результатами наблюдений при уровне значимости и, так как при этом распределении практически невозможно получить Х' ) Х„'.
Есля же значение Х', вычисленное по формуле (6), оказывается меньше Хе, то принимают, что выбранное теоретическое распределение согласуется с результатами наблюдений. Разумеется, решение зависит от объема выборки я, числа интервалов группировки г и уровня значимости а.
В том случае, когда критерий Х' применяется при уровне значимости а = 0,05, рекомендуется принимать минимальное число разрядов, указанное в табл. 4.2. 435 Если число степеней свободы т ) 30, то при определении доверительной границы у' можно воспользоваться тем фактом, что в данном случае случайная величина У2Х» приближенно нормально распределена с математическим ожиданием )г'2т — 1 и средним квадратическим отклонением, равным единице. 4.3. ХАРАКТЕРИСТИКИ ОЦЕНОК.
ОЦЕНКИ МОМЕНТОВ РАСПРЕДЕЛЕНИЯ допустим, что по результатам выборочных значений х = (х„х,, ..., х„) случайной величины $ нужно оценить ее числовые характеристики (например, математическое ожидание, дисперсию и другие моменты) илн неизвестный параметр А, от которого зависит закон распределения (плотность вероятности) р (х; Х) этой случайной величины. Получить оценку по существу означает, что каждой выборке нужно поставить в соответствие некоторое значение параметра Х, т.
е. организовать некоторую функцию результатов наблюдения 6 (х), значение которой принимается за оценку Х„параметра Хе. Любая функция, зависли(ая только от наблюдении, называется статистикой. Так как результаты наблюдения являются случайными величинами, то статистика будет тоже случайной величиной. Величина (статистика) О (х) является конкретным значением функции 6 (з) от случайных аргументов, причем если $л = ха (й = 1, 2,..., и), то Х„=— = 6(х). Отсюда ясно, что нельзя найти оценку, которая бы принимала значения, близкие к 1», для всех возможных выборок.
Следует ограничиться такой процедурой оценивания, которая дает хорошие результаты «в среднем» при многократном ее использовании. Задача определения вида функции (статистики) 6 (х) должна решаться с учетом критерия качества (оптимальности) желаемой оценки-. Чтобы сформулировать его, заметим, что закон распределения статистики О (х) как функции от ~ независимых случайных величин с общим законом распределения р (х; А) вполне определен, причем он будет зависеть от параметра Х. Зная этот закон, можно вычислить вероятность отклонения оценки от оцениваемого параметра, математическое ожидание и дисперсию оценки как прн конечных и, так и при и -ь оо.
Базируясь на этих предельных характеристиках, можно более точно сформулировать требования к оценке представляющей практическую ценность. Состоятельность оценки. Оценка У»„параметра Х называется состоятельной, если она сходится по вероятности к оцениваемому параметру при увеличении объема выборки, т. е. ! пп Р () Մ— )ь ) ( и) = 1, (4.3.1) *В дальнейшем, говоря о параметре л, будем иметь в виду и числовые характеристики слуиайной величины Г,. 436 где в ) Π— сколь угодно малое число. На основании неравенства Чебышева (1.3.24) можно показать, что достаточное условие выполнения соотношения (1) заключается в том, чтобы Нш М ((˄— Ц ) = О (4.3.2) Состоятельность оценки означает, что при достаточно большом объеме выборки со сколь угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины.
Состоятельность является лишь асимптотической характеристикой оценки при и — >- со. Несмещенность оценки. Свойство состоятельности оценки характеризует поведение оценки при стремлении объема выборки к бесконечности и не налагает никаких ограничений на поведение оценки при копечных п. Если существует одна состоятельная оценка Л„, то можно построить бесконечно много других. Например, при фиксированных а и Ь оценка Л„(н — а)! (н — Ь) будет также состоятельной. Всегда желательно, чтобы для всех и математическое ожидание оценки было равно оцениваемому параметру, т.
е. М (Л„) =- Л. (4.3.3) Оценка, удовлетворяющая этому условию, называется несмещенной; в противном случае — смещенной. Разность й„- = М (Л„) — Л называется смещением или систематической ошибкой оценки. Если равенство (3) выполняется лишь в пределе при а ->- оо, то соответствующая оценка называется асимнтотически несмещенной. В общем случае точность оценки некоторого параметра Л на основании выборки обычно характеризуют средним значением квадрата ошибки е' = М ((Л вЂ” Л)') (4.3.4) где ˄— оценка параметра Л по выборке объема п.
Запишем это выражение иначе: М ((˄— Л)е) = М([˄— М(Л,,)+ М (Л„) — Л)') = = М ([˄— М (Л„))з) + 2М ([˄— М (Л„)[ [М (Л„) — Л)) + + М ([М (Л,) — Л['). Если параметр Л в процессе наблюдений остается постоянным, то перед последним слагаемым в правой части можно опустить операцию математического ожидания М ([М(л„) —, Л[') = [М(Л„) — ЛР, а среднее слагаемое равно нулю: М (˄— М (Л„)) = М (Л„) — М. (Л.).= О. Поэтому = М ([˄— М (Л„)[ ) + [М (Л„) — Л['.
(4.3.5) 437 Среднее значение квадрата ошибки состоит из двух слагаемых: первое представляет собой дисперсию оценки 7)~ = М ([Л,— М (Л„))») = М (ф — [М (Л„))', (4.3.6) характеризующую долю «случайности» в величине ошибки, второе есть квадрат смещения оценки л'; =[мр,„) — л) . (4.3.7) Итак, среднее значение квадрата ошибки равно сумме дисперсии оценки и квадрата смещения оценки а М((Л Л)») 77„+Л» (4.3.8) На практике удобно представить ошибку оценки в тех же единицах измерения, что и оцениваемый параметр. Обычно берут положительное значение корня квадратного нз величин ошибок (6) — (8). При этом средняя квадратическая или стандартная ошибка определяется формулой (4,3.9) ошибка смещения (4.3.10) л;=м(л ) — л и общая ошибка з =- (о«~ + Л))ы'.
(4.3.11) Часто рассматривают нормированные ошибки. Для этого ошибки (9) — (11) делят на значение оцениваемого параметра (при Л-ь О). Достаточность оценки. Рассмотрим оценку Л„параметра Л и ее выборочное распределение р (Л„; Л). Если плотность вероятности выборки можно представить в виде р (х„ ..., х„; Л) — р (Л„; Л) й (х„ ..., х„), (4.3.12) где функция Ь (х,, ..., л„) не зависит от Л, то оценка Л„называется доел«аточн ой. Это значит, что вся доставляемая выборкой информация относительно параметра Л содержится в Л„. Если известна достаточная статистика, то никакая иная статистика, вычисленная по той же выборке, не может дать дополнительной информации, касающейся Л. Доказывается, что необходимое условие существования достаточной статистики состоит в возможности представления закона распределения в виде р (х; Л) = ехр (А (Л) В (х) + С (х) + Р (Л)).
(4.3.13) В том случае, когда область определения р (х; Л) не зависит от Л, это условие является также достаточным. Отметим, что достаточная оценка не является однозначной. Любая оценка, однозначно связанная с достаточной, является также доста- 4ЗВ дЛ ) р(х~Л) Йх= — М) — 1п р(х~ Л)1=9, ( дЛ (4.3.15) так как <(1(х)Ях = 1". (х) Ы 1п Дх) l<(х. (4.3. 16) Поскольку математическое ожидание в (15) берется по х, то для любой функции от Л, например ф (Л), справедливо равенство М (ф (Л) — 1п р (х $ Л)~ = О.
аЛ (4.3.17) Допустим, что математическое ожидание оценки параметра Л равно ф (Л): М (Ч = ( Лр (х ~ Л) <(х = ф (Л). Дифференцируя это равенство по Л, имеем Г ; а 1а Л (к ~ Л) ( ~ Л) „ Ьр (Л) дЛ <Л (4.3.18) 439 точной. Это обстоятельство допускает некоторую свободу в выборе функций достаточных оценок, которые к тому же были бы состоятельными и несмещенными. Эффективность оценки. Прн ограниченном объеме выборки оценки могут различаться средним квадратом ошибки (4).
Очевидно, что чем меньше эта ошибка, тем теснее сгруппированы значения оценки около оцениваемого параметра Л. Поэтому всегда желательно, чтобы ошибка оценки была по возможности малой, т. е. выполнялось условие з' = М ((Л вЂ” Л)') = пп'и. (4.3.1 4) Оценку Л, удовлетворяющую этому условию, можно назвать оценкой с минимальным средним квадратом ошибки.
Если оценка Л несмещенная, то величина е' совпадает с дисперсией оценки Р-, Несмещенная оценка с минимальной дисперсией является особенно важной. Докажем, что дисперсия любой оценки при некоторых условиях имеет значение, которое не может быть меньше нижней границы, определяемой неравенством Рао — Крамера 1159, 1641. Приведем это доказательство для оценки одного параметра, а для нескольких параметров укажем окончательный результат.