В.И.Тихонов Статистическая радиотехника (2-е издание, 1982) (1092037), страница 87
Текст из файла (страница 87)
Согласно центральной предельной теореме выборочное среднее значение (40) и выборочная дисперсия (41) распределены асимптотически (при и -ь аа) нормально. Для конечной независимой выборки, относящейся к гауссовской случайной величине, выборочное среднее значение т" распределено нормально, а распределение выборочной дисперсии Р* имеет внд Хз-распределения (3.3.48) с а — 1 степенями свободы: рп, (х)=((2пРп з)!э !1)з Г ((и — 1)!2)) ! х!" з11з ехр ( — пх!2Р), х > О.
(4.3.52) Статистические оценки начальных моментов ть, определенных формулой (42), являются несмещенными Оценки центральных моментов по формулам (42) оказываются смещенными [8[. Например, (а — 1) (а — 2) (Рз) аз Рз М (Р*)= (а — 1) (аз — За — 3) 3 (а П (2а 3) Рз+ аз Рз (4.3.54) Дисперсии оценок центральных моментов (42) определяются выражением О . =(1)а) (р,ь — 2йрз ! Рз4 ! — Раз+М р, раз ь)+О(а з).
(4.3.55) Для получения несмещенных оценок центральных моментов нужно вместо (42) пользоваться исправленными оценками а з И[! — — — 3/з 1, +3 3 (4.3. 58) Примем за оценочные значения этих величин выражения Рз (Рз) ['з Р4 (Рз) По формулам (57) получим М (И);) = У%, М ( ~;) =6„ 4рз зрв — 12рз Рз рз — 24рз Рз+9рз Рз+35Р[рз+Збрз (4,3 69) Ур,' 4ар,' рз рз — 4рз рз Рв — 8рз рз рз+4рз з— р,' р[+16рз Рз Рз+16рз рзз 6 арз (4.3.59) 446 (а — 1) (а — 2) а (аз — 2а+3) „За (2а — 3) рз =-' Р (р )з.
(4.3.56) й(а — !) (а — 2) (а — 3) з (а — 1) (а — 2) (а в 3) Часто бывает необходимо получить математическое ожидание и дисперсн|о некоторой функции Н (р", р,",) от выборочных центральных моментов р" и р,'„ являющихся случайными велйчивами. Во многих случаях для этого можно вос- пользоваться следующей теоремой [8). Предположим, что выполнены два условия: !) в некоторой окрестности точки р" .=- р, р' =- р функция Н непрерыв- на и имеет непрерывные первые и вторые производные по аргументам рт и ра, 2) для всевозможных значений величин х! выполняется неравенство )Н! ( ( Са", где С и сз — неотрицательные постоянные.
Тогда, если обозначить Н„Н, и Нз значения функции Н (рт, ра) и ее первых частных производных в точке рт — — рт, ра — — рю то математическое ожи- дание и дисперсия случайной величины Н (рт, ра) будут определяться формулами М (Н) =Но+О (1/а), з (4.3.57) 7)71 — — рз(р )Н,+2ргг(р, р )НтНз+рз(р )Н,+О(а ). Здесь рз ( ) — второй центральный момент соответствующей случайной вели- чины; ргг ( ) — смешанный центральный момент второго порядка. При больших значениях а функция Н (рт, ра) распределена асимптотически нормально. Приведем два примера на применение формул (57).
В качестве показателей асимметрии и эксцесса часто используются величи- ны Для нормально распределенной случайной величины зти приближенные выражения примут вид М ([/ Р")= М (Р') =О, /Р†, , 6/и, /)р„ — 24/и. (4.3.61) Ур, Пусть имеется и пар наблюденных значений (х„у!), ..., (х„, рп) двух случайных величин $ и Ч с нормированной взаимной корреляцией г. Естественно за выборочную нормированную взаимную корреляцию принять выражение (4.3.62) где выборочные значения математического ожидания шд и дисперсии /7* случайных величин я и ч определяются по формулам типа (40) и (41).
В данном примере формула (57) приводит к следующим результатам: М (г*) = г, гз / Рю Рва 2Рзз 4Рзз 4Рз! 4мгз ! /з„„= — !( —, + —, + — +, — — — — 1, (4.3.63) 4п !! р)о рвов Рю Роз рг! ры рзо рт! Роз/ где ри — смешанные центральные моменты совместного теоретического распределения случайных величин С и Ч. Для совместно гауссовских случайных величин $ и Ч последняя формула упрощается: р — (1/л) (! гз)з Если случайные величины в и ч распределены совместно нормально, но объем выборки п небольшой, то для оценки нормированной взаимной корреляции используют преобразование, введенное Фишером: 1 1+г* ! 1+г х = — 1п „, ь.= — 1и 2 1 — г* 2 1 — г Доказывается [8), что величина х уже при небольших значениях и распределена приблизительно нормально с математическим ожиданием и дисперсией, определяемыми приближенными формулами М (2) — ~+, //х = .
(4.3.66) (4.3.66) Выше был рассмотрен способ получения точечных оценок некоторых параметров. Более полный и надежный способ оценивания параметров случайных величин заключается в определении интервала (а не единственного точечного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра.
Интервал длиной (Л„Лз), центром которого служит оценка параметра и в котором с вероятностью !х заключено истинное значение параметра, называется доверительным интервалом, соотеетствуюи(им доверительной вероятности се*. Доверительная вероятность сс назначается до производства выборки и не учитывает какие-либо конкретные данные опыта. Задача определения доверительного интервала может быть решена только в том случае, если удается найти распределение выборочной величины, используемой в качестве оценки.
'Часто используется другая терминология: вместо доверительного интервала говорят о доверительных границах, а вместо доверительной вероятности— о козффиииентв доверия. 447 Поясним содержание такого способа оценки параметра на частном примере. Пусть в качестве оценки математического ожидания т, случайной величины $ используется среднее арифметическое (40) выборки достаточно большого объема кя т1= — ~ х,=~.
1 ~ч (4.3.67) и .! Так как случайная величина ь представляет собой сумму независимых одинаково рарпределенных случайных величин х„то согласно центральной предельной теореме при достаточно больших п (и ) 30) ее закон распределения близок к нормальному. Математическое ожидание и дисперсия нормального закона даются соответственно формулами (45) и (46): (4.3.
68 тс=МЯ =и» Рг =Р/и. Теперь запишем нормальную плотность вероятности случайной величины ь: р (ь) =(2иРД '~ ехр ( — (ь — т,)'/2Рг). (4.3.69) Найдем такую величину Л„, чтобы выполнялось равенство Р (( ь — тт ) ( Л ) = Р (т,— Л„< ь ( т, + Л„) =- а. (4.3.70) С учетом (69) отсюда получим ь+ а ('.~-= ~ 11 — "1- р(ь) 0ь = 2Ф ( " ~1 — 1 = 2Ф Л„1~ — — 1 а, (4.3.71) «~1 — а где Ф (х) — табулированный интеграл вероятности (1.4.5).
Из (71) имеем Ф (Л„3~ п/Р) = (! + а)/2. Воспользовавшись таблицами функции Ф (х), по заданной величине (1 + а)!2 определяем значение аргумента Л ) п(0 и затем находим длину доверительного интервала 2Л„. Если дисперсия Р заранее неизвестна, то в качестве ее ориентировочного значения можно взять оценку Р", вычисленную по формуле (48). Перед тем как дать более точное решение рассматриваемого примера, поясним смысл доверительного интервала.
С этой целью распишем левую часть равенства (70) в двух эквивалентных видах: Р (Ь вЂ” Л„< т, < Ь + Л„) = Р (т, — Л„< Ь < т, + Л ) = а. (4.3.72) Значение оценки ь = т1 при фиксированном объеме выборки яв~ ляется случайной величиной, меняющейся от одной выборки к другой.' После извлечения выборки величина ь принимает определенное числовое значение. Для него приведенное выше выражение (72), вообще говоря, неприменимо, так как оно либо попадает, либо не попадает в указанные пределы. Иначе говоря, после извлечения выборки теоретически верное выражение для вероятности имеет вид 448 Р(т,— Л„( ь( т,+Л„) = 1, о.
(4.3.73) Выбор этих пределов при данном и вообще не определяется однозначно, но неравенства 0„( 0(х; Л)(0„+ можно в силу монотонности и непрерывности по аргументу Л разре- шить относительно Л и записать их в равносильном виде Л„(х) (Л(Л„+ (х), де Л„(х) и 34 (х) — две функции наблюдений (зависящие также от Э„и О+). Интервал (Л„, Л„') будет доверительным интервалом„соответствующим доверительной вероятности а. Применим этот метод определения доверительного интервала к оценке дисперсии (48) нормально распределенной случайной величины ~ с математическим ожиданием и, и дисперсией Х).
Отметим, что при больших п можно воспользоваться тем фактом, что оценка 0* имеет приближенно нормальное распределение с математическим ожиданием 0 и дисперсией (51). Затем можно поступить точно так же, как и в рассмотренном выше примере с оценкой математического ожидания. При конечных значениях п обычно поступают иначе. 15 зак. 956 449 Будет ли точное значение вероятности (73) равно единице или нулю— обычно неизвестно. Однако если повторно многократно извлекаются аналогичные выборки и по каждой из них вычисляются оценки ты то следует ожидать, что относительная доля случаев, для которых т", попадает в интервал 2Л„, будет примерно равна с4. Обращаясь к левой части равенства (72), тот же результат можно сформулировать иначе: при многократном повторении выборки объема и в относительной доле случаев, равной а, доверительный интервал 2Л„покрывает истинное значение и,.
Заметим, что при заданной доверительной вероятности а доверительный интервал (Л, Л+) можно выбрать разными способами, при этом его длина будет также разной. Обычно доверительный интервал выбирают так, чтобы длина интервала была минимальной. В общем виде задачу построения доверительных интервалов можно сформулировать следующим образом. Пусть известна некоторая функция 6 (х; Л), зависящая от данных выборки и оцениваемого параметра Л, причем последняя зависимость от Л является непрерывной и монотонной. Предположим, что распределение случайной величины 6 (х; Л) не зависит от оцениваемого параметра или других неизвестных параметров.
Если эти предположения выполнены, то, пользуясь известным распределением величины 6 для заданной доверительной вероятности и, можно найти такие пределы О„и 0„" (не зависящие от данных выборки), чтобы выполнялось равенство Р(6„(6(0„") =а. Можно показать, что случайная величина (и 1) О' имеет плотность вероятности у» с Й = и — 1 степенями свободы (3.3.45). Функция у» = (и — 1) Р*ЛР, как видно из (48), зависит от данных выборки (х) и от оцениваемого параметра Р. Однако плотность вероятности случайной величины Х»» зависит только от одного параметра— известного нам числа степеней свободы й = и — 1. Зависимость )(» от Р является непрерывной и монотонной.