Учебник_Бочаров_Печинкин (846435), страница 37
Текст из файла (страница 37)
1-распределение. Пусть С и Х~ — независимые случайные величины, причем С распределена по стандартному нормальному закону, а Хз имеет Хз-распределение с и, степенями свободы. Распределение случайной величины называется 1-распределением с и степенями свободы. Ьраспределение имеет плотность распределения (и) ( ) 4. Основные распределения маглеяааичесной сяагнистики 171 Значения функции 1-распределения и сх-процентных точек ((1 — о7'100)-квантилей 1~ „7що) 1-распределения приведены в [1], табл.
3.1а и 3.2. Далее, пусть ~н...,С„независимые одинаково распределенные случайные величины, подчиненные нормальному закону со средним пи Положим ц= — Ж+" +с-) ч =-% — Юа+ "-(с — 1)' Тогда случайные величины и и ( независимы, а случайная величина имеет 1-распределение с п — 1 степенями свободы (доказательство этого см. в примере 3). Г-распределение. Пусть Х', и Х, две независимые случайные з величины, имеющие Х -распределения с п~ и пт степенями свободы.
Распределение случайной величины 2 паХ! п~Х! носит название Е-распределения с парзметрамн пл и пт. г'-распределение имеет плотность распределения , (' и ~ -1- не '! г( — ",') г Я) (л > 0). Значения сг-процентных точек ((1 — сс7'100)-квантилей р~ доо) Г-распределения приведены в [1], табл. 3.5.
Распределение Колмогорова. Функция распределения Колмогорова имеет вид К(ю) = 2 ( — 1)~е тй * (л > 0). у= — ю Распределение Колмогорова является распределением случайной величины О =- зпР ф1)], О«я! где ((1) — броуновский мостик, т.е.
винеровский процесс с закрепленными концами Я(0) = О, г,(1) = 0 на отрезке 0 < ! < 1 (см. [11]). Значения функции распределения Колмогорова приведены в (1], табл. 6.1. Квантили распределения Колмогорова будем обозначать через Й . 172 Гл. 1. Оби1ие сведения ьеа-распределение. Функция ~со-распределения задается формулой 1т г(з-ь-), 1У А(х) = ~ е м* х т72* е-о 1 ( ) 1 О + 1) ~'--. (""." ) -'-. ("'~." )~ (х > 0). Здесь 7игз) модифицированная функция Бесселя.
ыз-распределение представляет собой распределение случайной величины 1 в о где ~(1) — броуновский мостик. Значения функции ьд-распределения приведены в [1], табл. 6Аа. Квантили оР-распределения будем обозначать через а„. Глава 2 ОЦЕНКИ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ Как уже говорилось в гл. К одним нз двух основных направлений в математической статистике является оценнвание неизвестных параметров. В этой главе мы дадим определение оценки, опишем те свойства, которые желательно требовать от оценки, и приведем основные методы построения оценок.
Завершается глава изложением метода построения доверительных интервалов для неизвестных параметров. 1. Статистические оценки и их свойства Предположим, что в результате наблюдений мы получили выборку Хи ...,Х„ из генеральной совокупности с теоретической функцией распределения Р(х). Относительно Р(х) обычно бывает известно только, что она принадлежит определенному параметрическому семейству Р(х; д), зависящему от числового или векторного параметра д. Как правило, для простоты изложения будем рассматривать случай числового параметра д и лишь иногда обращаться к векторному параметру 0 = (ды ..., де); в векторном случае будем использовать запись Р(х; ди,.., дь).
Для большей наглядности будем все неизвестные параметры (за исключением теоретических моментов тю а~ и рь) обозначать буквой д (снабжая их при необходимости индексами), хотя в теории вероятностей для них обьщно приняты другие обозначения. Наша цель состоит в том, чтобы, опираясь только на выборку Хы ...,Х„, оценить неизвестный параметр д. Оценкой неизвестного параметра д, построенной по выборке Хы ,Х„, назовем произвольную функцию д* .= д* (Хи..., Х„), зависящую только от выборки Хи...,Х„.
Ясно, что как функция от случайной величины (Хы..., Х„) оценка д* сама будет являться случайной величиной и, как всякая случайная величина, будет иметь функцию распределения Рв.(х), определяемую в дискретном случае формулой Рв (х) =2 Р(х~,.д)" Р(х,бд), где суммирование ведется по всем переменным хы..., х„, принимающим значения (бы..., бс) из ряда распределения наблюдаемой случай- Гл. 2. Оценки неизвестных параметров 174 ной величины Х и удовлетворяющим неравенству д*(хы ...,х„) < х, и в непрерывном случае — формулой Ге.(х) =- ~...~р(хб д) .
р(х„; д) г1х1 . г1х„, где интегрирование ведется по области, выделяемой неравенством д*(хы ,х„) < х. Как уже говорилось, иногда для того, чтобы подчеркнуть зависимость оценки от обьема выборки и, будем наряду с обозначением д* употреблять обозначение д*„ . Нужно четко представлять себе, что зависимость оценки д* от неизвестного параметра д осуществляется только через зависимость от д выборки Хы..., Х„, что в свою очередь реализуется зависимостью от д функции распределения Ге*(х) = Гщ(х; д).
Приведенное выше определение отождествляет понятие оценки д' (вектора оценок О' = (ды...,д~)) с одномерной (к-мерной) статистикой. При мер 1. Предположим, что проведено и испытаний в схеме Бернулли с неизвестной вероятностью успеха д. В результате наблюдений получена выборка Хи..., Х„, где Х, — число успехов в 1-м испытании. Ряд распределения наблюдаемой величины Х вЂ” числа успехов в одном испытании представлен в табл.
!. Таблица 1 В качестве оценки д* рассмотрим наблюденную частоту успехов д = — =гп, Р где и=Х, +...~Х„ представляет собой суммарное число успехов в и испытаниях Бернулли. Статистика и распределена по бнномнальному закону с параметром д, позтому ряд распределения оценки д* имеет вид, приведенный в табл 2. П Таблица 2 П р и м е р 2.
Выборка Хп..., Х„произведена из генеральной совокупности с теоретической функцией распределения Г(х) = Ф(х;д,о ), являющейся нормальной с неизвестным средним д. В качестве оценки д снова рассмотрим выборочное среднее д" =т =- — (Х~+...4Х ), 1 п, й Статистические оценки и их свойства 175 Функция распределения Ре. (а) задается формулой ,~ — д ( ( е(г, — (хс( ...Ек (< Однако вместо непосредственного вычисления написанного и-мерного интеграла заметим, что статистика 5' = Х( ж ... ч- Х„ распределена по нормальному закону с параметрами пд (математической ожидание) н па (днсперсия).
Значит, оценка д* = Я(п распределена также по нормальному закону с параметрами д и а,(п. П Разумеется, на практике имеет смысл использовать далеко не любую оценку. Пример 3 Как и в примере 1, рассмотрим испытания в схеме Бернулли Однако теперь в качестве оценки неизвестной вероятности успеха д возьмем д* = д*(Х,, ,Х„) = — . 1 2 Такая оценка будет хороша лишь в том случае, когда истинное значение д = =- 1((2, ее качество ухудшается с увеличением отклонения д от 1((2.
О Приведенный пример показывает, что желательно употреблять только те оценки, которые по возможности принимали бы значения, наиболее близкие к неизвестному параметру. Однако в силу случайности выборки в математической статистике мы, как правило, не застрахованы полностью от сколь угодно болыпой ошибки. Значит, гарантировать достаточную близость оценки д* к оцениваемому параметру д можно только с некоторой вероятностью и для того, чтобы увеличить эту вероятность, приходится приносить необходимую жертву — увеличивать объем выборки и. Опишем теперь те свойства, которые мы хотели бы видеть у оценки. Главное свойство любой оценки, оправдывающее само название «оценкагч — возможность хотя бы ценой увеличения объема выборки до бесконечности получить точное значение неизвестного параметра д.
Оценка д называется состоятельной, если с ростом объема выборки она сходится к оцениваемому параметру д. Можно рассматривать сходимость различных типов: по вероятности, с вероятностью единица, в среднем квадратичном и т.д. Обычно рассматривается сходимость по вероятности, т. е. состоятельной называется такая оценка д' = д(,, которая для любого е ) 0 при всех возможных значениях неизвестного параметра д удовлетворяет соотношению РПд*(„) — д~ > Т 0. Отметим, что правильнее было бы говорить о состоятельности последовательности оценок д „, поскольку для каждого значения и объема выборки оценка д(„может определяться по своему правилу. Однако в дальнейшем мы будем употреблять понятие состоятельности Гл.
2. Оценки неизвестных параметров 176 только для оценок, построенных по определенным алгоритмам, поэтому будем говорить просто о состоятельности оценки. П р им е р 4. Оценка д* из примера 1 является состоятельной оценкой неизвестной вероятности успеха д. Это является прямым следствием закона больших чисел Бернулли. Пример 5.
Пусть выборка Хи,..,Х„произведена из генеральной совокупности с неизвестной теоретической функцией распределения Р(х). Тогда в силу закона больших чисел выборочный момент пть = — (Х~ ч- ... ж Х„) сходится к теоретическому моменту шь = МХ и, значит, представляет собой состоятельную оценку пгь. Аналогично, выборочные дисперсии оз' и вз* и выборочные центральные моменты рь являются состоятельными оценками теоретической дисперсии о и теоретических центральных моментов рк. Отметим, 2 что поскольку в этом примере не предполагается принадлежность теоретической функции распределения Г(х) какому-либо параметрическому семейству, то мы имеем дело с задачей оценки неизвестных моментов теоретической функции распределения в непараметрической модели. ьл Пример 6 Выборка Хь,Х„произведена из генеральной совокупности с теоретической функцией распределения Г(х), имеющей плотность распределения Коши 1 р!)= к)1 4 !х — д)з] с неизвестным параметром д.
Поскольку плотность распределения Коши симметрична относительно д, то казалось бы естественным в качестве оценки д" параметра д взять выборочное среднее д* = т = — (х~ -ь ...-ьх„). 1 и Однако д', как и сама наблюдаемая случайная величина Х, имеет распределение Коши с тем же параметром д (это легко установить с помощью характеристических функций, см. часть 1, гл.
8, параграф 3), т. е. не сближается с параметром д, а значит, не является состоятельной оценкой параметра д. П Из курса теории вероятностей известно (см. часть 1, гл. 7, параграф !), что мерой отклонения оценки д' от параметра д служит разность Мд' — д. В математической статистике разность Мд" — д = о1д) называется смешением оценки д'. Ясно, что д(д) = ~ ~д'(х1,...,х„) — д) Р(х1,д) Р(хкд1д) в дискретном случае и 51д) = )...) )д"1х1,...,хв) — д) р(х1, д) р(хп; д) дх1 .
г1хв в непрерывном, где суммирование или интегрирование ведется по всем возможным значениям х1,.... х „. 177 !. Статистические оценки и их свойства Оценка д' назывзется несмеи(енной, если д(д) = О при всех д, т.е. ее среднее значение Мд* совпадает с оцениваемым параметром д.















