М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 4
Текст из файла (страница 4)
Заменяя Р(х)(1 — Р(х)) ее нанбольшпм возможным значением !/4, зту завнснмость мы устраним, но ценой огрубления оценки. 3. Статистика Колмогорова. Рассмотрим следующую меру расхождения з.ф.р. н теоретнческой ф. р. Р„(Х)=-зцр»Е„(х. Х) — Е(х)1, л называемую статистикой Коллиогорова. Л е м м а. Распределен!!в веронтностей сл. в. 0„(Х) нв зависит от гр. р. Р(х) =У(Хг(х), если только Р(х) — непрерывна. Д о к а з а т е л ь с т в о. Мы покажем, что распределение сл. в.
0„(Х» совпадает с распределением 0„(У), где г'= (Уг,..., У„)— вектор нз независимых равномерно распределенных па [О, 1) сл. в. Предположим вначале, что Р(х) строго монотонная н Е '(у) — обратная к пей функция. Случайные величины Уг= =Е(Х,) иезаз кимы, и их обшая ф.р. при О~у<1 равна )»(у) =У(у!<у) =У(Е(Х!)< у) =У(Хг(Е-г(у)) =Р(Е '(у)) =у, т. е. У; равномерно распределена на (О, 1). Для э. ф. р. 1с (у; т'), Т=(уь ..., У ), имеем прн 0<у<1 Ф л 1 %1 1 %'Ч ( <) ( <) = — э ~(х,~;,» =Р„(Р-'(р); Х). 1 %~ 1 Отсюда получаем эцр !Р„(х; Х) — Р(х)! =- эцр !Р„(Р (У)~ Х)— хо<хм>а а<а<~ — Р(Е-'(р))! =- р Р„(р; у) — р!. а<ась (9) нетрудно обнаружить, что проведенные выше рассуждения для случая строго монотонной Р(х) сохраняются без изменения н для общего случая, ° Практическое значение доказанной леммы заключается в том, что можно выбрать распределение вероятностей Р(х) нз соображений наибольшей простоты численного расчета вероятностей У(Р„>б) =а н табулировать набор значений (л, б, а), Напри.
мер, если взять Р(х) =1с(х) =х, 0~~~(1„то расчеты сводятся к вычислению объема и-мерной области, высекаемой в еднннчном кубе условием эпр !Р„(х; х,, х,, ..., х„) — х!>б. Щк~! Как бы трудоемки нн оказались вычисления, но, проделав нк однажды, мы обеспечиваем возможность в случае любой непре- 19 Остается заметить, что в точкак х, где Е(х) 0 нлн Р(х)=1, с вероятностью 1 Р„(х; Х) =Р(х), а ванду монотонности Р„н Р по х также н зцр1Е„(х; Х) — Р(х)) по множеству всех таких х равен О. Таким образом, правая и левая части соотношения (9) с вероятностью единица равны 0„(Х) н Р„(т') соответственно.
Следовательно, распределение Р„(Х) для сл.в. Х, распределенных по закону Р(х), совпадает с распределением 19„(у) для сл.в. 7, распределенных равномерно на отрезке (0,1). Если Р(х) не обязательно строго монотонна, то положим прн 0<д<! Е-' (у) =*зцр (х: Р(х) =у). Заметна, что супремум достигается ввиду непрерывности Е(х) н что поэтому прн 0<у<1 хя-Р-' (у) ьь Р (х) ~~(у, рывной ф.р. Р(х) указать а и 6 такие, что при данном и выпол- нено:оотношенпе У4(зцр 1Р„(х; Х) — Г(х) ~ >6) =а. (10) О,О1 0,02 О,О5 О,! 0.2 0,16913 0,25205 0,23494 5 . 0,16547 1 0,21012 Из рис.
1 н табл. 3 с учетом равенства зцр~Р„(х; к') — Ф(х)! = зцр 1г„(х; к) — Ф((х — йр)/Уйр(1 — Р))) > хс =(хг — йРУЙ~йР (1 — Р), находим 1)„=0,095. Полученное отклонение надо рассматривать как умеренное, если взглянуть на (11), откуда вытекает, что отклонение на большую величину 0,165 и то происходит в среднем в одном случае пз пяти. ф А. Н. Колмогоровым было найдено предельное раепределеине статистики В, при н-~-со: 11птХ" ~)ха 0„< у) =К(у), у > О, а» Ряд для К(у) быстро сходится, и трн члена этого ряда уже могу~ обеспечить достаточную степень точности. Таблицу функции Иначе говоря, полоса Р„(х; Х) +6, — оо(х(+со, ширины 26 с границами, строящимися по выборке, с вероятностью 1 — а заключает внутри себя неизвестную ф.
р. Р(х). Таблицы для значений л=1(1)100 (от 1 до 100 с шагом 1) и а=0,01; 0,02; 0,05; 0,1; 0,2 приведены в [1). Пример 1 (продолжение). Для биномнальной сл. в. Х с параметрами 1=250, р=0,1, п=40 нормированную сл.в. Х» =(Х вЂ” йр)авгур(! — Р) можно в силу теоремы Муавра — Лапласа с известной степенью приближения считать распределенной по нормальному закону с параметрами 0 н 1. Учитывая сказанное, можно полагать, что для Х' соотношение (10) будет выполняться с некоторой небольшой погрешностью.
Выпишем нз табл. 6.2 (1) несколько пар значений а, 6, для которых Р(1144)6)* ш К(р) можно найти в (1) (табл. 6.1). Выпишем несколько значений а = 1 — К (у): ,и! 1,52 ! 1,08 1,23 1.63 (12) 0,90 0,65 0,60 0,08 0,02 0,84 0,8 0,2 0,4 0,6 Пример 1 (иродолзсение). Имеем гл 1)„= г40 0,095 0,60. Из первого столбца (12) получаем, ч.о примерно в 84 случаях из 100 следовало бы ожидать отклонее1:е 0,60 или более, т. е. мы имеем дело с довольно «удачными» р1зультатами наблюдений.
Полезно сравнить точные значения для а, представленные в (11), со следующими приближенными, получающимися нз (12): 0,02 0,2 0,06 6 = у)~л 0.26тт4 0,21605 0,24035 о.)тотт 0,19449 Итак, уже при а=40 приближение ф.р. 1), с помощью асимптотической формулы очень хорошее. Абсолютная ошибка в определенни б, такого, что У(0«»>б) а, для а от 0,01 до 0,2 составляет около 0,005; относительная ошибка в худшем случае равна примерно 2,2%. 4.
Выборочные среднее и дисперсия. Поскольку э.ф.р. Р„(х) оценивает теоретическую ф.р. Р(х), то можно ожидать, что для функционалов Т(Р) от Р оценкой будет служить значейие Т(Р ), вычисленное по э. ф. р. Р„. К числу важнейших функционалов относятся среднее и дисперсия: Т,(Р) =ййХ„Т,(Р) =ВХ1. л Т,(Р„(х; х))= — ~ х~=х, е лм' 1 л л Т,(Р„(х; х)) =- — д (х1 — х)«= — ~„х; — х =.з„ л « 1 1 1 Поскольку Р„(х; хь хм.„,х ) отвечает дискретному распре. делению с вероятностями 1/а в точках хь то или, переходя к случайным величинам, н Тг(Р„(х; Х»= —, ~)~Хг=Х, т,(Р„('. Х»= — 'У(Х,— Х)г= — ' Ч~ К' — Хг=4.
н,йЫ н й 3. ПОРЯДКОВЫЕ СТАТИСТИКИ В ЗАДАЧАХ ОЦЕНИВАНИИ 1. Порядковые статистики. Расположим наблюдения ХЬ Хг» ° ° ° э Хл в порядке возрастания и перенумеруем их заново: х~ц~=х!г!»(... ~хыь (2) Фактически х<о, 1=1, 2,..., л, — действительные функции менных (1): х!н ппп(х!, хг, ° ° .,х ); х!г!=игах(пб!п(х!„...,х! !, х+!,...,х,), г=1,...,п); пере. х<,!=игах(хг,..., х„). Функцию от результатов наблюдений принято называть статистикой. Статистики х<ы, А=1, 2,...,н, называются порядковыми, последовательность (2) часто называют вариационным рядом. При переходе от наблюдений (1) к случайным величинам Х, Х, ..., Х„ терминология сохраняется: Х<сн определенное тем же способом. что и хо„ называется Й-й порядковой статистикой, а Ха!<Хгг><...
<Х1„! (4) — вариационным рядом. Отметим, что э.ф.р. зависит от наблю- дений через порядковые статистики: Р„(х; Хь ..Х„) =Р„(х; Х<О...Х<„!). 22 Выборочные среднее Х и дисперсия Згг, как мы увидим в дальнейшем, оказываются во многих случаях хорошими и, в некоторых отношениях, оптимальиымн оценками теоретических значений.
Иногда бывает желательно подчеркнуть зависимость порядковых статистик Хго от л. В таком случае наряду с обозначениями (4) будем употреблять следующие: Х>л=Х<0, >=1, 2,...,н. (5) Порядковые статистики широко используются в статистических задачах. Рассмотрим некоторы примеры. 2. Оцениванне содержимого урны. Предположим, что урна содержит неизвестное число шаров М, занумерованных числами от 1 до М. С целью определения М совершается повторный выбор с возвр: щеннем объема а. Пусть х>, хв...,к„— номера извлеченных ша ов. Естественно н качестве оценки Р предложить максимальное из наблюдений: >9 = х>и) (6) Шуточную интерпретацию этой задачи дает В.
Феллер (2), предлагая для оценки числа зарегистрированных в городе авто. мобнлей встать на перекрестке и записывать номера проезжаю. щих автомобилей. Приведенные ниже результаты моделирования этой задачи с помощью таблицы случайных чисел показывают, что предлагаемая статистическая процедура приводит к хорошим оценкам. Пусть М=10000, а=10; по табл. 7.1,а [1) полученыследу>ощне значения х<,> для 1О независимых выборок х;, ..., х,: 9590, 8947, 9533, 9901, 9511, 9885, 7990, 9776, 9055, 9352. (7) Сл. н, У>=Х> М-' е хорошей степенью приближения могут рассматриваться как равномерно распределенные на (0,1], так что У(Х>„>(Му) =У(У<„>(у) = (>У>(У>(у) ) "ян у", 0(у(1, Йля ряда значений у и а=10 имеем О,тч 0,79 0.03 .У(>'>„> < д) 0.00 о,> о.о> Отсюда можно сделать заключение, что в среднем в одном случае из 1О в качестве оценки М=10000 будет появляться значейнс Х(7900.
Поэтому появление в (7) з»ачення 7990 не следует считать особенным. Совершенно ясно, что оценка (6) всегда дает заниженный результат: >9(М. Вычисляя > н 541'<„> ян ~ у»у"->с(у.—.. —, и ->-1 23 найдем 3. Оценка параметра равномерного распределения. Пусть (1) †выбор нз равномерного распределения на [О, 6] с неизвестным 6, (3) — соответствующие независимые равномерно распределенные сл.в. Поскольку МХ» 6/2, то для оценки 6 можно предложить статистику Т(Х) =-2Х =- — ~~) Х;.