Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 15
Текст из файла (страница 15)
Так как случаи 1: = 1, 2,.... я несовместны, то искомая вероятность д равна сумме де: Ы = Ч1 + Че —, ' Чн. (б) х,> е, Следовательно, все х, лежат между е и 1. Вероятность такого случая равна (1 — е)". Так как всевозможные способы чередования индексов у х, равновероятны, то вероятность события (8) равна — е)н 1 (9) Если, далее, 7е> 1, то мы положим )е = Ь+ 1. Тогда (7) распадутся на такие неравенства, которые содержат лишь х,,..., хл: 0<х,«... х„ .... (; (10) н закне, которые содержат лишь х„,,..., х,: хе+ < ха+ с ...
: х < 1, ) Хл+, < е + Ьб. (11) Неравенство ха ( х„+,, связываюШее хл и хь+ы является следствием (!О) и (11), н поэтому его можно отбросить. Собы1ня (1О) и (1!) относятся к неперекрывающимся интервалам и потому независимы. Следовательно, вероятность события (7) равна произведению вероятностей событий (1О) и (11): (12) й = ул+1 = Рлгм Вероятность гл события (11) можно определить совсем просто. Метод тох же, что и при вычислении вероятности события (8); в результаче получим 1'1 — — (1 - — е — 11о)~ (13) Итак, нам осталось только вычислить де.
Величина д„пред- с1авляет собой вероятность события 0<х,<хе«... х„<1, х„ — (ее — 1)б > е, х — (1 — 1)6 *и е для 1 с иет Пусть сначала 1а = !. Тогда мы имеем лишь неравенства Х1 ( ХЕ < ... ( Хн ( 1, (8) 90 Рлп 1!'. Оценки функций распределении, среднее знинений и дисперсий При этом предполагается, что 1 — е — Ьд» О. Если это не так, то событие, соответствующее последнему неравенству в (11), является невозможным и поэтому ен = О. Вероятность р„события (10) равна «+е эие ° - <л — пе (14) Для Л =- 1 находим без труда Р« Это предположение можно легко проверить полной индукпией по Ь. Для й = 1 оно верно. Предположим, что о верно для некоторого Ь» 1. Согласно (!4), имеем «,ы ««-е «'Иь Рне« = ~ еех« ~'1хе ~ есхз ° ) с(хи+1. Если вместо х„х,,..., хне, ввести новые переменные у,, уе ..., ун по формулам ху — х, -!- ит „ то окажется, что Рлее = ) л еех« о (1б) ье — и, ~м — е, «Ье-и, Я =1 ау«1й,уе...
1йлн. (17) а и, У«-1 Если положить е + Й вЂ” х« — е, то можно заметить, что ин|еграл В имеет точно такой же внд, как и Рн в (14), но только с заменой а на е'. Следовательно, ',согласно индуктивному предположению, Л -= —,е'(с' -1- ЛЬ)н-т =; (е -, '6 — х,) (е '- (й 4- 1) д — х )"-й (!8) н-т Если вычислить р, и р,, то возникает Рн = '-( + йд)"-'. предположение, что (15) Ф' 16. Оценки функций ригпредеяения Если (18) подставить в (16) и в качестве новой переменной выбрать а + (Ь + 1) Ь вЂ” хы то интегрирование станет легко выполнимым. Результат е )ол+т =-(Ь ! (е+ (Ь+ 1)о) самую форму, что и (15), по только с заменой Ь на завершается доказательство справедливости форму- имеет ту же Ь + 1.
Этим лы (15). Если (13) и (15) подставить в (12), то получим ип (е + Ьд)л — 1 (! е ЬЬ)п — л (!9) (9), эта формула справедлива также и для Ь = 1. (3) и (6) получаем результат, впервые найденный и Тинги' Согласпо Накоисц, из Бернбаумом и Я ~ е(е 1 Ьб)л-л (! е ЬЬ)п-л л-о~Ь) (20) ~де 6= —. Верхний предел суммирования Н задается условием 1 — е— — ЬЬ~ О. Следовательно, Н является целой частью п(1 — е): Н = (п(! — е)1.
(22) Прп больших и вычисление суммы (20) очень утомительно, поэтому для больших я лучше применять асимптотическую формулу, выведенную Н. В. Смирновым, согласно которой (23) т Точная фориула для распрсделеиия й при конечных и впервые дана )(. В. Оиириовыи в 1944 г. Си. его статью вПриближепис законов распределеиия случайаыл величии по эмпирическим даииыиь Усп, матея. наук, (1О), (1944), 179 — 906.
— Прим, перев. Для каждого я и для заданного )т (иапример, р = 0,01 или л) = 0,05) можно найти такую границу е, для которой (;) =)8. При малых а пользуются формулой (20), а прп больших п — формулой (23). В табл. 4 для некоторых зиачепий и и )8 указаны точиые и асимптотические границы е, по Берпбауму и Типги.
Из этой )аблицы видно, что уже при и = 50 точпые и асим)потические границы мало отличаются друг от друга. Так как асимптотические границы больше соответствующих точных границ (см. табл. 4), то при любом конечном я вероятность того, что А превзойдет асимптотическую граиицу, будет меньше Р. Следовательпо, за- йх Гл. Хр. Оценки функиии распределении, греднил знпвении и дисперсий мена точных границ асимптотическими изменяет доверительный интервал для г! в сторону увеличения его надежности. Пайденная граница е позволяет сформулировать односторонний критерий для проверки гипотезы, согласно которой функция распределения раш>а Х'(8). Л именно если максимулг г> разности Р' — с„превг>ггог)ггпг е, гпс предположение, что функция распределения равна Р'((), должно быть отвергнуто.
Этот критерий мы будок( назывнп й-крнтернем. Урове>гь значимости г>-критерия равен р. Если величины х и ( заменить на ! — х и ! — ( ссответствсн>ю, то разность Р— Р„изме>>ит знак, вследствие чего получится одвостороинпи критерий с протигоположной стороны: гипогетическу>о функцию распределения следует отвергнуть, сслп .Л' = шах (Є— Р) > е. Уровень значимости снова раасн р е-Я"".
Если этими двумя критериями воспользоваться одновременно, то получится двусторонний критерий Колмогорова. Согласно этому критерик>, гипотетическая функция распределения отгергается, если максимум разности (Р— Р„,' окажется болыпс е. Уровень значимости такого критерия, очевидно, ие прегссходпт 2>э'. При малых п вполне достаточно в качестве уровня значимости выбрать 2р: это лишь увеличит надежность критерия'. Прп больших и приближепцук> формулу для уровня значимости можно уточнить, воспользовавшись асимптотической формулой Колмогорова; ( !)> — 1 е — в>'пп >-1 Этот ряд сходится очень быстро.
Для практических целей можно ограничиться его первым членом 2,— впг' которь>й соответствует грубому правилу, сформулирока>пкму выше. В табл. 5 указаны значения е для 2)э = 0,0! и 0,05. Практически критерием Колмогорона пользу>отса следующим образом. Сначала определяют эмпирическую функцию распределения Р„(й). Затем, при зада>гном р, по табл.
5 находят е и строят полосу, границами которой служат ступенчатые линии с ' Действительно, пусть р(птах (Р— Хп) ) е) = р, тогда, ьак поназано выше, р(ш(п (Р— Рн) ( — в! = р. Если с помощью этого же е построить лиусторонний критерий, то соответствующий уровень значимости букет Ривеп веРоЯтиостн объслниси на событий: п>вх(Р— Хи) >в и ппг>(У вЂ” Ри] ( ~ — е. Так как эти события не являются несовместными, то вероятность ик обьслинения испыие суммы ик вероятностей, т. е.
меньше 2р. — Прим. перев. 8 77. Порядковые статистики уравнениями у = У„(4) + е и у= Рч(4) — е. Предположительно, эта полоса целиком накрывает истинную кривую распределения с уравнением 37 = Р(1). Литература к 5 16 К о 1ш о 8 ог о 14 А., Ретегпппагхопе еюрпчса д| ппа 1еяяе 61 йвап'- Ьп|аопе, И(огпа1е 1вИ.
1(а(. АФФпап', 4 (1933), 83. С и и р н о в Н. В., Об уклонениях эмпирической кривой распрекеления, Матем. сб., 6 (48), (!939), стр. 3. См и р н он Н. В., Приближение законов распределения случайных величин по эмпирическим данным, Усп. матем. наук, (1О), (1944), !79 — 206. Р е 1 1 е г %., Оп ьье Ко1шокогоч — Вюппоч Иппх 1Ьеогешв гог ешрИса! йвхмьпх(опв, А|ш. Мааь. В(атлас., 19 (1948), 177.
В|го Ъапш Е. %. апд Т(пяну в; Н., Опе-в!бед сопХЫепсе соптопю |ог |ИвьНЬпмоп йшсь(опв, Ашь Мяхь. Всвх(ах., 22 (196!), 692. В | г п Ь а и ш Е. %ч ()п хьв ровса ог а опе-аЫеб тена оГ ГЦ 1ог сопцююпз ргоьаь|иху 6шсх(опв, А|ш. МаХЬ. ВтаМвз., 24 (1963), 484. 9 17. Порядковые статистики Пусть снова х„..., х„— выборка, состоящая из я независимых наблюдений случайной величины ш с непрерывной функцией распределения У(Ф). Если все х, расположены в порядке возрастания их величины и члены такой возрастающей последовательности обозначены х("1: х(|) < х('1 «...
х(">, то каждый из х(ь) называется порядковой статистикой, а соответствующая возрастающая последовательность — вариационным рядом. Примеры порядковых статистик: хц! — наименьшее значение, х«'! — наибольшее значение из всех хо Если я — нечетное число: п=2т — 1, то х( ! называется выборочной медианой, Выборочная медиана является приближением медианы 8, которая определяется как решение уравнения ©-2 Для распределения с симметричной плотностью у =1(1) и, в частности, для нормального распределения медиана ь совпадает со средним значением х; поэтому выборочной медианой х( 1 = Я можно в этом случае пользоваться в качестве удобной оценки для х.
В4 Гл. л'>с. Оценки дункций риспределения, средних значений и дисперсий Аналоги >ио если п = 4е — 1, то можно определить две выбоГн>цные квартили: г, = а< > и г, = х<">, Эти выборочные кеартили и выборочная медиана разбивают вариациоиный ряд х~'>,..., х<п> иа четыре части, каждая из которых содержит по г — 1 величин. При больших я выборочные квартили близки и квартиллм ~, и ьз соответствующего распределения, которые опрсдсля>о>ся как решения уравнений Р(4,) =,-' и Р(~,) =-,'-, Точно так >ке можно определить выборочные секстили У, и л'з, которые служат приближенными значениями секстилей и>, и т>з, определяемых как решения уравнений р'(з>,) = -„; и Р(з>з) = — „..
В случае нормального распределения з), и т>з приближенно равны л — с и х + ~г, так как если Ф(ж) — функция нормального распределения с нулевым средним значением и единичной дисперсией, то Ф( — 1) = 0,16... и Ф(зг 1) = 0,84,... Поэтому половина расстояния между выборочными секстилями, построенными по выборке из приближенна нормального распределения, может быть использована как удобная предварительная оценка квадратичного отклонения к.