Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 16
Текст из файла (страница 16)
Оценку для о. можно построить также и с помощью выборочных киартилей; к этому мы вернемся в ~ 20. Для того чтобы можно было судить о точности этих оценок, пужио найти фупкции распределения 0<п>(!) порядковых статисгик х®. Значение О<н>(Г) в точке ! определяется как вероятность события х!и> ( С. Оиа равна вероятности >ого, что наимепьшие Л из всех и случайных величин х; окажутся меньше й Если )е'„— вероятность события, которое заключается в том, что среди всех х, имеется ровно й наблюдений, по величине меньших 0 то, согласно ~ 5 (2), ( ) ( ге(!))я(1 р~(е)1п-я Ото>ода бцсд(!) = ~РП + УРНц-Х + + )Рп.
(2) 1!со>авлевная задача решена. Однако это решение исскольж> неудобно. Поэтому мы предположим, что Р(!) диффереицируема, обозначим д"(!) = ~(!) д 1," Ппрпдкпемс гп~игпистики и, дифференцируя (2) по 1, вычислим плотность вероя ~настей д1 1(1) =- )р„+ )д„, +... + )д;,. д ( 1 ) 1 1 3 1 ( 1 ) ) 1 ! Г ( 1 ) ! 1 ( 1 ) ( 3 ) Произведение Г» ' (! — И')и "достигает наибслынего значения в точке и — 1 )! — 1 ' Пусть этот случай осунгестнляется при 1 = 1». Если обозначим И'о = И'(го) =;,—, 1о-=Во) И = И'о+ Л 1о из (3) получим Х,л-тг Х» -л! д(л)(1) = д(»)(1.)(! -'.
— 3 1!— ~о 1 со Уо ((редположим теперь, что И и и — И недики, и исследуем по- ведение трех сомножителей (4) в окрестности точки 1 = 1,. Первый сомцожитель дм)(10) = и(и — 11! (а 1)л-л(н И и-л (И вЂ” 1)! (й 1»Р („,) (~,) о (4) можно аппроксимировать с помощью формулы (лнрлннгн и! и" ес»)(2лп, Полу ~всм и — 1 а дев(")-")(В.(И вЂ” 1)(. И) ~ =).,--~' Второй сомножнтель прологарнфмнруем н разложим н ряд )и СГ = (И вЂ” !) )и ) ! -~- †; ! + (я — И! )и ~ ! — †' .
) = Л .ч .Т се» ! ~ Х Хл =(И ()(-, -"'з(+(и Ы! -',, ", ! Г»„НГ;~ ~ 1 — Р„1(1 — 1'„Г 1 ., (и — !Р з (И вЂ” 11(и — И) Прн дифференцировании гсе члены, кроме первого, взаимно сни можа~отея н остается лишь Ва Гт. 1У. с>ненни фчнниий риспрсдслснин, срсднит зничснвй и дисперсий Отброшепиые члены являются величинами порядка ие виже, чем пХв, следовательно, при малых Х остаток будет меньше главного члена, который является величиной порядка яХ'-'. Если теперь в главном члене (и — 1)' заменить па пв(п — 1) (при больших и приближенная т)юрмула от это>о ие ухудшится), то получим асимптотическу>о формулу для второго сомиожителя: 2 их ° в Третий сомножитель (4) в окрестности точки / = /, можно замепить единицей.
Поэтому, согласно (4). (5) и (6), получаем 1 д<"1(/) —, / е 1 2>т (7) (8) Если произведение аХ велико сравпительио с едипицей, то правая часть (7) счеиь мала. Можпо доказать, по в этом случае левая часть также мала. Тот факт, что интеграл от левой части мал', легко следует. впрочем, из закона больших чисел, а при практических приложеииях только с таким интегралом и приходится иметь дело.
Теперь мы должны егце выразить Х через й Так как разность / — /в мала, а /р диффереицируема, то разпость Р— Р приближенно Равна (1 — /в)/в. Следоеателыю. вместо (?) хсо>кио запи- сать 1 ды1(/) —. / е — о (9) 1 1 )/1/ — 1Н вЂ” 11 о/о н1 н- 1 /о (1о) Для выбороч>и и медианы / о>сюда находим > зиссь интор иисс> в визу ив то> риз от дп>д) ио токой огьтвсти ивисисиин С, сдс сск нспиио срввиитспьно с стииивсй. — /!рил. псрсв. Форму.ш (9) озиачаст, что если А и и- — /> велики, то порядковая статистика асм лвллетпсл асимтпо>иическтт нормальной слд>ии/ной величиной со средним значением /и и квадратичнылс от- клонением й' 17. 7!орядкоеьее станшстики 97 В случае нормального распределения с нулевым средним значением и единичной дисперсией 1а-— -(> и -= )72я, )е следовательно, (11) Для крайних порядковых статистик, >, е.
для статистик, у кс>горых малы либо Ь, либо и — Ь, аснмнтотическая оценка распределения более 2 рудна. Этим оценкам посв>нцены важные труды Фишера и Типпета, Фрешс, Мизеса и Гумбелаг, Читателю было бы полезно познакомиться с докладом Унлкса о порядковых статистиках [%11)сз Я. Я., Вц11. А>пег. Ма111, Яос., 54 (1948))а. Для пары порядковых статистик хы>, зчг> плотность вероятностей 1(м, н) может быть вычислена так же, как для одной порядковой с>атистики.
Если, например, мы хотим найти совместное распределение наименьшего и наиболынсго наблюдений в выборке, ко> и дин>, то для этой цели можно воспользоваться тем обстоятельством, что вероятность одновременного осуществления событий х)1» и и х1н> < о (те< о) анна [Г(о) — р'( )!". О~сюда дифференцированием по м и о получим искомую плотность вероятностей: [(и, о) = п(п — 1) [Р'(н) — с'(м))н 21(м)7(о).
(! 2) Одной из важных функций от порядковых ста>нстик, встречающейся во многих приложениях, является размах И7 = Х1н> — ХО). (13) Функцию распределения размаха О(1) могкно получить интегрированием равенства (12): а~1 П(1) = р()>(г <1) -= ~~ 7!м, н) 2)исЬ = — ~1(м~[(и, о) 11н. Ома-н .1 Неопределенный интеграл от Г(м, н) но о рааса, очевидно, Р (м))н — 1 7(н) ' См.
также С м н р н о и 11. В., Предельные расарсдсленяя для членов ннрнаннонного ряда, Труды >йатематнч. нн-та АН СССР, 95 (1949) Прим. перев. Законченную теорию предельных распределсннй крайних членов нарнапнонного ряда дал Б. В. Гнеденко(ахш. ог >цвай. 144), 11943), 423 — 463]. — ПРим. Рег>. В. Л. ван дер Варден ° !062 аа 1'л 1р, Оненки функции распределения, среднил значений и дисперсии Если подставить пределы интегрирования и и и + 1, то получим «че ) 1(и, о)Ыо == я(Р(и + 1) — Р(и))п л 1(и), и следовательно, Н(1) = и ~ гр'(и лг 1) — с'(и))п-т1(и)сЪ.
(14) 5 18. Выборочное среднее значение и выборочная дисперсия Среди постоянных, которымн характеризуется функция распределения, важнейшими являются среднее зничение или математическое ожидание н дисперсич (2) Положительный квадратный корень нз дисперсии называется квадратичным отклонением о. Мы предполагаем, что оба интеграла (1) и (2) сходятся. Как оценить по результатам наблюдений х н о? Пусть имеется выборка (х,,..., х„), т. с. имеются п наблюденных значений х,,....
х„случайнои величины т. С точки зрения теории вероятностей х,, „х, являются независимыми случайными величинами с однон н той же функцией распределения Р(1). Г1остронм арифметическое среднее выборки М = — -.(х, + ... + т„) = — х, + ... + — х,. 1 1 1 (8) (4) М называется выбора~ныл средним значением. Часзо вместо М пишут х. Величина М является случайной. Ее среднее значение равно ф 1ок Виаеронное среднее ононенис и еидоронноя дисперсия а дисперсия, согласно Ь 3 (15), равна ое ос ое о.е сел~ = — е + ' ' ' +— ие ие га н (5) Таким образом, дисперсия М при больших и оказывается значительно меньше дисперсии отдельного наблк>денни хр Так как по неравенству Чебышсва (З 3 В) модуль разности М вЂ” х может являться с большой вероятностью лишь величиной по- рядка О им= )'п ' то М является полезным приближенным значением для х.
Это приближение тем лучше, чем больше п. Точно так жс для о.е имеется приближенное значение 1 я„'= ~~ (х; — х)'. (6) Математическое ожидание я',, очевидно, равно гге. Формулу (6) можно применять лишь тогда, когда х точно известно. Этого, однако, в большинстве случаев не бывает. Поэтому здесь может помочь замена х на М. Но тогда, как показывают расчеты, выражение (6) несколько уменгшается.
А именно, для произвольного а имеет место тождество ~" (х, — М)а = Ъ'(х, — а)е — п(М вЂ” а)', (7) которое доказывается так: ~ (х, — М)':=- ~ [(х, — а) — (М вЂ” а))е = ~' (х, — - а)е — 2 ~ (х, — а)(М вЂ” а) + п(М вЂ” а)е = ~" (т, — а)е — 2п (М вЂ” а) (М вЂ” а) -1- п(М вЂ” а)з = '~ (х, — а)е — п (М вЂ” а)е Пг>дожив в (7) а =- х, получим (., — М)е =, (х, — х)е — (М вЂ” х)'.
(8) яи — ч' (х М)е 1 п — 1 (9) Е:слн в (6) т заменить на М, то, как показывает тождество (8), правая часть (6), вообще говоря, уменьшится. Чтобы компенсиронать это уменьшение, сстсствешю сумму в левой части (8) разделить пе па и. а на и — 1. Таким образом, получасм )00 Гл. 7)г. Оценки функций распределения, средних значений гг дисперсий Вычисляя математические ожидания правой и левой частей (8), найдем юа (и — 1) Я(ая) = и гз — и -- = (и, — ! ) а з или Р(ет) х (10) Следовательно, знаменатель и — 1 в (9) обеспечивает равенство математического ожидания аз величине о'а. аа называют выборочной дисперсией, а в — выборочноглг квадрапгичным откяонениелгт.
Для упрощения вычислений вз можно использовать тождество (7). Целесообразно поступать так: 1. Сначала числовые значения х, следует округлить такич образом, чтобы разность между наибольшим и наименьшим наблюдениями имела две значащие цифры. Практически это округление не окажет на г' никакого влияния. 2. Затем у всех округленных х, можно отбросить запятую, т.
е. помножить их на такую степень числа 10, чтобы все хг стали целочисленными. 3, По округленным значениям хг с помощью формулы (3) следует вычислить среднее М с одним запасным десятичным знаком. 4. Затем из интервала, в котором заключены все хо следует выорать «круглоез число а и образовать разности хг — а. Контроль: сумма этих разностей должна быть равна п(М вЂ” а). 5. Разности хг — а не более чем двузначные целые числа, следовательно, их можно возвести в квадрат либо «в умеэ, лись с помощью очень короткой таблицы квадратов чисел.
6. После э~ого вычисляют ~ч'„(хг — а)',авалем, по формуле (7), .я,'(хг — М)з и, по формуле (9), а' (при вычислении ее результат округляется до целых чисел)з. 7. Для контроля полезна формула (7) с а = О: ~~(хг М)а = 'Ух~ и Мз (1 1) Пример лу. Осадки за 90 лет в Ротемстедс (по кингс В. А. Выжег, ЯтвФЬь!св! лхеььодз Гог Возовгсь Чгог)гсгв, 4 )4). В первом столбце указано количество осадков х (в дюймах), по втором — соответсгвующее количество лет )г, в течение которых наблюдалось данное количество осадков. В кзчестве прпближеппого значения для выборочного срсдпсго выбраио а -= 90. третий столбец содержкт разиости х — а, четвертый — й (х — а], пятыи а (х — а)*. ' Эта термииология пе является общепринятой.