Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 17
Текст из файла (страница 17)
Чаще выборочной дисперсией иазывают всличииу д.(хг — М)'/и, которая раааа дисперсии соответствующей эмпирической фупкцяи распределения. — Прим. перев. ' В заключеиив в' нужно разделить па )0«р. где р — степень, о которой говорилось в п. й. — Прим.
перев. З 79. Поправки Шелларс>а 101 а и (х — а> а (х — а>' х — а 90 56 ! 2106 Попрпвкв или выборочного среднего 56: 90 = 0,62 Выборочное срсднсс .тб --. 28,62 и !37 — а)а = 35 2: !х — ЬХ)а = 2106 — 35 = 207! Выборочная диспсрсия а' == 2071 > 89 = 23 Выборочное кввдрпти пюе отклонснис а —.— 4,9 3 19.
Поправки Шеппарда Оба следуюпп>х раздела (9 19 и 20) можно пропустить. Главная их пель — облегчить читателю знакомство с литературой, в которой зачастую идет речь о поправках Шеппарда, «вероятных ошпбкахв и т. и. Наблюдеииые значения х,,..., хл часто округляют или группируют, т. е.
объединяют в оольшие классы. Если класс с номером )с содержит значения ха заключенные между т„— 7>>>2 и ти —,' 7>,'2, то та называется серединой класса. Г!ус>ь и„— количество ииолк>дспиых значений х в )с - м пптервале. Если в фор- 16 19 20 2! 23 24 25 26 2? 28 29 ЗО 31 32 33 34 35 36 37 39 Сукна 3 о 3 3 2 12 4 7 8 9 6 7 4 4 4 3 3 — 12 9 — 8 — 7 — 4 — 3 — ! 0 1 2 3 4 6 7 8 !1 — 12 — 27 — 16 — 21 — 15 — 8 — 36 — 8 — 7 0 8 18 18 28 20 24 28 24 27 11 144 243 128 147 75 32 108 !6 7 0 8 Зб 54 112 100 144 196 192 243 121 102 Гл.
1е'. Оценки функций раснределения, средине знинений и дисперсий муле (3) Э 18 все з, заменить серединами соответствующих классов т„, то вместо М получим его приближенное значение М =- — к пт,, и аналогично вместо г', ,а 1 о =-~ ( — *)з'.
(2) М' может случайно оказаться несколько больше или несколько меньше, чем М, но разность М' — М в среднем равна нулю; напротив, г', в среднем несколько больше, чем г'„. Для того чтобы в этом убедиться и определить поправку, которую нужно вычесть из г,", чтобы получить 4, мы предположим, что все интервалы имеют одинаковую длину Ь, а номера интервалов меняются от — до + .
Класс с номером О расположен между зочками' 1 — Ь/2 н 1+ Ь/2, класс с номером Ь вЂ” между точками 1+ ЬЬ вЂ” Ь/2 и 1+ ЬЬ+ Ь/2. Если, кроме того, мы выберем начало отсчета так, чтобы было м = О, то М =-'~п„(1+ И), йо' = 1~'пн(е + ЬЬ) Математические ожидания М' и а', получаются из этих формул заменой п„их математическими ожиданиями прн. Прн этом р„= Ь'(г+ ЬЬ + —,' Ь) — Г(г+ И вЂ” —.',— Ь) есть вероятность того, что и лежит между г + И вЂ” Ь/2 и г + + И -ь Ь/2. Таким ооразом, 4(1) .-. Р',М = ~Яг+ЬЬ+-,,'Ь) — Ь~1.~ и —,,' Ь))(г-,И),(З) ВЯ = Ьга" = ~ ( У~1 + ЬЬ + —, Ь) — Р(Г + Х Ь вЂ”,— Ь~1(С -;- И)'-', (4) Оба выражения (3) и (4) являются периодическими функциями от Ь А именно онн переходят сами в себя при замене 1 на Г + Ь Б большинстве случаев этн периодические функции почти посзоянны, т е.
они мало отличаются от постоянных составля- ' е яаляется, таким образом, абсинссой сорокины нулевого кнасса.— При.ч, ред. ,4 19. Поправки Шеппарда 103 А =„— ) А(1) <й; о (5) аналогично для В(1) В = 1']'В(1) А1. о (6) Если (3) подставим в (5), то получим и ьь = т Дт( ь ь- ьь ь-',— ь) — т(ь ь- и — ,'. ь) ) а . ььЬ а —.. о ьа'ьж ) '(Ь (1 ь; Ь) — Ь')1 —; - Ь)] 1 111 = яя О~сюда интегрированном по частям находим ЬА =Я-., ге ф"(1 —;; Ь) — Ь')1+ 2 Ь)] = э = Ч ,'-ге 1$(,1 -.,'- Ь) -- й1еАЬ')1+-'„Ь) =- ' Так будет, сели фуи кипя распределения удовлетворяет известным головням.
Строгий вывод поправок Гбсппарла см. в киоте Г. Крамера, Математические методы статистики, ИЛ, М., 194В, $27.9. — Прим. рсд. югцнх своих рядов Фурье и поэтому приближенно равны соотвстствуьощему интегральному среднему значению'. Величиной интегрального среднего полезно интересоваться даже и в тех случаях, когда функции (3) и (4) значительно отличаются от постоянных. Действительно, выбор границ между классами 1+ ЬЬ-,' + Ь/2 доволыю произволен и, в известном смысле, случаен, поэтому 1можно рассматривать как случайную величину, которая равномерно распределена в интервале от О до Ь.
В этом случае А(1) будет также случайной величиной, среднее значение которой равно интегральному среднему 104 Гл. 1Р. Оценки фггнкций расаределенил, средних значений и дисперсий =~-;~1+ —, Л) 1К(1) — ~ —,~С вЂ”., Л~ аИ,1) = следовательно, и точно так жс = Рь ~ Ге И Р( 1) + —, йз или З = ~ гее2Р~Г) -- - дг = а.е — '- Ьз 12 ' 12 Таким образом, математическое ожидание з',, осредпсииос по всем возкгожнычг значениям 1, ца Ьг/12 больше математического ожидания д', равного ггз.
Для того чтобы для оз получить несмещенную оценку, нужно пз з,' вычесть ггоггрпвку Шеппардп Ь'-/) 2. Эту же самую поправку примеияют такгкс и при вычислении з'-', Сначала гычислггкгт з- '= —. Э. ггг,(тк — М')з 1 в — 1 и из з' вычитают Лагг!2. при этом в среднем получается то же д дд. 3рдсис числовые .лнрантеристики распределения лоб самос в'-', которое можно построить непосредственно по первоначальным значениям' хг.
Пример !3. В 4 18 говорнлосль ччо при вычислении в' наблюдспиыс значсння х можно спокойно округлять таким образом, чтобы размах имел дас значащие цифры. Теперь это утвари данна должно быть подтверждено вычислсн нем поправки Шсппардв. Прп этом мы прсдположим, что и нс слишком валико н что случайнвя вслнчнна х распрсдслсна приближенно нормально. Пусть каждое хг округлена ближайшим полым числом н пусть размах И' =. х'т — х'и (т. с. разность пожду наибольшим и наимсньшим нвблюдсниямн) янлястся двузначным числом 1О =: И'(!00.
Мы мон'см счнтзтлн по квадратичное отклонение х больше чсл~ 2. Так как соли бы было а. 2, чо, с большой вероятностью, вес х! лежали бы в пределах х — 5 н х ( 5 и, против прсдположсння, размах был бы мснес 10. С помощью формулы длн функции распрсдслсння, вывсдсвной н $ 17, послслнсс заключение можно было бы сдсчать более точным, но для наших целей ужс достаточна приближенная оценка.
Округлении сводится к группировке по ннтсрвалвм (д — Пл, д+ '/,), где д — целые числя. Математическое ожиданно в' превосходит 4, а поправка и!сппзрта равна лишь Чы. Следовательно, в среднеи поправка П)сппардз состанляст манас'14в отв', т. с.
лишь 2в~щ Соотвстствующая всличинз поправки для в отличается от в в срсднсм мснее чем нп 1 фв н поэтому нс нмсст практпчсского значсн ия. При очень болыинх и пли в случае распрсдслсння, сильно отлпч:пощсгося от нормального, эти отношсния могут оказаться понес бчагоприятнымн.
Поэтому при бачьших и округление, осторожности ради, пс слсдуст дслвть слишком грубо. Если размах И', вычисленный по округленным значениям, окажется мсныне 20, то нужно округление произвести заново, сохранив дополнитсльно сщс один десятичный знак. В этом случзс и! будет ллснсс 200 и а всегда можно выбрать так, чтобы разности х; — а были двузначныл~и числаии, которые можно легко возводить в квадрат.
2 20. Другие числовые характеристики распределения Вместо среднего значения х часто пользуются лледианоб ь, которая для непрерывной функции распределения определяется как решение уравнения 7(0 =-'., (1) Для распределений с симметричной плотностью вероятности и, в частности, для нормального распределения медиана Ь равна среднему значению х. В качсстге приближенного значения медианы ь" используют выборочн!)ю медиану Я.
Если объем выборки является нечетным ' Если график плотности с"(г) =: ((г) нс пмсст сонрикоспивснни высокого порядка с осто 01 на концах интервала, в котором сосрсготочсно распрсдслснна всроятностей, то лучше нс примснять поправок ()1еппврг!а. — Прим. ред. 10С Гл. 1>е. Оценки функций раснределенин, средине знанений и диснерсий ал —,— о, г н г вн в то время как дисперсия выбороч- ного среднего М равна 1 о. = — сг'-, г Следовательно, дисперсия Я в я/2 раз больше дисперсии М, Однако существуют функции распределений, для которых вы- борочная медиана л точнее вы- борочного среднего М.
В ка- честве примера рассмотрим функ- цию распределения Коши Г(1) =-,-+ — агс$я1, (2) Р ис. 14. которой соответствует плотность вероятности 1'(1) = — —, 1 (3) Это распределение получается следующим образом. Пусть точка А находится на расстоянии, равном единице от фиксированной прямой д (рис.