Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 53
Текст из файла (страница 53)
! ЪС'ет СЬСте СЬВЖ СЬйтт оЬС%' оЬС» сЬ8В7 оййте 1О 24 7 23 8 19 8, 9 2130 3 ' 16 2 11 4 23 288 Га. ХЕ. Проверка вилотез с помощью статистических критериев Если хз,..., хз — наблюденные количества в одном семействе (ли= и), то для этого семейства д'= ~ 8 8(' пз) ! и( 8) С помощью ортогона.чьного преобразования вместо х„..., хз введем новые переменные ум..., у, таким образом, чтобы величина у, )(8 равнялась разности между числом по~сиков вида СЬ н числом.потомков вида сЬ: уз !' 8 = зз = хз + хв + эз + ха — хв ха хч ха.
(СЬ) Точна так же определяются уз, ум соответствующие наследственным признакам 0 — 8 и чт' — чт: у,) 8 = ез = хз+ аз хв ха+ хв+ аа хз — хь (О) уз )8 — яв .. *з — "з+ зз ха+ хв — хв+ хг — ха. (%) Следующая переменная уа соответствует парному признаку (0)т', йм) — (йи', Счч): Уа)гй= за = ха аз ив+ ха+ ха хв хт+ хв (0)У) Если наследственные признаки 0 — 8 и % — и не снязаны, то математическое ожидание за должно быть равно нулю. йналогично определяются а, и л,: Уз У 8 =- аа = хз — хз + ха — ха — хв + х, — х, + хв, (СЬ%) у, )(8 = эа = хз + хз — хз — ха — хв — хз + хз + хз. (СЬ0) Для того чтобы ортогональное преобразование было полным, нужно ввести еще две переменные: уз ) 8 = а, = хз хв — ха+ эа — а'в+ а'а+ хв — хв ув ) 8 = зв = хз + хз + хв + ха + хв + хв + аз + ха.
Величина а, не имеет сколько-нибудь простого биологического истолкования; в, = и — количество растений в семействе. Практическо, для того чтобы избежать деления на )'8, все вычисления проводят, конечно, с вечичинами з, а не с у. Величина да выражается через э! следующим образои: в из1 ! в з ! в ! в дв = — ~~~~~~уз — ~ — ° (~ зв — яз) = — ез + + зз Ж 8~ и и м Эта формула представляет собой разложение дз на составные части, о которых говорилось нышс. Каждая случайная величина ва распределена приближенно нормально с нулевым средним и дисперсией ги Следовательно, кажлос слагаемое зум распредслево приближенно, как хз с одной степенью свободы.
С помощью вычислений получаем для этих слагаемых следующие значенвя. б 56, Применения критерия хл 289 (сь! ) (ей (цО ! (втч! (л,! ! Сумма (сыт! (Сьо> Семезстло 0,10 0,27 0„20 1,28 2,13 0,04 0,82 . '0,09 0,52 '0,32 1,20 ' 0,22 О,!О 0,90 0,06 0,34 0,06 1,4? 0,27 О 0,70 0,09 ?л99 1,98 0,90 8,45 0,06 0,61 0,05 0,50 6,72 14,82 6,26 11,09 О,!6 0,6! 0,90 О,!7 О,!6 0,22 0,21 0,26 0,27 1,28 0,39 0 6,29 0,02 1,60 0,06 0,79 0,22 3,37 1,82 0,82 О,!7 0,36 1,86 0,61 0,40 0,06 0,32 0,02 0,05 0,09 3,1! 0,82 0,39 0 1,09 0,22 0 0,06 0,32 4л12 1,32 !07 !!О !!9 !2! 122 127 129 !3! 132 133 135 178 !2 56 19,22 10,08 12,36 18,05 4,86 4,80 9,20 3,!8 14,21 5,05 2,05 8,89 0,05 0,01 0,22 0 0,26 0,84 0,09 Сумма ) 41,49 !15,04 !11,54 ) 6,58 !!4,05 5,41 !21л51 ) 115,62 По этим т и э была построена фуккппя еорчальнога распрсделемия.
с помощью которой были пайдепы оценки пр, для математических ожютапий ~сгалбсц 3). Разности хл — пр, указаны в столбце 4. Оказ(ьтось„что нелп- Б. Л. зли д р Варден - (аах ! зйлплая граница для отдельного значения равна 6.6 (одна степень свободы), для суммы значений в отдельполл столбце — 26.2 (12 степепей свободы). Соответствующие 591-иыс границы равны 3,8 и 21,0. Числа, превосходящие 58л-кую границу, выделены в таблипе жирным шрифтом. Три наименьших жирных числа — 6,26 н столбце (СЬЬ 6,20 в столбце (С) и 4,12 в столбце (Рр) — еще пи о чем пе говорят, так как даже в том случае, когда все в порядке, среди 84 чисел в среднем 4 будут превосходить 5леную границу.
Все остальпыс случаи превышения 5лл-ьой границы сосредоточены н столбцах (СЬЬ (СЬ М) в (с„). В этих столбцах 1",л-пая грзнипа превьппается шесть раз, а сумма чисел в столбце (СЬ) превосходит даже 0,1 эта-иую границу 32,9. Следоватсльио, признак СЬ вЂ” сЬ заве юмо ведет себя аепормальным образом, н большая часть отклонений падает именно па этот признак.
Вполне возможно, что признак СЬ вЂ” гЬ связан с фактором летальности или неуживчивости. Сисплепия между какими-либо двумя пз трех признаков — СЬ вЂ” с!ь С вЂ” 8 и 'лт" — ту?по-видимому, ие имеется, так как суллмы в столбцах (()(4). (СЬ лф) и (СЬ С) не асобсипо велики. Пример 38 (из книги Г. Крамера, Математические методы статистики, ИЛ, М., 1948, стр.
477). Юханисси излгерял толщину 12 000 бобов. Результаты изллерений были разбиты на !6 классов. К перволлу классу были отнесены бобы с толщиной менее 7 мм, ко второму — бобы с толщиной от? ло 7,25 мм и т. д. (верхняя грал ица каждого последующего класса всегда на 0,25 мм болыпе верхней граиииы предыдущего класса). Количества бобов т„а;...
х,л в этих классах указаны ио втором столбце таблицы, следую.щей ниже. Для того чтобы проверить, подчиняется л~ толщина бобов ~ормальному распределению, сначала по группированиым данным были вычислены т и з с плеппардовской( поправкой, причем оба яоипевых интер:ала (до 7,00 и свыше 10,50) были разбиты иа частичные интервалы длины ~(,25. В результате вычислений получились оценки т =-. 8,5!2, а .= 0,6163. 290 Гв. ХД Лроверкп гипотез с понсгнью стптистическик критериев Классы 12000 ) 12000 ! 0 Сумма чина Хв ранна 196,5, и та время хан 0,1%-ная гранина для 13 степеней свободы равна 34,5. Следонательно, с большой уверенностью можно утверждать, что распределение толщины бобов не является нормальным.
Разности х — мр паназыаают, что зто распрсдслепяс обладает значительной асимметрией: очень толстых бобов больше, а очень тонних бабаи меньше, чем полагалось бы при нормальном распределении. 2 57. Критерий, основанный на днсперснонном отношении (крнтернй ае! Пусть а', н аз з— две независимые сценки для дисперсий ~тзз н а,' соответственно. Как проверять гипотезу сгз = о;р Еслн взз н а, получены с немощью нзвестной фг!рмулы по нз н п, наблюдениям соответственно н если отдельные паблюдення независимы н распределены нормально, то случайная велнчнна (и,— 1) вз 3 Хг= е а1 подчиняется распределению ~~ с 7г — зз — ! стигенями свободыг а случайная величина Уз е (2) о'з До 7,00 7,00 — 7,25 7,25 — 7,50 7,50 — 7,75 7,75 — 8,00 8,00 — 8,25 8,25 — 8,50 8,50 — 8,75 8.?5 — 9,00 9,00 — 9,25 9,25 — 9,50 9,50 — 9,7о 9,75 — 10,00 1О,ОΠ— 10,25 !0,25 †1,50 Сныше ! 0,50 32 103 239 624 ! 187 1 650 1 883 1 930 1 638 1 130 737 427 22! 57 32 68 132 310 617 ! 046 1 506 1 842 1 920 ! 698 1 277 817 444 205 В! 27 10 — 36 — 29 — 7! +14! +144 + 41 + !Π— 60 --147 — 80 — 17 + !гз + 29 + 30 д от.
Критерий, оеновоннмй но диепереионном отношении 291 подчиняется распределению тв с 1в = я, — ! степенями свободы. Если о., = сте то Хт Ьот (3) Х» 1» вв Для проверки гипотезы <г, = с, вычисляют отношение выборочных дисперсий (дисперсионное отношение) (4) вв Если отношение У превосходит границу ов, то гипотеза сг, = = егв отвергается, Это правило' называют критерием л. Граница Ур выбирается так, чтобы в том случае, когда гипотеза се, = а, веРна, веРоЯтность событиЯ ев > век в точности Р»вннлась заданному уровшо значимости )3.
Для того чтобы вычислить о"р, мы должны найти функцию распределения случайной величины вт' при условии, что гипотеза о., = с, верна. Эта функция будет известна, если мы найдем функцию распределения Х1(го) отнсшепия х М 1т~ (и) Х» 1» вв тв Плотность вероятности для у,' задаетсн формулой 1 1 — б-1 — „! 1 д,(1) =ат 1и е -", где а,=— Г~ -) 2" Для плотности !евв формула будет аналогичной.
Следсвательно, вероятность того, что отношение (б) окажется меньше ю, равна 1 1 1 1 , Я вЂ” т —. е — 1,— т —;и П(ео) = а,ае ~ )(1в ' и и ив ' и '- Жатв, (б) где интегрирование производится по области 1>0, н>0, — <и. и Двойной интеграл (б) можно представить в виде двух последовательных интегралов: «щ Н(ю) = а,а, 0и» те мв е и и е11. о о ' Р. А.
Фишер строил критерий с помощью статистики в = (1о е)(2. 19» 2Я2 Ге. И. Лроверкп гилолмз с лсмсечьв стамиссвиееских крил1ериев Если ввести новук1 переменную интегрирования у = 11и и поло- жить Хх -1- Ха = Х, то получим Г 1 1 1 1 Г -1-1 б-1 — — ив — — и ХХ(и) = ахах ~с(и~ ив уа ' е - '- 'тХу о о (8) или, меняя порядок интегрирования, и Г ' Г У+1 Г,б — 1 Г -! — 1 — — „и ХХ(и) = а, а,) уа тХу).из е - "аги. о о Внутренний интеграл представляет собой гамма-функцию; к 2 ~и2 в 2 1(и- — ~. )2Х~ о (10) Таким образом, 1 ХХ(,)=С) у" '(, + !)-.-1,Х„ о (1 1) где (19) И1пеграл [11) является неполной бета-функцией, и при целочисленных (1 и Х его, очевидно, можно вычислить элементарно.
Таким образом, функция распределения ХХ(вв) известна. Подстановкои 6 )и получим из ХХ(ю) функцию распределения ХХ(гр') для отнои1еиия Р. Искомая граница и' -= У„ определяется как регненис уравнения сХ(и)') =- 1 — р. (14) Пример 39. В СШЛ н ЗО лабораториях пронзволнлся аналвз газов. В каждой лаборатории делалось несколько анализов !в большинстве слу- Эта граница, помимо р, зависит также от Х1 и /,. Границы Рр для Ф = 0,05 и 0,01 указаны в табл. 8А и 8Б. й ор. Критерий, основанный на диспорсионнол отношении 293 чаев 1О), отдельные результаты которых были опубликованы М.
Шефердомл. Если по этим результатам попытаться вычислить дисперсию внутри лабораторкйз, то возникнет затрудненно, связанное с тем, что внутри отдельных лабораторий выборочные дисперсии в' сильна оллнчаются друг от друга: имеются более хорошие и менее хорошие лаборатории. Если желательно вычислить среднюю выборочную дисперсию нз лля хороших и срелннх лабораторий с тем, чтобы потом ее можно было принять за норму качества анализа лля всех лассраторий, то совсем плохие лаборатории нужно из этого осрсднснни исключить. Однако те аз, которые лишь случайно оказались несколько больше нссх остальных, исключать не следует, так как н противном случае срс;и:ес будет кисть отрицательную систематическую ошибку.
Для исключения больших вз мааса применить критерий л'. В качестве примера рассмотрен опрслеленне количества метана так называемым вметодом сжигания Ал, который применялся большинством лабораторий. В некоторых лабораториях анализ проводился лнумя различными исследователями. Прн этом оказалось, что различие результатов обоих нсслелователей, кан правило, несколько больше различии результатов, полученных отдельным исследователем. Поэтому лля оценки дисперсии нужно выделить результаты каждого исследователя из общей массы наблюдений и с их помощью вычислить выборочные лнсперсии по фор- муле Ю в' = — — —, где (г =.
э"' (х — т)', п — ! где х — процентное сохержание метана. Полученные результаты указаны ниже и порядке возрастания выборочной дисперсии вз: % ~ 0 и — ! *' 0 и — ! лл !5 Как индиа, результаты исследователя 31 имеют значительно ббльшую дисперсию, чем результаты всех остальных исследователей. Для того ' БЬерЬотс( й!., Ю. Вев. ?чтам Вшсац оГ 81апбагдв, 38 (1947), 19. а Т. е.