Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 54
Текст из файла (страница 54)
дисперсию результатов анализа н отдельной лаборатории 17рим. перев. 1 3 4 13 14 0,0: 1 0,6: 9 0,8: 9 0,4: 4 1,3: 9 0,6: 4 1,5: 9 1,8: 9 2,2: 1 0 0,9: 4 3,5: 9 3,8: 9 .= 0,00 = 0,07 = 0,09 = О,!О == 0,14 =- 0,15 == О,! 5 =- 0,17 : — 0,20 . - 0,22 = 0,23 = 0,39 =. 0,42 = 0,60 = 0,65 ! 16 !7 2И 29 зо 31 36: 5=- 072 67: 9=- О?4 7,3: 9 =- 0,81 4,0; 4-: 1,00 83: 8 —.
1,04 9,1: 8 = 1,1 4 18,1; 15 = 1,20 5,9: 4 -.. 1,47 13,8: 9 =: 1,53 !0,2: 6 = 1,70 21,1: 9 = 2,34 28,5: 9.—. 3,17 29,9: 9 = 3,32 16,9: 4 = 4,23 434: 9= 482 15,2; 2 = 7,60 294 Гл. Х?. Проверки гипотез с помощью статистических критериев чтобы проверить, ие является ли это случайностью, мы разделим выборочную дисперсию в,' = 7,60 на среднюю дисперсию всех остальных наблюдений, вычисленную по формуле ~' () Уз = ~(л — !) В результате получим вз == 239,9!215 = 1,116 и вз ?,60 х'зз = — .= — .=- 6,81. вз Точно таким же образом можно вычислить ?гз, е'„..., Рзз исследователю 1 при сравнении со всеми остальными ставится в соответствие отношениее е? (1 =- 1,..., 31). Наибольшим пз этих еу является ем. Еслй отвлечься от остальпых результатов, то окажется, что ?гм превосхолит 5з~о-ную границу 3,04.
Однако, хотя вероятность того, что апределеииое отдельвое е? превзойдет ?е», и равна 0,05, тем пе менее для езз мы не имеем права делать такое заключение: значение ?езз является наибольшим пз всех Рр и событие, при котором хотя бы одно Х"г превзойдет ?г», отнюдь ие маловероятно. Если, в действительности, все згз раины друг другу, то вероятность того, что все е? будут меньше е'», раппах (0,95)з' = = 0,20, следонательио, вероятность того, то хотя бы одно е' будет больше с"» равна 1 — 0,20 =- 0,80.
То, что сзз превосходит 1зчз-пую границу, также еще почти ни о чем не говорит, так как вероятность случайиого осуществления этого события 1 — (0,99)м =- 0,27 все еще велика. Если бы Рзз превзошло 0,1зчз-иую границу, то наличие грубых ошибок у 31-го исслелонателя было бы доказано, по так как эта граница равна 7,15, та Рзз ес не превышает. Более благоприятное положение складывается при проверке езь так как гзз имеет болыпее число степсиеи свободы, чем ем. Находим 4,82 Рзз = — = — 4 53. 1,066 Эта величина значительно превосходит 0,1',з-кую границу, равную 3,26. Вероятность того, что это событие произошло случайно, равна' лишь 1 — (0,999)ю = 0,03.
Следовательно, гипотезу о том, что результаты исследователя 30 имеют такую же дисперсию аз, как и результаты остальных исслслователей, следует отвергнуть. Исключив исследователя 30, можно снова сравнить точпость исследователя 3! со всеми остальными (с ! по 29).
В данном случае иаходим 7,60 Раз — — = 7,60. 1,00 з Это утверждение было бы справедливо, если бы все Р! были независимы. На самом деле оии являютсв зависимыми, так как связаны соотношением х~~ (з сг!(! -1- о!)и)) = 1, где о! = (л! — 1)! х'(л. — 1). — Прим. !ы! перев. ' Здесь автор снова допускает ошибку, так как вероятность события Рзз ) 3,26 пе ранна 0,03 (см. предыдущую сноску). — Прим. перев. д 57. Критерий, основанный на диснерсианнам отношении 295 Эта величина превосходит 0,1 аз-иую границу, равную 7,15, поэтому исследователя 3! также надо искл!очпть, После исключения исследова~елей 30 и 3! можио продолжать проверку с помощша этого же метала.
В результате последовательно будут исключены исследователи 28, 27, 29 и 26. Вероитиость ошибочного исключения во всех случаях менее 0,03, следовательно, вераятаость того, что хотя бы одно исключение из шести было ошибочным, ис превосходит О,!8. 1!а первый взгляд заключение с всраятиостью ошибка О 18 может показатьси неосторожным, Однако более точная проверка показывает, что бо.тьшииство заключеиий остаются справелливыми также и при 0,05ча-иой гравице. В результате оказываетсв, что выборачвос срелиее зиачевие содерх,аиия метаиа у исследователей 29 и 30 слишком велико, а у исслелователя 3! слишком мало.
Следоватсльио, исключение номеров 29, ЗО и 3! ие было ошибочным. При исключеипи трех остальиых исследователей всроятиость ошибки каждый раз оказывается меиыие 0,014, а общая вероятность ошибки — меиьше 0,042. Если ошибку, вероятиость которой равна 0,05, считать допустимой, то исключение шести исследователей: 31, 30, 29, 28, 27 и 26, следует призвать оправдаииым'. Средняя выборачвая дисперсия иа одного исследователя, вычпслеипая по оставшимся даииым (с ! по 25), равна !1О,! аз = — = — = 0,63.
!) !75 Величииа аз представляет собой несмещенную оцеику дисперсии из одиого измерения и ие отражает кочебаиия выборочных лисперсий для отдельиых исследователей, поэтому ач можно назвать дисперсией васлраизвадимоспги'. Величина в равна 0,8 (% метаиа). Следует отметить, что даже в том случае, когда исключены показания исследователей, допускающих иаибольшисотклоиеивя, результаты измерений, проиэвелсииых в различных лабораториях, могут отличаться друг от друга иа всличииу, почти вдвое превосходящуюз ж Для каадратичиого ' Для проверки гипотезы об одиородиости ряда дисперсий в данном случае следовало бы примеивть специальцые критерии (см.
Х а л ь д А., /йатсматичсская статистика с техиическими приложеииями, ИЛ, 1956, гл. Х(, 4 6). — Прим. ред. Ч Оценка аэ представляет собой среднее взвсшсипое выборочных лисперсий для отдельных исследователей: аз = (~(л; — 1) в,')/,~~ (лг — 1), Если гипотеза о равенстве дисперсий верна, то й (л! — 1) вз/азподчиияется распределению х' с / = м (и; — 1) степеиями свободы. Это позволяет построить доверительный иитервал для а.,!!апримср, в лавкам случае 95его-иый интервал задается лсравспством 072(и ( О 90.
— Прим. перев. а Пусть х, и х, — результаты нэмерсиий в двух рвзличиых лабораториях. Пб предположеиию, х, и хз — исэввисимые нормальные величины с дисперсией а.з, поэтому развость х, — аа распределена кармальпо с пулевым средиим и дисперсией 2аз. Таким образом, Р ()хх — хз! ~ ! 5а) = = 2 [! — Ф(!,5а/и)~2 )~.
Согласно предыдущей сноске, с вероятностью 0,975 имеет место иеравсистео а/а. ( 1,!, поэтому Р((т, — хз ) )1,5в) ) ) 2 (1 — Ф(!,5 !,!/1,4!Ц =- 2 (! — Ф(1,17Ц =: 0,24. Получеииыи результат позволяет с вероятностью 0,975 утверждать, что ие ысиее чем в четверти всех случаев результаты измерений в двух различиых лабораториях будут отличаться друг от друга более чем иа !,5а. — Прим. перев. 296 Гл. ХД Проверни гипотез с помощью тпипшстичвспив критериев отклонения результатов различных лабораторий получнлаеь опенка о =- = Ц4.
Сравнение с более точными методами измерений показывает, что систематическая ошибка»метода ежа»анна» ужасающе велика н достигает 2.6. Следовзтельчо, метод сжигания А не очень надежен. 2 58. Дисперсионный анализ А. ЛиспьРсия внутри классов и между кллссАми Пусть х,,..., хп, у„..., уп и з,,..., зп — независимые, нормально распределенные случайные величины, причем все х; наблюдаются в одинаковых экспериментальных условиях, и поэтому можно прсдположить, что х, имеют одинаковые средние значения и одинаковые дисперсии. Точно такие же предположения мы будем делать относительно ус и з, Далее, предположим, что все хи уу и з„имеют одинаковую дисперсию о.з (эту гипотезу можно проверить с помощью критерия л).
Возникает вопрос, одинаковы ли средние значения у хи уу и звй Для ответа на этот вопрос можно использовать метод дисперснонного анализа. Идея этого метода основана на том, что если х, у и а имеют одинаковое среднее значение, то общая сумма квадратов б) =- с (,,)у)з+ ~(у М)я+у (з,)4)з, ()) и»+ ° ° ° + ип ~г »в (в (2) а остальные переменные и,,..., и„определяются таким образом, чтобы преобразование было ортогональным. Тогда, в силу ортогональности, ~ хе= ~ из=и,'-'... +из (3) следовательно, ияз +...
+ аз = ~" хз — изз = ~,' хз — ихз = и~,' (х — х)з (4) где лд — общее выборочное среднее значение всех х,,у и з„, распадается на две составные части, из которых первая связана с оценкой дисперсии внутри трех классов, а вторая — с оценкой дисперсии между классами.
Эти две составные части сравниваются затем друг с другом посредством критерия л, Математическим вспомогательным средством, позволяющим получить такое разложение, является ортогональное преобразование. Введем вместо х,,..., х„новые псременныс а„, а„, нз которых первое пропорционально арифметическому среднему х: Э Зз. йиеиереионний анализ 2вт Таким образом, данная часть суммы квадратов соответствует дисперсии в классе всех х. Точно так же, заменив у„ ..., у„ и зп ..., з„ новыми переменными вг,..., е„и юо..., ю„, получим е3+ + 4 ='.~ (у — у) ма+...
+ н;г =~(з — з)-', (5) (б) Складывая (4), (5) и (б), найдем Если три класса состоят из различных количеств наблюдений яг, нг, я„то вместо (о) получится формула 9г за= (иг — 1) + (пг — 1) + (нг — )) или, короче, згг — ..— х — 3 где Х = яг + пг + яз. Для того чтобы найти «дисперсню между классами», м„о„ю, подвергают новому ортогональному преобразованию, при котором они переходят в и', о', в', где и' пропорционально общему выборочному среднему М всех хе у; н ан: ))Г (Ггг и+ И+ - и~ ) еи+иг)не+ ин ) не Тлг М В силу результатов ~ 13, такое преобразование возможно, так как сумма квадратов коэффициентов в правой части (10) равна единице: Р+ж+ж =1.
Так как преобразование ортогонально, то ге,' + 612 -' мгг = и' -'- 6' + ю' ,г , ,а . ,а ,г (1 1) Поэтому, положив о' + ю' = Щ, получим Щ и в + и нд и, (,Ч41г г л .г а г г г (12) яг = (а~ г~;... + мй) + (огг +... + ог) + (и.г г+... + авг) = = л'(х — х)'+.)', (у — у)'+ л„'(з — з)г. (7) Сумму квадратов 9г можно использовать для оценки дисперсии внутри классов. Как всегда, такой оценкой является "=з (8> аза Ге. Хд Проверка гипотез с комок(ью статистических критериев Если фг сложить с ранее полученной суммой (22 — (и1+ + и")+ (се+. + ') + (те+ .
+ ".), то найдем, что Я1 -(- Яв = м~а~ + м~ о12+ „'е,'ес2 — ХМ2 = = ~ч, х,'+.5„"уе +.'У,'е2 — ХМ2 = = 2; (х — М)2 + Ъ'(у — М)2 + 2, (а — М)2, (13) Прав)ю часть (13) мы тже раньше сбсзначили буквой Таким образом, разложение ('( = 9 + 92, (14) о котором говорилось выше, найдено. Вторая составная часть 02 определяет сценку (9) для дисперсии внутри классов. Первая составная часть 91 = Ох+ И" зависит лишь от разностей между выборочными срсднимп значениями х, у и а внутри классов.