Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 20
Текст из файла (страница 20)
Таблица 4.8г заимствована из статьи (48). Таблица 4.8д. Процентные точки Ч вЂ” Ч ! Чм — Ч вЂ” ! Ч вЂ” Ч вЂ” 3 ׄ— Чь ' Ч вЂ” Чт Ч вЂ” Чь В таблице даны (с тремя десятичными знаками) ()-процентные точки статистик, указанных в заглавии, для 4/ = 0,5; 1; 2; 5; 10; 20; 40; 60; 80; 95% и л = 3 (1) 12, 15, 20, 24, 30. Па пересечении строки с номером в и столбца с номером () даны в возрастающем порядке три процентные точки статистик, указанных выше (при фиксированных и и () процентная точка статистики (ׄ— т)„г)/(ׄ— Чт) не пРевьппает процентной точки для (ׄ— Ч„-!)/ /(ׄ— Чз), котоРаЯ в свою очеРедь не пРевосходит процентной точки статистики (ׄ— Ч )/(Чм — Ч!)). Погрешность линейной интерполяции табличных значений по аргументу 1/и не превышает 10 '.
Таблица 4.8д представляет собой сокращенный вариант таблиц, опубликованных в статье [44). Номер спортсмена. ! НомеР ьасп«рвмеита. 1 10,30 13,05 11,11 10,87 12,29 9,35 10,30 8,46 10,19 10,27 9,47 10,88 8,50 9,14« 8,92 1 2 3 4 5 10,90 9,45 10,38 9,61 9,92 10,57 11,19 10,66 8,74 9,92 Арифметическое среднее 9,620 9,476 11,524 10,052 10,216 Арифметическое среднее результатов третьего спорт смена $ь =. Н,524 аначительно отличается от остальвых арифметических средних, близких к 10 сек. Случайно ли такое различие или оно возникло в результате си«тематического сдвига? Для ответа на этот вопрос (в аредположевии, что все $! независимы и нормальны) можно воспользоваться критериями исключения резка выделяющихся наблюдений. 1.
Попытаемся сначала применить критерии, выводы которых основываются на инфорыации, заклю- .— 61 П р и м е р. Для проверки «чувства времени« няти спортсменам (зануморуем их условно / = 1, 2, 3, 4, 5) было предложено, не пользуясь никакими вспомогательными приборами, зафиксировать на злектросекукдомере отрезок времени, равный 10 сек. С каждым спортсменом такой эксперимент повторялся пять раз; результаты опыта фиксвровались,но спортсменам не сообщались. Ниже указаны действительные покааания секундомера $«/ в пяти экспериментах, выполневных каждым нз пяти спортсменов (! — номер вксперимента, у — номер спортсмена): ченной лишь в арифметических средних $/.
Имеем Ч = 9,476, Ч,=9,620, Ч = 10,052, Ч«=10,216, Ч, = 11,524, и = 5, Ч = Ь~//5 = 10,1776, («*) = 0,52664« за = 0,7257, поэтому ) Ч! — Ч( ((Ч, «э)= шах „, =1,855, — .е Чь — Ч«Чь — Ч«Чь Чь = 0,639, — = 0,687, — = 0,719. Чь — Ч! ' ' Чь — та ' ' Чь — Ч! По таблице 4.8в убеждаемся, что согласно критерию с уровнем аначиыости 5% полученное нормированное отклонение 1 (ч, за) следует признать веаначвмым.
Остальные три статистики также подтверждают этот вывод, потому что их значения не выходят за 5%-ные пределы, укааанные в таблице 4.8д (так как на самом деле мы рассматриваем конкурирующую гипотезу Н„ а не Н,', то согласно сделанному выше замечанию уровень значимости следует удвоить и считать, что значения трех последних статистик незначимы с уровнем значимости 10',4). В данном случае незначимость отклонений свидетельствует не об отсутствии систематического сдвига, а, скорее, о недостаточности информации, заключенной в пяти арифметических средних. 2.
Более точные выводы можно сделать, восполь«овавшись всей информацией, заключеннои в акспериментальных данных. Так как выборочные дисперсии Х (5«, — б/)ь/4 представляют собой несмещенные оценки для о", ие зависящие от $ч и 0$ — оь/5, то общая несмещенная оценка для оь/5 с 20 степенями свободы вычисляется по формуле ззе= 100 ь«ь), ($«1 — $/)'=0,1606, ззо — — 0,401.
Поэтому ь+ (Ч, аьь) = 3,36. По таблице 4.8 г при и 5 и ч 20 находйм, что уровню значимости 0,5% соответствует критическое аначение 2,99, а для 0,1% такое значение равно 3,8. Следовательно, шах ) Ч! «ь« * 3,36 ~ 2,99, т. е, нормированное отклонение Г+ (Ч, ам) «качи!!о по кРитеРию с УРоввем значимости 2.0 5«й 1«%« разумеется, наше заключение останется в силе, если мы будем считать, что а = 10 и о = 0,401, и применим критерии типа 4 (а, о) или 1 (Ч, о) (см. таблицу 4.8а). 3. Следует заметить, что часто используемый в подобной обстановке критерий лясперсиовиого отношения с уровнем значимости 1% свидетельствовал бы о м«значимости рааличмя арифметических средних для отдельных спортсменов.
Действительно, в данном случае (см. таблицы 3.5) «. Н(1%!, 4, 20)=4,43. Этот факт ве является случайным! при конкурирующих зипотеаах Н', Н! я Н, критерии, основанные на статистиках типа !'(Ч, а„), окааываются мощнее г"- критерия. Поахому в данном примере следует признать, что экспериментальные данные подтверждают гипотезу о наличии систематического сдвига в ревулшатах третьего спортсмена. Подробнее о критериях исключения грубых наблюдений см. [6, 13, 40, 43, 44, 47, 74, 83, 87, 98, 112, 137) (таблица критических значений статистики (о[„— т[)/е„опубликованная в работе [87[, перепечатана в сборнике [Т27); пересмотрегшый вариант аналогичной таблицы с исправлением ошибок опубликован в статье [48)).
О других применениях статистик вида (т[„ — Ч„ в)/(в[о — т[,) см. [90[. Вопросы исключения грубых наблюдений в многомерном случае рассматриваются в статье: % 1 1 й з 8. 8. МпИгаг1а1е зга$1зг1са[ оп$11егз.— Вап[г[гуа, 1963, А25, р. 407-426. Таблица 4.9.
Критерий Аббе Пусть $;, $о, ..., $„— взаимно независимые, нормально распределенные случайные величины с одинаковыми, но неизвестными дисперсиями. Критерий Аббе предназначен для проверки гипотезы равенства средннхв М$, = = М$в =...= МР против альтернативыв [М3в„— М$,. [) 0 для всех значений в = = 1, 2,..., и — 1. Статистика критерия Аббе (в современной форме) представляет собой отношение Если верна альтернативная гипотеза, то анаменатель д больше числителя и поэтому значения этой статистики будут, как правило, меньше тех значений, которые наблюдаются, когда справедлива основная гипотеза о равенстве средних. Согласно критерию Аббе гипотеза о равенстве средних отвергается, если значение статистики д оказывается меньше критического значения д„ (Р).
Критическое значение есть Р-квантиль распределения д, Р— заранее ааданный уровень значимости; при фиксированных и н Р функция д„(Р) представляет собой решение уравнения Р (д ~ д„(Р)) = Р. Как локааал Дж. фон Нойман (см. [86[), распределение случайной величины д сосредоточено в интервале с концевыми точками 1 + ~ соз (и/п) и симметрично относительно точки д = 1. Функция распределения величины д выражается довольно сложной формулой; см. з86, 138). При атом Мд=1, О|= ", ' = ' +О( — ',) (в монографиях [74) н [137) в качестве прпблихвенного значения для 0д используется 1/(и + + 1) с погрешностью порядка и '). При больших и отношение д распределено приближенно, как 1 + $/)/и + 0,5 (1 + ~о), где 3 — нормальная случайная величина с параметрамн (О, 1).
В таблице 4.9 даны (с четырьмя десятичньь ми анаками) квантили д„(Р) для и = 4 (1) 60 и Р = 0,00[; 0,01; 0,05. Если п ) 60, то для вычисления д„(Р) рекомендуется воспользоваться приближенной формулой д (Р)=1+ Чв (Р) (33) 1 "+ т ['+ ['у (Р))') где Ч" (Р) есть Р-кзантиль нормального распределения (см. таблицу 1.3). Например, по таблице 4.9 дво (0,001) = 0,6174, дво (О 01) = 0,7071, доз(0,05) = 0,7906. Приближенные значения этих квантилей, вычисленные по формуле (33), равны соответственно 0,6175, 0,7074 и 0,7908 (относнтельные ошибки не превышают 0,1%).
В монографиях [74[ и [137[, а также в статье [138) рекомендуется менее точная формула. д„(Р) — 1 + + Ч" (Р) 1/ (и — 2)/(и' — 1), по которой для тех же квантилей мы получаем приближенные значения| 0,6077, 0,7047 и 0,7912. Так как случайная величина — (1 — д) )/(2п + 1)/(2 — (1 — д)') (34) распределена приблияоенно нормалыво с пара- метрами (О, 1), то прк и) 60 для проверки ос- новной гипотезы о равенстве средних можно, вместо определения приближенного критиче- ского значения по формуле (33), вычислить зна- чение статистики (34). Если это значение ока- жется меныае Ч' (Р), то основную гипотезу сле- дует отвергнуть, Таблица 4.9 составлена по таблице [Т52), в которой даны критические значения статисти- ки 2ид/(и — 1). Та б л и ц а 4ЛО.
Функция мощности критерия 7' (нецентральиое 1(о-распределение) Пусть )(~ (а) — случайная величина, подчиняющаяся нецентральному Ко-распределению с и степенями'свободы и параметром нецентральности а (см. описание таблиц раздела П). Если для статистической проверки гипотезы а =- 0 применяется критерий ув с уровнем значимости Д%, то функция мощности такого критерия выражается формулой 3о(а [ и, в/) = 1 — Ра [х (ф, и); а], (35) где х(07, и) есть г;г-процентная точка 2»-распределения с и степенями свободы (см.
таблицы 2.2), а Г„(х; а) — функция нецентрального т'-распределения с и степенями свободы. Если и— четное число, то Р„(х; а) выражается формулой (2.11). В общем случае при фиксированных и и (г имеет место следующее разлоггсенне функции мощности критерия Хвг » у (а ( гг, г г) = е-о/е Ч а Х В 2"- '"'»г (з -5 вг2) « — — е Х ~ уг» г" Е ВЧ»г)у, (36) » мго, ог где а ) О.
В таблице 4.10 для и = 1 (1) 20 (2) 40 (5) 60 (10) 100, ч = — 1 и 5% указаны такие значения параметра нецентральности а, для которых 3» (а ~ и, г)) = 0,1 (0,1) 0,9 (таким образом, в таблице 4.10 табулирована функция а = = а (3» ) и, гг), обратная функции мощности 3»=-У(а(и, ч)). При и ) 20, а таня«е при тех значениях гг, которые отличны от табличных, для вычисления функции мощности 3» (а ! и, Я могкно воспользоваться приближенными формулами для функции нецентрального 7(»-распределения (см. раздел П).
П р н м е р. Если в уезовкях примера 3 (ем. описание таблиц раздела 11) основная гипотеза неверна н при и оо рг — ро = О (1/)г о) (7 = 1, 2,..., т), то можно показать, что статистика г7 будет прн в оо аснмптотаческв РзепРеДезепз как хюг г (а), гле о в ~ч~~ (р ре)»где г=г Поэтому, если бы прн статистическом исследовании распределения случайных чисел в таблицах Кздырова мы воспользоввлясыгрвтеркем 7' с уровнем значимости 0 = 1% в чкелом степеней свободы вг — 1 = 4, то мощность такого критерия Я (о(4; 1%) равнялась бы 0,9 прк а = 20,737 (см. таблицу 4 10).
Ото означает, что еелп в девствктельноотк отклопенве распределения езучаявых чисел от равномерного такова, что а ) > 20,737, то с вероятностью, превышающей 0,9, критерий т,' отвергнет гнпотезу равномерности. Таблица 4,10 перепечатана из публизгации Э. Фикс (Т47]. Литература„посвященная не- центральному 2»-распределению, указана в описании таблиц раздела П. О мощности статистических критериев см. (28, 47, 68, 72, 103, 104, 137). Таблица 4.11. Функция мощности критерия Стьюдента (нецентральиое 1-распределение) Графики таблицы 4.11 предназначены для ответа на вопросы следующих двух типов в условиях, когда применяется критерий Стью- денга с заданным уровнем значимости (см.