Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 32
Текст из файла (страница 32)
Если найденное в результате эксперимента зпачение у удовлетворяет неравенствам д(ч;т, и)(у(6(ч;т, и), то нет оснований утверждать, что у проткворечит гипотезе Ню Если же какое-либо из этих неравенств нарушается, то гипотезу случайности следует отвергнуть. При этом вероятность ошибочно отвергнуть гипотезу Нт когда она верна, не превып»ает 2»,». В таблице 6.7, заимствованной из работы [ТЗЦ, даны значения д (ф т, и) и 6 (/,); и, и) для 2ь) = 0,01; 0,02; 0,05; 0,10, и = 2 (1) 20 и и» = 2 (1) и, а также для указанных»',) и т = = и = 20 (1) 100 (в последнем случае значения // и 6 являются не точными, а приближенными, так как они вычислялись с помощью нормальной аппроксимации (35), однако в силу дискретности распределения у онн почти всегда совпадают с точными значениями, а если и отличаются от них, то не более чем на единицу; подробнее об атом см.
[Т311). Для определения д и 6 по таблице 6.7 следует найти строку, соответствующую заданным и и т. На пересечении этой строки со столбцом, отвечающим выбранному значению 26, указаны два числа д и 6 (в таблицах [Т311 и [Т56[ вместо С даны величины 6 — 1). Если и > 20, то для приближенного определения критических значений можно воспользоваться нормальным приближением (35), согласно которому д(ф и», и) [Му + Ч'(Д)[/0у — 0,5~, (39) 6 (Ч; т, и) — [Му + Ч' (1 — »Г) у'0у + 1,51, где [у) — целая часть числа у и Ч'(р) — функция, обратная функции нормального распределения с параметрами (О, 1) (см.
таблицу 1.3). В тех случаях, когда выражения в квадратных скобках формул (39) близки к целым числам, рекомендуется Ч"(р) заменить на Ч" 1 г п — т 1» 4тп — Зт — Зп 6 [ п+т/ т+п — 2 х 2тп (Ч"'(р) — Ц. (т+ п — 1)(2тп — т — п) Критические множества приближенных односторонних критериев, основанных на нормальном приближении, выражаются неравенствами У йу — ( Ч" (О)— (2 Р йу) — )Ч" (1 — (7)+ З/г»у (2 )гОу) Для аналогичного приближенного двустороннего критерия критическое множество задается одним неравенством пу ) [Ч'(1 — ч))+ (Зу йт) ) ' Иными словами, двусторонний приближенный критерий, по сути дела, является 2»-критериез» с однои степенью свободы и поправкой на дискретность распределения у, разной 1/(2)/Су) Приближенные выражения для критических значений можно построить также с помощью В-приближения.
В силу формулы (36) и неравенств (38) прн больших значениях п а= И'*), 6 =1+ (6*), гдо яе и Ст — решения уравнений 1„, (Лг — яэ + 2, йи — 1) = »,), У„(6» — 2, Л' — 6* + 3) === 6 или, что то же самое (см. описание таблиц 3.4), Х (4)) Лг — йв + 2, де — 1) = 1 — х, Х(6; С* — 2, Л' — 6*+3) =х.
Значения х и Лг определяются формулами(37). Решение этих уравнений с помощью таблиц 3.4 очень трудоемко, поэтому практически представляется более целесообразным не вычислять йи и 6, а построить приближенный критерий, воспользовавшись тем обстоятельством, что согласно формулам (36) и (5.1) случайная величина у — 2 приближенно подчиняется биномиальному распределению с параметрами (Л', х). Таким образом, если и и П вЂ” нижний и верхний доверительные пределы для вероятности х в биномиальном распределении, соответствующие коэффициенту доверия 1 — 6, количеству испытаний Л«и количеству «положительных» исходов у — 2, то с вероятностью, близкой к 1 — 26, имеют место неравенства и (х ( П (см.
формулу (5 11)). При нарушении любого из этих неравенств гипотеза Н, о случайности расположения элементов последовательности (33) должна отвергаться. В случае построения односторонних критериев полезно иметь в виду, что для одинаковых уровней значимости критические множества (у ~( д) н (П ~( х) приблизительно эквиваленты (точно так же, как 17 ) 6) и (я ) х)).
Доверительные пределы и и П определяются по таблице 5.2; при этом следует положить Р = 1 — )',7, р = т — 2 и и — р = Л« — Т + 2. Так как значение Л), вообще говоря, дрооное, то для отыскания я и П может понадобиться интерполяция таблицы 5.2 или таблиц 3.4. П р и и е р. Ниже укаэаиы результаты проверки правильности прогноаа температуры воздуха ва сутки вперед з течение 28 последователькыл дней. Знаками «мивус» отмечены те дни, когда абсолюткая ошибка прогноза была более 2'. В остальных случаях реаультаты прогноза отмечались знаком «плюсы +++++++++++---- — ++ — — +++++ — ++ Можно ли утверждать, что правильные и кеправвльвые результаты прогноза группируются случайно? В этом примере количество «мивусов» т = — 8 и количество «плюсоз» л = 20. По формулам (34) Му = = 12,429 и 07 = 4,414, поэтом) 1 )3 Ч'(0,975)+ ~ =4,83, 2 г'07 ) т (0,995) + , ) = 7,93.
2У'07 ) Так как количество серий 7 = 7, то (7 — Мт)»)07 = = 6,68; влачит, согласно двустороннему приближекяому критерии типа Х«с уровнем аиачимости 2() = 0,0с гипотеза о случайной группировке отвергается, потому что 6,68 ) 4,83. Такой вывод нельзя считать очень иадежпым, так как если бы уровень значимости равнялся 0,01, то гипотеза случапности ке отвергалась бы (заметим, что беэ поправки ка дискретность 1/(2 Р 07) критическое значение равнялось бь»ие 7,93, а 6,63, и поэтому гипотеау случайности формально следовало бы отаергкуть). Так как по формулам (37) х = 0,577 и У = 18,08, то, полагая р=у — 2=5, л — р=)«' — 7+2= = — 13,08, по таблицам 3.4 находим я ( 0,097, П ~ 0,535 (для Р = 1 — 4« = 0,975) и я ~( 0,065, П ) 0,582 (для Р = 1 — 4) = — 0,995).
Следовательно, в первом случае П «. х и гипотеза случайности отвергается, а во втором случае и ( л ( П и гипотеза случайвоств ке отвергается. Иными словами, приближенный критерий, осиованный иа В-приближении, дает тот же реаультат, что а критерий типа Х«с поправкой на дискретность.
По таблице 6.7 точвые критические значения длз количества серий»д л (0,025; 8; 20) = 7, С (0,025; 8, 20) = 17, х (0,005; 8, 20) = 6, 6 (0,005; 8, 20) = 18, поэтому заключения, сделавные иа основе приблвжеккых критериев, следует считать празильвыми (более того, непосредственными вычислениями можно убедиться, что приближенные критические значения совпадают с точвыми).
Подробнее о количестве серий в последовательности независимых испытаний, а также о критерии серий см. 132, 47, 82, 128, 137]. Таблица 6.8. Критические значения статистики И' критерия Вилкоксона Критерий Вилкоксона предназначен для проверни гипотезы Не об однородности двух выборок: Ц, ь«з~ ° ° .ю «ьп»«Ь> ь»з~ ° ° «$т Предполагается, что элеыенты обеих выборок взаимно независимы и подчиняются непрерывным распределениям.
Основная гипотеза Н, заключается в предположении, что обе выборки извлечены из одной и той же совокупности и, значит, функции распределения случайных величин 9 и 6' одинаковы. Эту гипотезу можно выразить тождеством: Нэ. 'Р ($ (х) ж Р Д' (х) ((х (( оо) и воспользоваться для ее проверки каким-либо ранговым критерием (не ограничивая общности, предположиы, что т ( и; в противном случае 9 н 5' можно поменять местами).
С этой целью составим из величин 9«и 5, один общий вариационный ряд, т. е, располоя«им $; и з порядке возрастания их значений. В резуль- тате получим последовательность типа ххухххууу у ... х у у 1 2 3 4 5 6 7 8 9 10 ... Л' — 2 Л' — 1 У, где Л' = и + п н буквамн х н у обозначены члены вариационного ряда, принадлежащие выборкам 6, и $; соответстврнно. Снизу укаааны порядковые номера (ранги). Пусть г„, г,...., г — ранги, соответствующие величинам х, и пусть Х (г) — некоторая функция, определенная для всех г = 1, 2,..., ЛГ.
В 'качестве статисуикя радгового критерия можно использовать сумму 1 (г,) + 1 (г,) + ... + 1 (г„). Ранговый критерцй Вилкоксона получается тогда, когда совокупность значений функции 1 (г) представляет собой заранее фиксированную (не зависящую от выборочных значений $1 и $;) подстановку с 1 2 ... Л ( г(1) з(2) ...
з (Л>)/' (40) где з (1), з (2),..., з (Л') — одна нз возможных Л') перестановок чисел 1, 2,..., >У. Таким образом, ((г) = — з (г). Статистика критерия Вилкоксона задается формулой И' = (~~) + (г,) + ... + (г ), где по-прежнему г; — ранги случайных величин $, в общем вариационном ряде. Выбор подстановки (40) осуществляется так, чтобы для заданной конкурирующей гипотезы Н, мощность критерия была по возмох>ности наибольшей.
Например, если согласно ХХ, при всех действительных х Р Д ( х) ( Р Д' ( х) Р Д ( х) ) Р Д' ( т), то целесообразно положить з (г) == г и вычислять гр по формуле И~ = г, + г, +...+ г . Если же М$; =- М$, (без общности это математическое ожидание можно считать равным нулю) и по альтернативной гипотезе Р Д ( ( х) Ф Р Д' ( х), причем существует такое значение параметра масштаба с (О 'с ~ 1), что Р Д ( х) == Р Д' ( сх), то в подстановке (40) полагают (см. (107, Т461) з(1) = 1, г(Л') = 2, з(Л' — 1) = 3, з(2) =- 4, з(3) = 5, з()Ч вЂ” 2) = 6 и т.
д. При этом, когда Л> = 2й + 1 (т. е. когда Л>— число почетное), считают з(й + 1) = О, уменьшая этим самым объем одной из выборок и Л> на единицу (в результате Л' становится четным). — 9 Распределениестатистикн И' критерия Вилкоксона зависит лишь от объемов выборок т и и н не зависит от выбора подстановки (40) (если в подстановке (40) з()с + 1) = О, то нужно учнтцвать умецьшен>(е объема одной нз выборок на единицу).