Учебник_Бочаров_Печинкин (846435), страница 53
Текст из файла (страница 53)
Критерии однородности двух выборок общего вариационного ряда и весьма разумным представляется выбор перестановки з~ = 1, кое = 2, з„тт ~ = 3, за = 4, аз = 5, з„е.„,. з = 6 и т.д. Если верна основная гипотеза Но. р'~(ш) = Гз(х), то распределение статистики критерия Вилкоксона зависит лишь от объемов выборок и и т, и не зависит от конкретно используемой перестановки (зы аз,..., з„эт).
Поэтому в соответствии с принципом классической вероятности уровень значимости (размер) а одностороннего критерия Вилкоксона для критического значения С определяется как число тех сочетаний (гы ...,г„,) из п, Ч- гп элементов по т,, для которых Ги-ь шх г| ' ... + г,„< С, отнесенного к общему числу сочетаний ( ). и Поскольку обычно, наоборот, по уровню значимости о определяют критическое значение С, то именно такая таблица приведена в [1] (табл. 6.8).
Уровень значимости двустороннего критерия Внлкоксона находится как удвоенный уровень значимости одностороннего критерия с С = Си Для вычисления критических значений С1 и Сз двустороннего критерия с уровнем значимости о мы должны по табл. 6.8 определить критическое значение С одностороннего критерия с уровнем значимости сх/2, а затем положить С~ = С' и Са = )т' — С~ (Дг = ки(п+ гп+ 1)). Наконец, если объем хотя бы одной из выборок Хы...,Х„или уы...,у„, велик, можно воспользоваться асимптотической нормальностью статистики Вилкоксона ш со средним Л/2 и дисперсией пзп(т+ п + 1)/!2; в этом случае при заданном уровне значимости сг следует положить для одностороннего критерия о7 гпп(о~+ и -'с 1) ~1 — 2 + 12 а для двустороннего— С 12 ~з' где со — о-квантиль стандартного нормального закона ((1), табл.
1.3). Пример 12. Для сравнительного анализа надежности крепежных болтов, выпускаемых двумя заводами, были проверены на разрыв и = 24 изделия первого завода и т = 20 изделий второго. Силы натяжения (х10з Н), прн которых произошли разрывы изделий первого и второго заводов, приведены в табл 7 и 8 Таблица 7 Гл. 3. Проверка саажистических гипотез 250 Таблица 8 ш = 5+ 8+ 11+ .. + 43444 = 571.
Так как мы используем двусторонний критерий Вилкоксона, то нижнее критическое значение С1 при уровне значимости о = 0,01 совпадает с критическим значением С = 34! одностороннего критерия Вилкоксона, имеющего уровень Таблица 9 Хтг Хю Уто х,„ Хго 2,33 1,26 1,60 1,7! 1,72 '2, 17 1,01 1, 17 1,!8 2, 12 2,20 ! 2 6 7 10 Кз Х~~ Х4 Х14 Хз Уз Хв 2,50 2,60 15 16 2,36 2,45 2,49 2,63 2,80 17 18 2,81 2,89 2,90 3,06 22 12 13 14 19 20 Хз Хз Хет Хы У) Х, Х~з 3,58 3,75 3,08 3,09 3, 12 3,23 3,31 3,37 3,57 3,71 3,76 23 24 26 27 28 29 3! 30 !и Ут 16 )' Хз Х,а 4,43 4,48 3,77 3,86 4,59 4,60 4,79 4,83 5,48 5,76 4,11 34 35 36 37 38 39 40 4! Проверим с помощью критерия Вилкоксона уровня значимости (размера) сх =- 0,01 гипотезу Но о том, что надежность изделий обоих заводов одинакова Для того чтобы воспользоваться критерием Вилкоксона, нужно сначала задать перестановку (вь..., в„т,„). Анализируя условия задачи, видим, что наименее благоприятным будет случай, когда надежность болтов, выпускаемых одним заводом, систематически меньше надежности аналогичных изделий другого завода, и, значит, в качестве перестановки (вп...,вы) естественно выбрать перестановку (1,2,...,44), причем из-за отсутствия априорных предпосылок предпочесть изделия какого-либо завода мы должны воспользоваться двусторонним критерием Вилкоксона Образуем теперь общий вариационный ряд выборок Хи ..,, Хзч и Уи..., Уео (табл.
9) и определим значение статистики ит критерия Вилкоксона б. Критерии однородности двух выборок 251 значимости 0,005 11, с. 360~, а верхнее критическое значение Ся определяется формулой Са = Дг — С~ = 20(24 + 20 + 1) — 341 = 900 — 341 = 559. Сравнивая значение статистики и~ = 57! с критическими значениями С~ и Сж видим, что и > Са. Таким образам, гипотезу 11о об одинаковой надежности крепежных болтов, выпускаемых обоими заводами, нужно признать не соответствующей результатам проверки, а для практических потребностей рекомендовать изделия второго завода как более надежные.
П Глава 4 НЕКОТОРЫЕ ЗАДАЧИ, СВЯЗАННЫЕ С НОРМАЛЬНЫМИ ВЫБОРКАМИ Мы уже не раз указывали на ту важную роль, которую играет в теории вероятностей и ее приложениях нормальный закон. Естественным отражением этой роли в математической статистике является наличие специальных мелгодое, ориентированных на нормально раслределенньге выборки. Некоторые нз этих методов и будут рассмотрены в настоящей главе Однако сразу же условимся, что сюда не будут включены такие задачи, как оценка неизвестных параметров нормального закона и построение для них доверительных интервалов, проверка гипотез о параметрах нормального закона и т.
и., поскольку они решаются общими методами, изложенными в предыдущих главах. 1. Общая характеристика задач Прежде чем приступить к описанию задач, рассматриваемых в данной главе, заметим, что хотя всюду в этой главе и будет предполагаться нормальность всех выборок, предлагаемые методы с разной степенью обоснованности можно применить и к выборкам, отличающимся от нормальных. В частности, полученные по методу наименьших квадратов оценки параметров линейной и регрессионной люделей, для нормального случая являющиеся эффективными, в случае произвольно распределенной выборки также будут иметь минимальные дисперсии, но в классе линейных (т.е.
выражаемых линейно через элементы выборки) оценок. Однако применение 1- и Хз-распределений для построения доверительных интервалов и проверки гипотез в тех же моделях ведет к существенным ошибкам в выводах, причем при отклонениях теоретического распределения от нормального использование 1-распределения, как правило, приводит к меньшим ошибкам, чем использование Х~-распределения. Здесь мы сталкиваемся с важной проблемой чувствительности (или, как сейчас модно говорить, робастости) статистических процедур к воздействиям определенного типа. Интерес к этой тематике усиливает еще и то, что в реальной жизни вряд ли можно встретить «100"ть-чистоеь нормальное распределение. Саму проблему робастости мы здесь не рассматриваем, отсылая заинтересованного читателя к специальной литературе.
Материалы настоящей главы можно условно разбить на две части. В первой части (параграфы 2 — 4) рассматриваются некоторые специальные критерии согласия (параграф 2), критерии равенства дисперсий нескольких выборок (параграф 3) и задачи, связанные с выборочным 253 2. Критерии согласия коэффициентом корреляции (параграф 4). Изложенные здесь результаты можно применять как вспомогательные при анализе моделей второй части, но они представляют и самостоятельный интерес. Вторая часть главы (параграфы 5-8) предназначена для первоначального знакомства читателя с общей линейной моделью (иногда говорят »гипотезой», однако мы предпочитаем употреблять слово »гипотеза» только в первоначальном смысле), регрессионной моделью и задачами дисперсионного анализа.
По сути дела, эти три раздела столь близки между собой, что задачи, формулируемые в одном из них, легко переформулировать в терминах другого; кроме того, объединяющим их стержнем является метод наименьших квадратов. Собственно говоря, параграфы 5 — 7 дают тройной пересказ практически одинакового материала. Однако мы сознательно позволяем себе такую роскошь, поскольку, во-первых, читатель должен научиться ориентироваться в проблемах математической статистики и ему нужно дать хотя бы минимальные сведения о всех наиболее важных возможных подходах, а во-вторых, каждый подход обладает своей «изюминкой».
В частности, общая линейная модель позволяет геометрически наглядно выяснить причину появления метода наименьших квадратов, регрессионная модель обладает простым физическим смыслом, а дисперсионный анализ проясняет ту роль, которую играет правильная группировка составляющих выборочной дисперсии при проверке гипотез об отсутствии действия различных факторов. Наконец, последний параграф главы дает некоторое представление о планировании эксперимента в дисперсионном анализе, т. е. о методах, позволяющих при минимальном числе наблюдений получить по возможности наиболее обоснованный ответ на вопрос о существовании воздействия факторов на рассматриваемое явление.
В этой связи отметим важную роль, которую играет в планировании эксперимента теория Галуа. Однако поскольку не предполагается знакомство читателя с этой теорией, мы ограничились здесь общей постановкой задачи и выписыванием простейших планов. Последнее замечание касается принятых в этой главе обозначений. Мы вернемся к использованным нами в курсе теории вероятностей обозначениям т и аз параметров нормального закона, поскольку из постановки задачи всегда будет видно, значение какого из этих параметров известно, а какого -- нет. 2. Критерии согласия Рассматриваемые в этом параграфе критерии согласия проверяют сложную основную гипотезу Но.
теоретическая функция распределения с'(х) является нормальной (т.е. выборка Хи ...,Х„ произведена из нормальной генеральной совокупности с неизвестными параметрами т, и а~) против сложной альтернативной гипотезьь Ни теоретическая функция распределения не является нормальной. Разумеется, приведенные в гл. 3 критерии согласия (Колмогорова, ша и уа) применимы 254 Гл.
4. Некоторые задачи, связанные с нормальнь!ми выборками и в этом случае, однако на практике проверку на нормальность часто начинают с использования более простых, хотя, вообще говоря, менее мощных критериев, основанных (кроме критерия исключения резко выделяющихся наблюдений) на сравнении эмпирических и теоретических моментов выборки.
Естественно, поскольку мы не интересуемся конкретными значениями среднего т и дисперсии а~, а они являются определяющими параметрами нормального закона, во всех предложенных ниже критериях будут использоваться нх оценки: выборочное Х, (Х,— т )~ среднее т" =- э --' и выборочная дисперсия в " = Ъ и — 1 ч=! ь=! Выборочный момент первого порядка (выборочное среднее) т,' = т', для построения критерия согласия мы использовать не можем, поскольку он уже применен в качестве оценки среднего нормального закона (по аналогичной причине не используется выборочный второй момент), однако мы можем обратиться к выборочному абсолютному центральному моменту первого порядка.
Рассмотрим статистику р' = ~ !Х, — т'. Нетрудно показать, что при условии справедливости гипотезы Но распределение статистики р' зависит только от объема выборки 'а и не зависит от параметров т и а нормального закона, а в силу закона больших чисел и состоятельности чгвз как оценки среднего квадратичного отклонения сама статистика р' при а — эо сходится к первому абсолютному моменту р, стандартного нормального распределения (равному примерно 0,8). Естественно, если значение статистики р' сильно отличается от р, следует отклонить гипотезу Но. Значит, гипотеза Но принимается, если С! < р* < Сг.















