341_4- Сборник задач по математике для втузов. В 4-х ч. Ч.4_ (ред) Ефимов А.В, Поспелов А.С_2003 -432с (987780), страница 52
Текст из файла (страница 52)
Отношение этих оценок имеет распределение Фишера с 1 — 1 и и — 1 степенями свободы, т.е. 5. Одиофакториый дисперсиоииый анализ 281 водителей. Предполагается, что выборки получены из независимых нор- мально распределенных совокупностей с одной и той же дисперсией. а Очевидно, задача заключается в проверке гипотезы Но . .тг —— = тг = гяз, где ть — математическое ожидание числа ошибок для водителей (с-й группы. В нашем случае 1 = 3, и = 15. Вычисления удобно проводить в такой последовательности: х.. = ~ ~У хм = 10+12+12 = 34, ь=г ~=г ие х~~ — — 104.
ь=! г=г Далее из (1) и (2) получаем иа Я=~ ~ хи в=1 $=1 — — х =104 — — 34 =26,93, г 1 г п " 15 Яг = ~ — х,ь — — х, = 91,086 — — 34 14,02, г 1 г 1 г в=1 яь '" я " ' 15 Юг = (/ — Щ = 26,93 — 14,02 = 12,91. Вычисляем выборочное значение статистики (3): Щ /(1 — 1) 14,02/2 Яг/(и — 1) 12,91/12 Из таблицы П7 находим Годе(2,12) = 3,89. Так как Р, = 6,52 ) 3,89, то гипотеза Не о равенстве средних отклоняется: исследуемые методики обучения водителей дают значимо различные результаты тестового контроля.
1> Линейные контрасты. Если гипотеза Но о равенстве средних отклоняется, то требуется определить, какие именно группы имеют значимое различие средних. Для зтих целей используется меогод линейных Гл.19. Математическая статистика 282 контрастов. Линейный контраст ?,?й определяется как линейная ком- бинация: ?34 = у сйтй, где сй, ?г = 1, 2, ..., 1,— константы, однозначно определяемые из формулировки проверяемых гипотез, причем ) сй = О. Оценка ? ?4 равна й=1 ?Ь = С сйхй, а оценка дисперсии ??4 равна й=1 Сй 2 ~~~ Сй й=1 ий я — 1 нй й=1 Границы доверительного интервала для ??1 имеют вид (4) Пример 2. В условиях примера 1 при двусторонних альтернативных гипотезах проверить гипотезы Но; т1 —— тг, Но .
т1 — — тз: (1) (2) Но .. тг = тз( Но: - (тг+ тз) = тг. (3) (4) 2 3 В соответствии с проверяемыми гипотезами Н ', 1 = 1, 2, 3, 4, (1) определяем линейные контрасты ? ?Г1 = гп1 гп2( ? ~2 гп1 огз) ? ?13 = т2 — тз( 1 ? ?14 = (т1 + т2) — гяз) с1 —— 1, с1 —— 1, с1 —— О, сг — — — 1, сг=О, с2=1, сз — — О; сз = — 1; сз = — 1; 1 С1 — — —, 2 1 С2 2 сз = — 1. -2 Яг 12,91 = — = — = 1,98. — 15 — 3 Найдем границы доверительных интервалов для линейных контрастов ?.)11, 1=1,2,3,4. Предварительно вычислим оценки линейных контрастов и их дисперсий.
Выйорочные средние х1 = 1,43, хг = 2,4, хз = 4. Оценка дисперсии 3 5. Однофакторный дисперсионный анализ 283 Оценки контрастов и их дисперсий г Ы) = 1,43 — 2,4 = — 097 аг~г 108 ~ + ) 037 271 12 1кг = 1743 — 4 = — 27577 аь„— — 1,08 ~ — + — ) 0,51; 1,7 3) /1 14 1,)гг — — 2,4 — 4 = — 1,60, агы — — 1,08 ~ -+ -) 0,58; 15 3) Ы44 — — — 11,43 + 2,4) — 4 = — 2,08, аг =108 + +- 045. При а = 0,05 по таблице П7 находим Е2 (1 — 1, я — 1) = Рд да(2,12) в в 3,89. Чтобы определить доверительные интервалы для линейных контрастов, предварительно вычислим = ~772- 7) 9,99 2,79.
Таким образом, доверительные границы для контрастов Ы;, 2 = 1, 2, 3, 4, по формуле (4) равны соответственно — 0,97 ~ 1,67; -2,57 ~ 2,00; -1,60 ~ 2,12; -2,08 ~ 1,87. Так как нулевое значение накрывается доверительными интервалами для 1)42 и Ыг, то гипотезы Нр и Но принимаются, гипотезы Но и Нд отклоняются. Таким [ 0 (г) (г) (4) образом, значимо различны средние первой и третьей группы, а также среднее арифметическое средних для первых двух групп и среднее третьей группы. > В задачах 19.271 †.278 предполагается, что выборки получены из нормально распределенных генеральных совокупностей с равными дисперсиями.
В каждой задаче требуется проверить гипотезу Но о равенстве средних. Если гипотеза Но принимается, то найти несмещенные оценки среднего и дисперсии. В случае, если гипотеза Но отклоняется, провести попарное сравнение средних, используя метод линейных контрастов. 19.271. а = 0,05. Гл. 19. Математическая статистика 284 19.272. а = 0,10. 19.273. сг = 0,05. 19.274, В трех магазинах, продающих товары одного вида, данные товарооборота за 8 месяцев работы (в тыс. руб.) составили следующую сводку: 3 8 ~) ~ х~ь — — 12592. Принять сг = 0,10. ь=~ ~=~ 19.275. Ниже приводятся данные о содержании иммуноглобулина 1д А в сыворотке крови (в мг%) у больных пяти возрастных групп: ~~) ~ хсь = 2189, ~ ~) х~ь — — 191 791.
Принять а = 0,01. з 5. Однофакторный дисперсионный анализ 285 19.276. На химическом заводе разработаны два новых варианта технологического процесса. Чтобы оценить, как изменится дневная производительность при переходе на работу по новым вариантам технологического процесса, завод в течение 10 дней работает по каждому варианту, включая существующий вариант. Дневная производительность завода (в условных единицах) приводится в таблице: ~) ~) х;и = 1932, ~~) ~) х~ь — — 128810.
Принять а = 0,10. 19.277. Из большой группы полевых транзисторов с недельным интервалом были получены три выборки. Ниже приводятся результаты измерения емкости затвор — сток у этих транзисторов (в пикофарадах): ~~) хн = 52,2, ~~) ха = ~) х,з = 39, ~~ ~~ хос = 130,2, ~~) ~~> х~ь —— 428,48, я = 40. Принять а = 0,10. Гл. 19. Математическая статистика 286 19.278. Время химической реакции при различном содержании катализатора распределилось следующим образом (в секундах): х~ь — — 1466,68. Принять сс = 0,10.
19.279с. Доказать основное тождество (1) дисперсионного анализа. 19.280. Показать, что если гипотеза о равенстве средних верна, ~ь~2 то общее среднее х и статистика — являются несмещенными и — 1 оценками математического ожидания и дисперсии генеральной совокупности. 86. Критерий Хз и его применение 1. Проверка гипотезы о вице распределения генеральной совокупности. Пусть хс, хт, ..., х„— выборка наблюдений случайной величины Х.
Провернется гипотеза Но, утверждающан, что Х имеет функцию распределенин У~(х). Проверка гипотезы Но прн помощи критерия Хт осуществлнетсн по следующей схеме. По выборке наблюдений находнт оценки неизвестных параметров предполагаемого закона распределения случайной величины Х. Далее, область возможных значений случайной величины Х разбивается на г множеств Ь|, Ьт,..., Ь„, например, т интервалов в случае, когда Х - — непрерывная случайная величина, или г групп, состоящих из отдельных значений, для дискретной случайной величины Х. Пусть нь — число элементов выборки, принадлежащих множеству Ьь, г х = 1, 2,..., т.
Очевидно, что ~ ~нс = н. Используя предполагаемый с=1 закон распределения случайной величины Х, находят вероятности рь 3 6. Критерий Хт и его применение 287 того, что значение Х принадлежит множеству Ьь, т.е. рь = Р ~Х б Ьь), к я = 1, 2..., г. Очевидно, что ~ рь = 1. Полученные результаты можно а=1 представить в виде следующей таблицы: 2 %-~ 1яь — нрь)' Хв яра Гипотеза Но согласуется с результатами наблюдений на уровне значимости а, если Х, (Х вЂ” (г — 1 — 1) где Хэ, (г — 1 — 1) — квантиль порядка 1 — а распределения Хз с т — 1 — 1 степенями свободы, а 1 — число неизвестных параметров распределения, оцениваемых по выборке; если же Х~ > Хт, (г — 1 — 1), то гипотеза Но отклоняется.
Замечание. Критерий Х~ использует тот факт, что случайная вень нрь дичина , й = 1, 2, ..., г, имеет распределение, близкое к нор,/ярь мальному Н(0, 1). Чтобы это утверждение было достаточно точным необходимо, чтобы для всех интервалов выполнялось условие прь > 5.
Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними. П р и м е р 1. Проверка гипотезы о распределении по закону Пуассона. В первых двух столбцах таблицы 6.1 приведены данные об отказах аппаратуры за 10000 часов работы, Общее числа обследованных экземпляров аппаратуры я = 757, при этом наблюдался 0 427 + 1 235 + 2 72 + 3 21 + 4 1 + 5 1 = 451 отказ. Проверить гипотезу о том, что число отказов имеет распределение Пуас- сона: Аь рь=Р)Х=Ц= —,е ", 1с=0,1,..., при а=0,01.
Выборочное значение статистики критерия Хэ вычисляется по фор- муле Гл. 19. Математическая статистика 288 Таблица 6.1 з Оценка параметра Л равна среднему числу отказов: Л = 451/757 и 0,6. По таблице ПЗ с Л = 0,6 находим вероятности рь н ожидаемое число случаев с Л отказами (третий и четвертый столбцы таблицы 6.1). Для Л = 4, 5 и 6 значения ярд ( 5, поэтому объединяем этн строки со строкой для Л = 3. В результате получим значения, приведенныс в таблице 6.2. Таблица 6.2 Так как по выборке оценивался один параметр Л, та 1 = 1, число степеней свободы равно 4 — 1 — 1 = 2.
По таблице П5 находим фдд(2) = = 9,21, следовательно, гипотеза о распределении числа отказов по закону Пуассона принимается. > Пример 2. Проверить гипотезу о нормальном распределении выборки из примера 2 з 1. Принять о = 0,1. О Объем выборки я = 55. Для проверки гипотезы о нормальнол~ распределении нужно найти оценки математического ожидания и дисперсии. Имеем ьь т = х = — ~~ х, 17,84, к ~=1 вв бг ат = ~ (х, — х)г 853 п — 1 ь=1 36.
Критерий Хэ и его применение 289 Воспользуемся результатами группировки выборки в примере 2 3 1 1см. таблицу 1.1), расширив первый и последний интервалы. Результаты группировки приведены во втором и третьем столбцах таблицы 6.3. Таблица 6.3 ,О а 1м ом" аох дох к а х \ Ор ярь а х~ Жх — оо — 12 12 — 14 14 — 16 16 — 18 18 — 20 20 — 22 -22 — +оо 5,274 9,273 14,168 13,662 0,725 -1,273 -2,168 -2,338 0,010 0,175 0,332 0,400 12,633 0,366 0,011 Сумма 1,0001 0,928 55 55 55 В четвертом столбце таблицы 6.3 приведены вероятности ры вычисляемые по формуле у'5,:, — ху /аь — ху рь=Р)ХЕЬь]=Ф~ — ) — Ф1 — ), ус=1,2,...,7, тле аь и 6ь — соответственно нижняя и верхняя границы интервалов, а значения функции Ф(х) берутсн нз таблицы П1. В пятом столбце приводятся ожидаемые частоты яры а в шестом — значения яра после объединения первых двух и последних двух интервалов.