XVII Математическая статистика (1081432), страница 43
Текст из файла (страница 43)
си = О, 1 = 1, 1А. Если гипотеза Но верна, то при сделанных выше предположениях относительно сб, 1= 1,1А, З = 1,1В, статистики ЯА(Х„)/оз и Яо(Хв)/оз независимы и имеют Кз-распределение с числом степеней свободы 1А — 1 и (1А — 1)(1 — 1) соответственно, а статистики 5з(Х ) ЮА(Х ) 5о(Хв) = (8 14) (1А 1) (1 — 1) являются нес.иещениы.ии оцеккани дисперсии оз отклика' Х. Отсюда следует (см.
Д.3.1), что Р'(1А — 1, (1А — 1К1В-1))- (8.ГО) 5,'(Х.) 5о(Х ) Гипотеза Но не противоречит результатам наблюдений, если выбоРочное значение /, статистики 5лз(Х„)/5оз(Хв) не пРевосходит /„р — — /1 (1А-1, (1А-1)(1В-1)) для заданного уровня зночимосгаи а. В противном случае, т.е. если Ув ) Укр1 гипотезу Не отклоняют. Если приходится отвергать гипотезу Но, то может возникнуть необходимость в проверке однои из гипотез Не, согласно Н1 которой влияние на отклик оказывает ечй уровень фактора А, т.е.
проверяют гипотезу ее1 . Но. о1 =".=Ое 1=ос+1 =...=сцен — — ОФ ол1ЕО. 'См.: Крамер Г. ВА. Двухфакторный днзхзерононный анализ Пусть 1 =1, а »л !в Х.( ...».)= ',, Е~> Хб. пп2 1=1 где з (1А — 1)1 — — 2 зид (Хп) — (Х1. — ~.(2...»л1) з 1А »л Щ(Хп) =1В„,'~ (Х» -Х.(2...»л1) з=2 Действительно, учитывая равенства »л »в Х= — ~~> ~Г х; 1А1В . ззз1 1=1 1, »в »в — ,'!'~х;;+ — ~! х„= 1А1В .
- 1А1В . з=2 1=1 уп! 1А 1 ьв = — Х.1а,2„1+ —,'~ Х;,, 1зх1 никодим ЯА(Хп) =1В'~ (Хр-Х)'= зы! 1 ~г =1 ~ !'Х;.— Х.1, »„1 — — Х,.) = 1А 1А 1 2 = 1В,~ ((Х». — Х.12. »,1) + — (Х.12...»л1 — Х1.)) ° з=1 Тогда сумма квадратов ЯА(Х„) может быть представлена в виде ЯА (Хп) = ЮА(Хп) +»з»А(Хп) з (8.16) 356 В. ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА В полученной сумме преобразуем каждое слагаемое по формуле квадрата суммы. В результате находим (л 1л ЮА(Хв) = (В ~) (Хо — Х.р-2л)) + 2 ~~1 (Х.(2 1л) — Х1.) + 1=1 (А1 1 1, +2~',) (Х1. — Х р..л ))(Х.р 1л) — Х1.) = А . 1=1 (л = (В~~ (Х;. — Х.(2 1 )) +(В(Х1 — Х.(2 1 )) + 1л + ( (Х (2-2л)-Х1.)'+2 ~~ (Хо-Х (2..2л))(Х р..лл) -Х1.). " 1=1 Так как в силУ опРеДелениЯ величин Х;.
и Х.р 1л) ',1 Х,.=(ЮА-1)Х.(, лл), 1ьл2 то 1л ЕГХ;. — Х (г..ял)) = ~~) Х;. — ((А — 1)Х.р (л) = О. Поэтому )л (Х;. — Х.р 1 )) (Х.р 1 ) — Х1.) = =-(Х .-Х.(, „))'+(Х.(2,.2л)-Х1.)~ '(Уо-х.р,л)) = 1=1 (Х1" Х (2..лл)) ал. Решение типовых примеров Собирал теперь все слагаемые, получаем [л Ял(Х ) =1в~(Хр — Х (з..л„)) + 2 11 — з +1н(1- — + — )(х,.-х.(, „„1), 1л Ел что равносильно (8.16). Для проверки гипотезы Не ~ по результатам наблюдений используют статистику Ялн (Хп) В2(Х ) где Ве (Х )2 "еА(Х~) 1л — 2 Эта статистика имеет распределение Фплиера с числом степеней свободы 1л — 2 и (1,л — 1)(1в — 1), если гипотеза Н01 верна .
Аналогично строятся критерии для проверки влияния фактора В на отклик Х. Порядок проведения двухфакторного анализа представим в виде таблицы (табл. 8.3). 8.5. Решение типовых примеров Пример 8.3. Результаты измерений продолжительности (в секундах) химической реакции при различном содержании катализатора даны в табл. 8.4. Проверим гипотезу Но о том, что время химической реакции не зависит от процентного содержания катализатора на уровне зна юности о = 0,01.
Сма Крамер Г. 358 8. ОСНОВЫ ДИСПЕРСИОННОГО А НА ЛИЗА Таблица в.У Таблица 8.,1 В зтой задаче фактор А — процентное содержание катализатора, а случайная величина Х 1отклик) — время химической реакции. Для проверки гипотезы Но.. И1 = ръ = рз = ро о раненстне средних значений р;, 1 = 1,2,3, времени химической реакции при различных уровнях фактора А (5, 10, 15% содержания 359 3.5. Решение типовых примеров катализатора) используем сп!атисп2ику (8.4) ЯА(Х )/(1 — 1) Я1(Х„)/(и — 1) Находим выборочное значение статистики г', по результатам эксперимента. Используя (8.2) и (8.3), вычисляем величины з з е 3 ч - ЕЕ~*"-Ю - ЕЕ*"-ЗЗЕЕ*')— А"=! Ье1 Ь=1 1=1 Ь=! 1ю1 1 = 1465,68 — — (216,2) = 1465,68 — 1416 44 = 49 24 33 3 3 1 ех 2 ! 3 »х ЯА ее,~ ВЯ(ХЬ Х) = ~~! — ( ! Хел) — — ~,» ! Х1Ь) я=1 Ью1 1=1 аи! 1ве! = — ° 80т1 + 51 + — 85ю1 — 141644ее 2 ! 2 ! 2 12 ' 10 11 = 1453,132 — 1416,44 = 36,692.
Теперь определяем разность этих величин 1)! = Я вЂ” ЯА = 49,24 — 36,602 = 12,638 и выборочное значение статистики 36,692/2 18,346 12,638/30 0,421 По таблице квантилей распределения «Фишера (см. табл. П.5) находим /„р — — /о,ве(2,30) = 3,25. Так как /, = 43,47 > /„р — — 3,25, гипотезу Но следует отклонить. 361 8.5. Решение типовых примеров Так как Щ = 21,258 > 1нр ее 3,030, то гипотезу Не отвергаем.
(2) Пример 8.5. В табл. 8.5 приведены опытные данные спектрографнческого исследования с целью пронерки влияния различных фотопленок (фактор А) и электродов (фактор В) на величину Х (отклик), характеризующую интенсивность света. Таблица 8.5 В данном случае фактор А имеет 1л = 5 уровней, фактор  — 1в = 4 уровня, число опытов равно и = 1л1в = 20. Пронерим на уровне значимости о = 0,01 гипотезы: Нол — отсУтствие влиЯниЯ фактоРа А на величинУ Х; Нов — отсУтствие влииниЯ фактоРа В на величинУ Х. Для этого рассчитаем Ь 4 я = — ~~) ~~~ яч = — (20+68+96+132+164) у 24.
1л1не, ы, *' 20 Значения статистик Х;. и Х., вычисленные по формулам 1 ч й — 1 ~ и в приведены соответственно в табл. 8.6 и 8.7. 363 Вопросы и задачи Находим разность вычисленных величин: Яо=Ю вЂ” Ял — Яв =59. Полученные результаты сведем в таблицу (табл. 8.8). Поскольку Ув = 158~7 > Хкр = Уо,о1(4 12) = 5~411 то гипотезу Но следует отвергнуть. Гипотезу Нв следует принять,так как Ув = 3~39 < Увр = Уо,о1 (31 12) = 5192. Вопросы и задачи 8.1. В каком случае дисперсионный анализ называют однофакторным, двухфакторным? 8.2. Какой вид имеет математическая модель (линейная модель) однофакторного дисперсионного анализа? 8.3. Запишите основное тождество дисперсионного анализа в случае: а) действия одного фактора; б) действия двух факторов. 8.4.
Что такое линейный контраст? 8.8. Сформулируйте критерии для проверки статистической гипотезы об одинаковом действии фактора на всех уровнях в случае: а) однофакторного дисперсионного анализа; б) двухфакторного дисперсионного анализа. При каких предположениях относительно случайных ошибок зксперимента применяются эти критерии? 8.6. В табл. 8.9 представлены результаты наблюдений над откликом Х на пяти уровнях. Проверьте гипотезу Но о равенстве средних на уровне значимости о = 0,05.
Ответ: гипотезу о равенстве средних следует отвергнуть. 864 8. ОСНОВЫ ДИСПЕРСИОНИОГО АНАЛИЗА Таблица 8.9 8.Т. В трех магазинах, продающих товары одного вида, по данным товарооборота (в условных единицах) за 8 месяцев работы была составлена сводка (табл.
8.10). Проверьте на уровне значимости о = 0,01 гипотезу Но о равенстве средних значений товарооборота для магазинов. Если гипотеза принимается, найдите несмещенные оценки для среднего. и дисперсии товарооборота для всех трех магазинов. Таблица 8.10 О т в е т: гипотезу о равенстве средних значений товарооборота следует принять; У = 22,08, Я~з = ~')) = 32,64. 8.8. В условиях задачи 8.6 проверьте гипотезы: а) Не . 'п1 = П) р) <з) = из =0; б) Н„: )п4 = из = 0; в) На '. из=,и4 — — О. Ответ: а) гипотезу следует принять; б) гипотезаотвергается; в) гипотеза отвергается.
8.9. В табл. 8.11 представлены результаты наблюдений над откликом Х на пяти уровнях фактора А и трех уровнях фак- 365 Вопросы и задачи тора В. На уровне значимости о= 0,05 проверьте гипотезы: а) Ноя — фактоР А не оказывает вливнин на отклик; б) Нен— фактор В не оказывает влияния на отклик. Таблица 8.11 Ответ: а) гипотеза принимается; б) гипотеза принимается.
9. НЕПАРАМЕТРИ'ВЕСКИЕ МЕТОДЫ СТАТИСТИКИ В предыдущих главах при решении задач математической статистики существенную роль играло предположение о виде ~с точностью до параметров) закона распределения наблюдаемой случайной неличины Х. Жешодьс математической статистики, основанные на этом предположении, называют наралеетнринесмилеи. Примерами параметрических методов являются методы нахождения точечных и ингпервальныя оиенон математического ожидания гауссовской (т.е. распределенной по нормальному закону) случайной неличины Х по данным случайной выборки из ее генеральной совокупностпи.
Однако у параметрических методов имеются существенные недостатки. Во-первых, на практике вид распределения наблюдаемой случайной величины очень часто неизвестен. Вовторых, экспериментальные данные при сборе и обработке информации почти всегда искажаются, что меняет их вид распределения. Поэтому, применяя параметрические методы в условиях такой априорной стохастической неопределенности, необходимо ясно осознавать, что расхождение между нара,негврической моделью и реальной ситуацией может принести (и приводит) подчас к сильно искаженным или даже неверным результатам'. Следовательно, возникает необходимость в разработке таких статистических процедур, которые, с одной стороны, в ситуации, наиболее благоприятной для параметрических методов, почти не уступали бы им в эффективности, а с другой 'Смс Хьюбер Днс.П:, а также: Робастносп в статистике.
Подход на основе функций влианив / Ханаева Ф. и др. 367 а Ь Одновыборочиае задача о сдвиге стороны, были бы малочувствительны к нарушению предположений, лежащих в основе параметрической модели. Такие методы существуют. Они получили название неверамензрическна метгюдов, так как не требуют знания закона распределения наблюдаемой случайной величины и используют лишь минимальную априорную информацию типа информации о непрерывности или симметрии функции распределения. За последнее время непараметрические методы появились почти во всех разделах математической статистики. Они оказывают серьезную конкуренцию классическим процедурам, основанным, главным образом, на предположении о нормальном законе распределения наблюдаемых случайных величин.
Причина этого в том, что непараметрический подход лишь незначительно уступает параметрическому по эффективности, если есть уверенность в истинности параметрической модели (например, в том, что наблюдаемая случайная величина имеет нормальный закон распределения). В то же время при нарушении исходных предположений о законе распределения непараметрические модели могут быть во много раз эффективнее параметрических. Следует отметить, что непараметрические методы с вычислительной точки зрения более трудоемкие, чем параметрические, а иногда и очень сложные.