Стентон Гланц - Медико-биологическая статистика (1034784), страница 8
Текст из файла (страница 8)
Понятно, что такая оценка дисперсии зависит от различий выборочных средних.Если экспериментальные группы — это четыре случайныевыборки из одной и той же нормально распределенной совокупности (применительно к нашему эксперименту это значилобы, что диета не влияет на сердечный выброс), то обе оценкидисперсии совокупности дали бы примерно одинаковые результаты.
Поэтому, если эти оценки оказываются близки, то мы неможем отвергнуть нулевую гипотезу. В противном случае мыотвергаем нулевую гипотезу, то есть, заключаем маловероятно,что мы получили бы такие различия между группами, если быони были просто четырьмя случайными выборками из однойнормально распределенной совокупности.Перейдем к вычислениям. Как оценить дисперсию совокупности по четырем выборочным дисперсиям? Если верна гипотеза о том, что диета не влияет на величину сердечного выброса, то любая из них дает одинаково хорошую оценку.
Поэтому вкачестве оценки дисперсии совокупности возьмем среднее выборочных дисперсий. Эта оценка называется внутригрупповой2дисперсией; обозначим ее sвну.2sвну=1 2222sкон + sмак+ sмяс+ sфру,4()2222где sкон, sмак, sмяс, sфру — выборочные оценки дисперсии в группах, питавшихся как обычно (контроль), макаронами, мясом ифруктами. Дисперсия внутри каждой группы вычисляется относительно среднего для группы. Поэтому внутригрупповая дисперсия не зависит от того, насколько различаются эти средние.Оценим теперь дисперсию совокупности по выборочным средним.
Так как мы предположили, что все четыре выборки извлечены из одной совокупности, стандартное отклонение четырехвыборочных средних служит оценкой ошибки среднего. На-СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ55помним, что стандартная ошибка среднего σ X связана со стандартным отклонением совокупности σ и объемом выборки n следующим соотношением:σ.nТем самым, дисперсию совокупности σ2 можно рассчитатьследующим образом:σX =σ 2 = nσ X2 .Воспользуемся этим, чтобы оценить дисперсию совокупности по разбросу значений выборочных средних. Эта оценка на2.зывается межгрупповой дисперсией, обозначим ее sмеж2sмеж= ns X2 ,где s X2 — оценка стандартного отклонения выборки из четырехсредних.Если верна нулевая гипотеза, то как внутригрупповая, так имежгрупповая дисперсии служат оценками одной и той же дисперсии и должны быть приближенно равны.
Исходя из этого,вычислим критерий F:Дисперсия совокупности,оцененная по выборочным среднимF=,Дисперсия совокупности, оцененнаяпо выборочным дисперсиямилиF=2sмеж.2sвнуИ числитель, и знаменатель этого отношения — это оценкиодной и той же величины — дисперсии совокупности σ2, поэтому значение F должно были близко к 1. Для четырех групп,представленных на рис. 3.2, значение F действительно близкок единице. Теперь наши исследователи влияния диеты на сердечный выброс могут сделать определенные выводы. Получен-56ГЛАВА 3ные в эксперименте данные не противоречат нулевой гипотезе,следовательно, нет оснований, считать, что диета влияет насердечный выброс.
Что касается данных, которые мы специальносконструировали, чтобы убедить читателя в таком «влиянии»(рис. 3.3), то для них F = 68,0. Для данных, изображенных нарис. 3.4, F = 24,5. Как видим, величина F хорошо согласуется свпечатлением, которое складывается при взгляде на рисунок.Итак, если F значительно превышает 1, нулевую гипотезуследует отвергнуть. Если же значение F близко к 1, нулевуюгипотезу следует принять. Осталось понять, начиная с какойименно величины F следует отвергать нулевую гипотезу.КРИТИЧЕСКОЕ ЗНАЧЕНИЕ FЕсли извлекать случайные выборки из нормально распределенной совокупности, значение F будет меняться от опыта к опыту.Например, на рис. 3.5 представлен еще один набор из четырехслучайных выборок по семь человек в каждой, извлеченных изнашей совокупности в 200 человек. На этот раз F = 0,5. Положим, что нам удалось повторить эксперимент с жителями тогоже городка, скажем, 200 раз.
Каждый раз мы заново набиралипо четыре группы, и каждый раз вычисляли F. На рис. З.6А приведены результаты этого многократного эксперимента. Значения F округлены до одного знака после запятой и изображеныкружками. Два черных кружка соответствуют данным с рис. 3.2и 3.5. Как и следовало ожидать, большинство значений F близкок единице (попадая в интервал от 0 до 2), только в 10 из 200 опытов (то есть в 5% случаев) мы получили значение F, большее илиравное З. (На рис. 3.6Б эти 10 значений показаны черными кружками). Значит, отвергая нулевую гипотезу при F ≥ 3, мы будемошибаться в 5% случаев. Если такой процент ошибок не чрезмерен, то будем считать «большими» те значения F, которые больше или равны 3.
Значение критерия, начиная с которого мы отвергаем нулевую гипотезу, называется критическим значением.Вероятность ошибочно отвергнуть верную нулевую гипотезу,то есть найти различия там, где их нет, обозначается Р. Как правило, считают достаточным, чтобы эта вероятность не превышалаСРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ575%. (Максимальная приемлемая вероятность ошибочно отвергнуть нулевую гипотезу называется уровнем значимости и обозначается α).
Почему бы не повысить критическое значение Fтем самым, уменьшая эту вероятность? Однако в этом случаевозрастет риск ошибочно принять неверную нулевую гипотезу(то есть не найти различий там, где они есть). Подробнее мыпоговорим об этом в гл. 6.Итак, мы решили, приняв допустимой 5% вероятность ошибки, отвергать нулевую гипотезу при F > 3. Однако критическоезначение F следовало бы выбрать на основе не 200, а всех 1042экспериментов, которые можно провести на совокупности из200 человек. Предположим, что нам удалось провести все этиэксперименты.
По их результатам мы вычислили соответствующие значения F и нанесли их на график (рис. 3.6В). Здесь каждое значение F изображено «песчинкой». На долю темных песчинок в правой части горки приходится 5% всех значений. Картина, в общем, похожа на ту, что мы видели рис. 3.6Б. На практике совокупности гораздо больше, чем население нашего городка, а число возможных значений F несравненно больше 1042.Если мысленно увеличить объем совокупности до бесконечности, то песчинки сольются, и получится гладкая кривая, изображенная на рис. 3.6Г.
Площади под кривой аналогичны долям отобщего числа кружков или песчинок на рис. 3.6А, Б и В. Заштрихованная область на рис. 3.6Г составляет 5% всей площадипод кривой. Эта область начинается от F = 3,01, это и есть критическое значение F.В нашем примере число групп равнялось 4, в каждую группувходило 7 человек. Если бы число групп или число членов в каждой группе было другим, кривая пошла бы по-другому и критическое значение F тоже было бы другим. Вообще, критическоезначение F однозначно определяется уровнем значимости (обычно0,05 или 0,01) и еще двумя параметрами, которые называютсявнутригрупповым и межгрупповым числом степеней свободы иобозначаются греческой буквой ν («ню»). Оставим в стороне вопрос о происхождении этих названии и просто укажем, как их определять. Межгрупповое число степеней свободы — это числогрупп минус единица νмеж = m – 1.
Внутригрупповое число степеней свободы — это произведение числа групп на численность58ГЛАВА 3Рис. 3.6. А. Четыре случайные выборки по 7 человек в каждой извлекли из той же совокупности (население городка) 200 раз. Каждый раз рассчитывали значение F и наносили его на график. Результаты для выборок с рис. 3.2 и 3.5 помечены черным. Б. Десятьнаибольших значений помечень черньм. Область черных кружков начинается со значения F, равного 3,0.каждой из групп минус единица νвну = m (n – 1). В примере с исследованием диеты межгрупповое число степеней свободы равно4 – 1 = 3, а внутригрупповое 4 (7 – 1) = 24. Вычислить критическое значение F довольно сложно, поэтому пользуются таблицамикритических значений F для разных α, νмеж и νвну. (табл.
3.1).Математическая модель, на которой основано вычислениекритических значений F предполагает следующее.• Каждая выборка независима от остальных выборок.• Каждая выборка случайным образом извлечена из исследуемой совокупности.СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ59Г01,02,03,04,0Значение FРис. 3.6. (продолжение). В. Из той же совокупности извлекли все воэможньенаборы из 4 выборок по 7 человек в каждой и построили распределение F. Отдельные значения слились, превратившись в песчинки.
5% песчинок с самымибольшими значениями F помечены черным. Г. Такое распределение F получится, если извлекать выборки из бесконечной совокупности. Пяти процентам самых высоких значений F соответствует заштрихованная область (ее площадьсоставляет 5% от общей площади всей кривой). «Большие» значения F начинаются там, где начинается эта область, то есть с F = 3,01.• Совокупность нормально распределена.• Дисперсии всех выборок равны.При существенном нарушении хотя бы одного из этих условий нельзя пользоваться ни таблицей 3.1, ни вообще дисперсионным анализом.В рассмотренном нами эксперименте исследовалась зависимость только от одного фактора — диеты. Дисперсионный ана-16151413121110987654321161405218,5198,5010,1334,127,7121,206,6116,265,9913,755,5912,255,3211,265,1210,564,9610,044,849,654,759,334,679,074,608,864,548,684,498,53199499919,0099,009,5530,826,9418,005,7913,275,1410,924,749,554,468,654,268,024,107,563,987,213,896,933,816,703,746,513,686,363,636,23216540419,1699,169,2829,466,5916,695,4112,064,769,784,358,454,077,593,866,993,716,553,596,223,495,953,415,743,345,563,295,423,245,29225562419,2599,259,1228,716,3915,985,1911,394,539,154,127,853,847,013,636,423,485,993,365,673,265,413,185,213,115,043,064,893,014,77230576419,3099,309,0128,246,2615,525,0510,974,398,753,977,463,696,633,486,063,335,643,205,323,115,063,034,862,964,692,904,562,854,44234585919,3399,338,9427,916,1615,214,9510,674,288,473,877,193,586,373,375,803,225,393,095,073,004,822,924,622,854,462,794,322,744,20237592819,3599,368,8927,676,0914,984,8810,464,218,263,796,993,506,183,295,613,145,203,014,892,914,642,834,442,764,282,714,142,664,03239598119,3799,388,8527,496,0414,804,8210,294,158,103,736,843,446,033,235,473,075,062,954,742,854,502,774,302,704,142,644,002,593,89241602219,3899,398,8127,346,0014,664,7710,164,107,983,686,723,395,913,185,353,024,942,904,632,804,392,714,192,654,032,593,892,543,78242605619,4099,408,7927,235,9614,554,7410,054,067,873,646,623,355,813,145,262,984,852,854,542,754,302,674,102,603,942,543,802,493,69243608319,4099,418,7627,135,9414,454,709,964,037,793,606,543,315,733,105,182,944,772,824,462,724,222,634,022,573,862,513,732,463,62244610719,4199,428,7427,055,9114,374,689,894,007,723,576,473,285,673,075,112,914,712,794,402,694,162,603,962,533,802,483,672,423,55245614319,4299,438,7126,925,8714,254,649,773,967,603,536,363,245,563,035,012,864,602,744,292,644,052,553,862,483,702,423,562,373,45246617019,4399,448,6926,835,8414,154,609,683,927,523,496,283,205,482,994,922,834,522,704,212,603,972,513,782,443,622,383,492,333,37248620919,4599,458,6626,695,8014,024,569,553,877,403,446,163,155,362,944,812,774,412,654,102,543,862,463,662,393,512,333,372,283,26249623419,4599,468,6426,605,7713,934,539,473,847,313,416,073,125,282,904,732,744,332,614,022,513,782,423,592,353,432,293,292,243,18250626019,4699,478,6226,505,7513,844,509,383,817,233,385,993,085,202,864,652,704,252,573,942,473,702,383,512,313,352,253,212,193,10251628619,4799,488,5926,415,7213,754,469,293,777,143,345,913,045,122,834,572,664,172,533,862,433,622,343,432,273,272,203,132,153,02252630219,4899,488,5826,355,7013,694,449,243,757,093,325,863,025,072,804,522,644,122,513,812,403,572,313,382,243,222,183,082,122,97253632419,4899,488,5626,285,6813,614,429,173,737,023,295,792,995,002,774,452,604,052,473,742,373,502,283,312,213,152,143,012,092,90253633419,4999,498,5526,245,6613,584,419,133,716,993,275,752,974,962,764,412,594,012,463,712,353,472,263,272,193,112,122,982,072,86254635019,4999,498,5426,185,6513,524,399,083,696,933,255,702,954,912,734,362,563,962,433,662,323,412,233,222,163,062,102,922,042,81254636019,4999,508,5326,155,6413,494,379,043,686,903,245,672,944,882,724,332,553,932,423,622,313,382,223,192,143,032,082,892,022,78254636619,5099,508,5326,135,6313,464,379,023,676,883,235,652,934,862,714,312,543,912,413,602,303,362,213,172,133,012,072,872,012,75Таблица 3.1.