Стентон Гланц - Медико-биологическая статистика (1034784), страница 6
Текст из файла (страница 6)
Таккак выборочное среднее определяется именно такой суммой, егораспределение стремится к нормальному, причем чем большеобъем выборок, тем точнее приближение. (Если выборки принадлежат совокупности с нормальным распределением, распределение выборочных средних будет нормальным независимо отобъема выборок).Поскольку распределение на рис. 2.7 нормальное, его можноописать с помощью среднего и стандартного отклонения.Так как среднее значение для рассматриваемых 25 точек естьсреднее величин, которые сами являются средними значениями, обозначим его X X . Аналогично, стандартное отклонениеобозначим s X .
По формулам для среднего и стандартного отклонения находим X X = 40 см и s X = 1,6см.Среднее выборочных средних X X оказалось равно среднемуµ всей совокупности из 200 марсиан. Ничего неожиданного вэтом нет. Действительно, если бы мы провели исследования всехвозможных выборок, то каждый из 200 марсиан был бы выбранравное число раз. Итак, среднее выборочных средних совпадетсо средним по совокупности.Интересно, равно ли s X стандартному отклонению, σ совокупности из 200 марсиан? Стандартное отклонение для совокупности выборочных средних s X равно 1,6 см, а стандартноеотклонение самой совокупности — 5 см.
Почему s X меньше,чем σ? В общих чертах это можно понять, если учесть, что вслучайную выборку редко будут попадать одни только коротышки и одни гиганты. Чаше их будет примерно поровну, и отклонения роста от среднего будут сглаживаться. Даже в выборке,куда попадут 10 самых высоких марсиан, средний рост составит только 50 см, тогда как рост самого высокого марсианина— 53 см.Подобно тому, как стандартное отклонение исходной выбор-КАК ОПИСАТЬ ДАННЫЕ41ки из 10 марсиан s служит оценкой изменчивости роста марсиан, s X является оценкой изменчивости значений средних для выборок по 10 марсиан в каждой.
Таким образом, величина s X служит мерой точности, с которой выборочное среднее X являетсяоценкой среднего по совокупности µ. Поэтому s X носит название стандартной ошибки среднего.Чем больше выборка, тем точнее оценка среднего и тем меньше его стандартная ошибка. Чем больше изменчивость исходной совокупности, тем больше изменчивость выборочных средних, поэтому стандартная ошибка среднего возрастает с увеличением стандартного отклонения совокупности.Истинная стандартная ошибка среднего по выборкам объемом n, извлеченным из совокупности, имеющей стандартноеотклонение σ, равна*:σ.nСобственно стандартная ошибка — это наилучшая оценкавеличины σ X по одной выборке:σX =sX =s,nгде s — выборочное стандартное отклонение.Так как возможные значения выборочного среднего стремятсяк нормальному распределению, истинное среднее по совокупности примерно в 95% случаев лежит в пределах 2 стандартныхошибок выборочного среднего.Как уже говорилось, распределение выборочных среднихприближенно всегда следует нормальному распределению независимо от распределения совокупности, из которой извлечены выборки.
В этом и состоит суть утверждения, называемогоцентральной предельной теоремой. Эта теорема гласит следующее.• Выборочные средние имеют приближенно нормальное распределение независимо от распределения исходной совокупности, из которой были извлечены выборки.*Вывод этой формулы приведен в гл. 4.42ГЛАВА 2• Среднее значение всех возможных выборочных средних равно среднему исходной совокупности.• Стандартное отклонение всех возможных средних по выборкам данного объема, называемое стандартной ошибкой среднего, зависит как от стандартного отклонения совокупности, так и от объема выборки.На рис.
2.8 показано, как связаны между собой выборочноесреднее, выборочное стандартное отклонение и стандартнаяошибка среднего и как они изменяются в зависимости от объема выборки*. По мере того как мы увеличиваем объем выборки, выборочное среднее X и стандартное отклонение s дают всеболее точные оценки среднего µ и стандартного отклонения σпо совокупности.
Увеличение точности оценки среднего отражается в уменьшении стандартной ошибки среднего σ X . Набрав достаточное количество марсиан, можно сделать стандартную ошибку среднего сколь угодно малой. В отличие от стандартного отклонения стандартная ошибка среднего ничего неговорит о разбросе данных, — она лишь показывает точностьвыборочной оценки среднего.Хотя разница между стандартным отклонением и стандартной ошибкой среднего совершенно очевидна, их часто путают.Большинство исследователей приводят в публикациях значениестандартной ошибки среднего, которая заведомо меньше стандартного отклонения. Авторам кажется, что в таком виде их данные внушают больше доверия.
Может быть, так оно и есть, однако беда в том, что стандартная ошибка среднего измеряетименно точность оценки среднего, но никак не разброс данных,который и интересен читателю. Мораль состоит в том, что, описывая совокупность, всегда нужно приводить значение стандартного отклонения.*Рис. 2.8 получился следующим образом. Из совокупности марсиан (рис.2.1) взяли наугад двух марсиан. По этой выборке вычислили X , s и s X .Потом опять же наугад выбрали еще одного марсианина и добавив его квыборке снова рассчитали эти показатели. Добавляя каждый раз по одному случайно выбранному марсианину, объем выборки довели до 100.
Еслибы мы повторили эксперимент, очередность извлечения марсиан была быиной, и рисунок выглядел бы немного иначе.КАК ОПИСАТЬ ДАННЫЕ43Рис. 2.8. С увеличением объема выборки возрастает точность оценки параметровраспределения. Выборочное среднее X стремится к среднему в совокупности µ выборочное стандартное отклонение s стремится к стандартному отклонению в совокупности σ, а стандартная ошибка среднего стремится к нулю.Рассмотрим пример, позволяющий почувствовать различиемежду стандартным отклонением и стандартной ошибкой среднего, а также уяснить, почему не следует пренебрегать стандартным отклонением.
Положим, исследователь, обследовав выборкуиз 20 человек, пишет в статье, что средний сердечный выброссоставлял 5,0 л/мин со стандартным отклонением 1 л/мин. Мызнаем, что 95% нормально распределенной совокупности попадает в интервал среднее плюс–минус два стандартных отклоне-44ГЛАВА 2ния. Тем самым, из статьи видно, что почти у всех обследованныхсердечный индекс составил от 3 до 7 л/мин. Такие сведения весьма полезны, их легко использовать во врачебной практике.Увы, приведенный пример далек от реальности.
Скорее автор укажет не стандартное отклонение, а стандартную ошибкусреднего. Тогда из статьи вы узнаете, что «сердечный выброссоставил 5,0 ± 0,22 л/мин». И если бы мы спутали стандартнуюошибку среднего со стандартным отклонением, то пребывалибы в уверенности, что 95% совокупности заключено в интервалот 4,56 до 5,44 л/мин.
На самом деле в этом интервале (с вероятностью 95%) находится среднее значение сердечного выброса.(В гл. 7 мы поговорим о доверительных интервалах более подробно). Впрочем, стандартное отклонение можно рассчитатьсамому — для этого нужно умножить стандартную ошибку среднего на квадратный корень из объема выборки (численностигруппы). Правда, для этого нужно знать, что же именно приводит автор — стандартное отклонение или стандартную ошибкусреднего.ВЫВОДЫКогда совокупность подчиняется нормальному распределению,она исчерпывающе описывается параметрами распределения —средним и стандартным отклонением. Когда же распределениесильно отличается от нормального, более информативны медиана и процентили.Так как наблюдать всю совокупность удается редко, мы оцениваем параметры распределения по выборке, случайным образом извлеченной из совокупности.
Стандартная ошибка среднего служит мерой точности, с которой выборочное среднее является оценкой среднего по совокупности.Эти величины полезны не только для описания совокупности или выборки. Их можно также использовать для проверкистатистических гипотез, в частности о различиях между группами.Этому и будет посвящена следующая глава.КАК ОПИСАТЬ ДАННЫЕ45ЗАДАЧИ2.1.
Найдите среднее, стандартное отклонение, медиану, 25й и 75-й процентили для следующей выборки 0; 0; 0; 1; 1; 1; 1;1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 4; 4; 5; 5; 5; 5; 6; 7; 9; 10; 11.Можно ли считать, что выборка извлечена из совокупности снормальным распределением? Обоснуйте свой ответ. (Приведенные числа — клинические оценки тяжести серповидноклеточной анемии.
Подробный анализ этого исследования см. в задаче 8.9. Данные заимствованы из работы: R. Hebbel et al. Erythrocyte adherence to endothelium in sickle-cell anemia: a possibledeterminant of disease seventy. N. Engl. J. Med., 302, 992–995, 1980).2.2. Найдите среднее, стандартное отклонение, медиану, 25й и 75-й процентили для следующих данных 289, 203, 359, 243,232, 210, 251, 246, 224, 239, 220, 211. Можно ли считать, чтовыборка извлечена из совокупности с нормальным распределением? Обоснуйте свой ответ. (Эти числа — продолжительность(в секундах) физической нагрузки до развития приступа стенокардии у 12 человек с ишемической болезнью сердца. Данныезаимствованы из работы: W.
Aronow. Effect of nonnicotine cigaretts and carbon monoxide on angina. Circulation, 61:262–265, 1979.Более подробно эта работа описана в задаче 9.5.)2.3. Найдите среднее, стандартное отклонение, медиану, 25й и 75-й процентили для следующих данных 1,2; 1,4; 1,6; 1,7;1,7; 1,8; 2,2; 2,3; 2,4; 6,4; 19,0; 23,6. Можно ли считать, что это— выборка из совокупности с нормальным распределением?Обоснуйте свой ответ. (Приведены результаты оценки проницаемости сосудов сетчатки из работы: G. A.
Fishman et al. Bloodretinal barrier function in patients with cone or cone-rod dystrophy.Arch . Ophthalmol., 104:545–548, 1986.)2.4. Опишите распределение числа очков, выпадающих прибросании игральной кости. Найдите среднее число очков.2.5. Бросьте одновременно две игральные кости, посмотрите, сколько очков выпало на каждой из них, и рассчитайте среднее. Повторите опыт 20 раз и постройте распределение средних, найденных после каждого броска.