Стентон Гланц - Медико-биологическая статистика (1034784), страница 38
Текст из файла (страница 38)
8.5). Вначале упорядочим по возрастанию значения каждой из переменных. Ранг 1 присваивается меньшемузначению, 10 — большему. Упорядочим марсиан по росту. На5-м и 6-м месте в нем стоят одинаковые значения. Присвоим имобщий ранг (5 + 6)/2 = 5,5. Затем упорядочим марсиан по весу идля каждого марсианина вычислим разность рангов роста и веса.Наконец, вычислим коэффициент ранговой корреляции Спирмена:6 ( −1) + ( −1) + 22 + 02 + 0,52 + ( −0,5) + 02 + 02 + 02 =rs = 1 − 310 − 10= 0,96.Обратимся к таблице 8.6, где приведены критические значения коэффициента ранговой корреляции Спирмена для разных уровней значимости и объемов выборки. Критическое значение для уровня значимости 0,001 и объема выборки n = 10равно 0,903, что меньше полученного нами. Тем самым, корреляция статистически значима (Р < 0,001).222ГЛАВА 8264Таблица 8.6.
Критические значения коэффициента ранговойкорреляции СпирменаУровень значимости αn456789101112131415161718192021222324252627282930313233343536373839400,500,6000,5000,3710,3210,3100,2670,2480,2360,2170,2090,2000,1890,1820,1760,1700,1650,1610,1560,1520,1480,1440,1420,1380,1360,1330,1300,1280,1260,1240,1210,1200,1180,1160,1140,1130,1110,1100,201,0000,8000,6570,5710,5240,4830,4550,4270,4060,3850,3670,3540,3410,3280,3170,3090,2990,2920,2840,2780,2710,2650,2590,2550,2500,2450,2400,2360,2320,2290,2250,2220,2190,2160,2120,2100,2070,101,0000,9000,8290,7140,6430,6000,5640,5360,5030,4840,4640,4460,4290,4140,4010,3910,3800,3700,3610,3530,3440,3370,3310,3240,3170,3120,3060,3010,2960,2910,2870,2830,2790,2750,2710,2670,2640,050,020,01 0,005 0,002 0,0011,0000,8860,7860,7380,7000,6480,6180,5870,5600,5380,5210,5030,4850,4720,4600,4470,4350,4250,4150,4060,3980,3900,3820,3750,3680,3620,3560,3500,3450,3400,3350,3300,3250,3210,3170,3131,0000,9430,8930,8330,7830,7450,7090,6780,6480,6260,6040,5820,5660,5500,5350,5200,5080,4960,4860,4760,4660,4570,4480,4400,4330,4250,4180,4120,4050,3990,3940,3880,3830,3780,3730,3681,0000,9290,8810,8330,7940,7550,7270,7030,6790,6540,6350,6150,6000,5840,5700,5560,5440,5320,5210,5110,5010,4910,4830,4750,4670,4590,4520,4460,4390,4330,4270,4210,4150,4100,4051,0000,9640,9050,8670,8300,8000,7690,7470,7230,7000,6790,6620,6430,6280,6120,5990,5860,5730,5620,5510,5410,5310.5220,5130,5040,4960,4890,4820,4750,4680,4620,4560,4500,4440,4391,0000,9520,9170,8790,8450,8180,7910,7710,7500,7290,7130,6950,6770,6620,6480,6340,6220,6100,5980,5870,5770,5670,5580,5490,5410,5330,5250,5170,5100,5040,4970,4910,4850,4791,0000,9760,9330,9030,8730,8460,8240,8020,7790,7620,7480,7280,7120,6960,6810,6670,6540,6420,6300,6190,6080,5980,5890,5800,5710,5630,5540,5470,5390,5330,5260,5190,5130,507АНАЛИЗ ЗАВИСИМОСТЕЙ265Таблица 8.6.
Окончаниеn414243444546474849500,500,1080,1070,1050,1040,1030,1020,1010,1000,0980,0970,200,2040,2020,1990,1970,1940,1920,1900,1880,1860,184Уровень значимости α0,10 0,05 0,02 0,010,261 0,309 0,364 0,4000,257 0,305 0,359 0,3950,254 0,301 0,355 0,3910,251 0,298 0,351 0,3860,248 0,294 0,347 0,3820,246 0,291 0,343 0,3780,243 0,288 0,340 0,3740,240 0,285 0,336 0,3700,238 0,282 0,333 0,3660,235 0,279 0,329 0,3630,0050,4330,4280,4230,4190,4140,4100,4050,4010,3970,3930,0020,4730,4680,4630,4580,4530,4480,4430,4390,4340,4300,0010,5010,4950,4900,4840,4790,4740,4690,4650,4600,456Если объем выборки больше 50, нужно применить критерийСтыодента:t=rs1 − rs2n−2с числом степеней свободы ν = n – 2.В данном случае связь веса и роста можно было установитьи без помощи коэффициента ранговой корреляции Спирмена.Применение обычного коэффициента корреляции, как мы видели, приводит к тем же результатам.Сколько лабораторных анализов нужно врачу?В первые дни пребывания в больнице больному обычно делаютмножество дорогостоящих анализов.
Все ли из них необходимы?Шредер с коллегами* попытались, анализируя работу 21 врача,выяснить, существует ли связь между квалификацией врача истоимостью необходимых ему анализов. Прежде всего, специальная комиссия оценила квалификацию каждого врача. Каждому из врачей присвоили ранг от 1 (лучшая квалификация) до*S. A. Schroeder, A. Schliftman, Т. Е. Piemine. Variation among physicians in use of laboratory tests: relation to quality of care. Med. Care, 12:709–713, 1974.266ГЛАВА 821 (худшая квалификация).
Затем была подсчитана средняя стоимость анализов, которые потребовались каждому из врачей запервые 3 суток пребывания больного в клинике. Эти данныеупорядочили по возрастанию; наименьшей стоимости присвоили ранг 1, наибольшей — 21.В результате каждому врачу была присвоена пара рангов —ранг по шкале квалификации и ранг по шкале расходов. Этипары представлены на рис. 8.13. Остается выяснить связь между квалификацией врача и величиной расходов на необходимыеему анализы. Вычислив коэффициент Спирмена, получим всего лишь rs = –0,13. Абсолютная величина rs оказалась меньшекритического значения даже при уровне значимости α = 0,05(критическое значение r0,05 = 0,435).Однако значит ли это, что не существует связи между квалификацией врача и затратами на анализы? Нет.
Связь существует, но она не линейная. Присмотревшись к рис. 8.13, можно заметить, что самыми дешевыми анализы были у лучших и... худших врачей. И тем и другим, чтобы уверенно судить о болезни,не требуется много анализов. Причем, похоже, большей уверенностью отличаются именно худшие специалисты.Но почему эта связь не была уловлена коэффициентом корреляции? Исключительно из-за ее нелинейной формы. Ни одиниз коэффициентов корреляции не сможет уловить зависимость,график которой — перевернутая U-образная кривая с рис. 8.13.Этот пример показьюает, что, прежде чем применять какиелибо методы анализа связей, следует примерно определить, какой может быть форма зависимости. Лучший способ для этого —просто нарисовать график, подобный изображенному на рис. 8.13.ЧУВСТВИТЕЛЬНОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИКак уже говорилось, из статистической значимости коэффициента корреляции вытекает статистическая значимость коэффициента наклона.
Ограничимся поэтому вычислением чувствительности коэффициента корреляции.Можно показать, что величинаАНАЛИЗ ЗАВИСИМОСТЕЙ267Рис. 8.13. А. Квалификация врача и стоимость анализов, которые он назначает больному в первые 3 дня госпитализации. Коэффициент ранговой корреляции Спирмена —всего лишь –0,13. Можно было бы заключить, что стоимость анализов от квалификации никак не зависит. Б. Приглядевшись к данным повнимательнее, можно заметить,что зависимость на самом деле есть, только не линейная, а похожая на перевернутуюбукву U. Расходы на анализы выше у врачей средней квалификации, у наиболее и наименее квалифицированных врачей расходы ниже.ГЛАВА 82681 1+ r Z = ln 2 1 − r имеет нормальное распределение со стандартным отклонением1.n−3Тогда величинаσZ =ZσZв отсутствие корреляции имеет стандартное нормальное распределение со средним, равным нулю.
Обозначим истинное значение коэффициента корреляции ρ (греческая «ро»). Тогда средним значением z будет Z ρ σ Z , гдеz=1 1+ ρ Z ρ = ln .2 1− ρ Найдем, какой должна быть чувствительность, чтобы по выборке объемом 10 при уровне значимости 0,05 обнаружить корреляцию ρ, не меньшую 0,9. На рис. 8.14 приведены два распределения z — для нулевого коэффициента корреляции и истинного, равного ρ. (Заметьте, насколько этот этот рисунок похожна рис. 6.7.) Чувствительность равна площади под истиннойкривой распределения z справа от критического значения zα.Вычислими1 1 + ρ 1 1 + 0,9 Z ρ = ln = 1, 472 = ln2 1 − ρ 2 1 − 0,9 1= 0,378.n−3Уровню значимости α = 0,05 соответствует критическое значение zα = 1,960. Центром распределения z является Z ρ σ Z == 1,472/0,378 = 3,894.
От этого центра критическое значение zα отσZ =АНАЛИЗ ЗАВИСИМОСТЕЙ269Рис. 8.14. Чувствительность выявления корреляции ρ = 0,9 при объеме выборки n = 10и уровне значимости α = 0,05.стоит на 1,960 – 3,894 = –1,934 стандартных отклонения. Из табл.6.4 находим, что площадь части стандартного нормального распределения, расположенной правее –1,934 стандартного отклонения от центра, составляет примерно 0,97.
То есть искомаячувствительность равна 97%.Итак, чувствительность 1 – β, необходимая для обнаружения корреляции, не меньшей ρ, при уровне значимости α и приобъеме выборки п равна площади под кривой стандартногонормального распределения правее точкиz1−β = zα −Zρ.1n−3Эта формула для нахождения чувствительности по известному объему выборки. Если нужно найти объем выборки, при котором достигалась бы чувствительность 1 – ρ, то, разрешив этоуравнение относительно п, получим: zα − z1−β n=+ 3. Z ρ 270ГЛАВА 8СРАВНЕНИЕ ДВУХ СПОСОБОВ ИЗМЕРЕНИЯ: МЕТОДБЛЭНДА—АЛТМАНАНередко требуется сравнить результаты измерений, выполненных двумя методами, ни один из которых не является абсолютно надежным.
Например, некий гемодинамический показательопределяли непрямым, неинвазивным, методом. Допустим, изобретен новый метод, также непрямой. Естественно выяснить,согласуются ли результаты измерений, выполненных старым иновым методами. Или похожий вопрос — насколько согласованы результаты повторных измерений, выполненных одним и темже методом.Итак, с помощью двух методов получены две серии измерений. Казалось бы, ничто не мешает применить регрессионныйанализ или рассчитать коэффициент корреляции. Увы, эти, напервый взгляд, очевидные действия могут привести к ложнымивыводами.Регрессионный анализ неприменим уже потому, что его результаты зависят от того, какую переменную считать независимой, а какую зависимой. Тут следует подчеркнуть отличиезадачи сравнения двух методов измерения от задачи калибровки, в которой приближенные измерения сравниваются с некоторым эталоном. Типичный пример калибровки: приготовив рядрастворов известной концентрации, измерить ее исследуемымметодом.
Здесь регрессионный анализ вполне применим,поскольку эталон — достоверно известная концентрация —очевидным образом и является независимой переменной. Напротив, при сравнении результатов двух приближенных методов никакого эталона нет.Что может дать коэффициент корреляции? Положим, он статистически значимо отличается от нуля. Но ценен ли этот факт?Нет, ведь проверялась корреляция измерений одной и той жевеличины. В этом случае удивления было бы достойно как разотсутствие значимой корреляции, говорящее о том, что результаты, как минимум, одного из методов нимало не схожи с истинными значениями измеряемого признака. Это практически исключено.
Кроме того, как мы видели, даже весьма высоким ко-АНАЛИЗ ЗАВИСИМОСТЕЙ271эффициентам корреляции соответствует довольно значительнаянеопределенность предсказания зависимой переменной.Д. Блэнд и Дж. Алтман предложили описательный методоценки согласованности измерений, выполненных двумя способами*. Идея метода очень проста. Для каждой — выполненной одним и другим способами — пары измерений вычислимих разность. Найдем среднюю величину и стандартное отклонение разности. Средняя разность характеризует систематическое расхождение, а стандартное отклонение — степень разброса результатов. Далее, если в качестве оценки измеряемогопризнака взять среднее значение пары измерений, то можноопределить, зависит ли расхождение от величины признака.Последнее станет понятнее после того, как мы разберем пример применения метода Блэнда—Алтмана.Два способа оценки митральной регургитацииВспомним схему кровообращения.