Стентон Гланц - Медико-биологическая статистика (1034784), страница 4
Текст из файла (страница 4)
А сколь часто приходится читать статьи, вкоторых статистические манипуляции с одними и теми же данными приводят к прямо противоположным выводам. Все этонаводит читателя на мысль, что статистические методы либоненадежны, либо слишком трудны для понимания, либо вообще не более чем инструмент недобросовестного исследователя.Между тем даже начального знакомства со статистикой в сочетании со здравым смыслом обычно достаточно чтобы понять,что предлагает нам автор в качестве «доказательств».
По иронии судьбы ошибки редко связаны с тонкими статистическимивопросами. Как правило, это простейшие ошибки такие, как отсутствие контрольной группы использование неслучайных выборок или пренебрежение статистической проверкой гипотез.По неизвестным науке причинам такие ошибки неизменно смещают результаты исследования в пользу предлагаемого авторомметода.Вред, приносимый ошибками такого рода, очевиден.
Исследователь заявляет о «статистически достоверном» эффекте лечения, редактор помещает статью в журнал, врач неспособныйкритически оценить публикацию, применяет неэффективныйметод лечения. В конце этой цепи находится больной, которыйи расплачивается за все, подвергаясь ненужному риску и не получая действительно эффективного лечения. Не следует сбрасывать со счетов и ущерб от самого факта проведения бессмысленных исследований. Деньги и подопытные животные приносятся в жертву науке, больные рискуют ради сбора ошибочноинтерпретируемых данных.Сегодня грамотная проверка эффективности лечения стано-СТАТИСТИКА И КЛИНИЧЕСКАЯ ПРАКТИКА25вится первоочередной задачей.
Исследования должны тщательно планироваться, а результаты правильно интерпретироваться.ОШИБКИ ВЕЧНЫ?Поскольку описанные ошибки совершаются в массовом порядке, ничто не побуждает исследователей корректно использоватьстатистические методы. Редко кому приходилось слышать критические замечания, на сей счет. Наоборот, исследователи часто опасаются, что их коллеги, а особенно рецензенты, сочтутграмотно и полно изложенную статистическую процедуру высокомерной теоретизацией.Журналы призваны быть оплотом качества научных исследовании.
В некоторых редакциях действительно осознали, чтоих рецензенты не слишком сведущи в использовании элементарной статистики, и изменили саму процедуру рецензирования. Теперь перед тем как направить рукопись на рецензию, еетщательно проверяют на предмет правильности использованиястатистических методов. Результатом этого нередко становитсяпересмотр используемых в статье статистических методов, аиногда и самих выводов* .Но большинство редакторов, похоже, убеждены, что каждыйрецензент рассматривает статистическую сторону работы стольже тщательно, сколь и собственно медицинскую. Неясно, однако, как он может это сделать — ведь даже авторы ведущих медицинских журналов, упоминая статистическую проверку гипотез, редко затрудняют себя указанием, какой именно критерий был использован.Коротко говоря, для грамотного чтения медицинской литературы необходимо научиться понимать и оценивать правильность применения статистических методов, используемых дляанализа результатов.
К счастью, основные идеи, которыми необ* Подробнее о существующей в редакциях практике работы с рукописямисм. М. J. Gardner, J. Bond An exploratory study of statistical assessment ofpapers published in the British Medical Journal. JAMA, 263:1355–1357, 1990, aтaкжe S. А.
Glantz It is all in the numbers. J. Am. Coll. Cardiol., 21:835–837,1993.26ГЛАВА 1ходимо овладеть вдумчивому читателю (и, конечно, вдумчивому исследователю), довольно просты. В следующей главе мыприступим к их обсуждению.Глава 2Как описать данныеВ этой книге мы встретимся с двумя типами задач. Первый типзадач, — как сжато, описать данные. Этими задачами занимается так называемая описательная статистика.
Задачи второго типасвязаны с оценкой статистической значимости различий и вообще с проверкой гипотез. В этой главе мы рассмотрим задачипервого типа — как наилучшим образом описать данные.Если значения интересующего нас признака у большинстваобъектов близки к их среднему и с равной вероятностью отклоняются от него в большую или меньшую сторону, лучшими характеристиками совокупности будут само среднее значение истандартное отклонение. Напротив, когда значения признакараспределены несимметрично относительно среднего, совокупность лучше описать с помощью медианы и процентилей.Возможно, сказанное давно вам известно.
Тогда смело переходите к следующей главе. Тех же, для кого термины вроде процентиля звучат туманно, мы приглашаем приступить к изучению марсиан.28ГЛАВА 2Поначалу займемся, каким-нибудь количественным признаком, например ростом. Чтобы попусту не фантазировать слетаем на Марс и измерим всех марсиан благо их всего две сотни.Результаты приведены на рис.
2.1 (мы округлили рост до целогочисла сантиметров). Каждому марсианину соответствует кружок так, что, например два кружка над числом 30 означают, чтоимеются два марсианина ростом 30 см. Рис 2.1 это распределение марсиан по росту. Мы видим, что рост большинства марсиан — от 35 до 45 см. Коротышек (ниже 30 см) совсем немного— всего трое, и столько же великанов (выше 50 см).Окрыленные успехом марсианского проекта мы решаем измерить венецианцев.
Легко находим деньги на путешествие и,вооружившись линейками, измеряем всех 150 обитателей Венеры. Научный отчет об экспедиции будет звучать так: «Редковстретишь венерианца ниже 10 см или выше 20 см, а чаше попадаются 15-сантиметровые, см. рис. 2.2».Но вот остались позади нелегкие межпланетные перелеты.Настала пора скрупулезного анализа данных. Сравним рис. 2.1и 2.2. Мы видим, что венерианцы ниже марсиан и что интервал, вМарсианеN = 2003035404550Рис. 2.1.
Распределение марсиан по росту. Каждому марсианину соответствует кружок.Обратите внимание, что марсиан среднего роста (около 40 см) больше всего и что высокорослых столько же, сколько коротышек — распределение симметрично.КАК ОПИСАТЬ ДАННЫЕ29который умещается рост всех марсиан шире, чем соответствующий интервал для венерианцев. Ширина интервала, в который попадают почти все марсиане (194 из 200) — 20 см (от 30до 50 см). Рост большинства венерианцев (144 из 150) умещается в интервал от 10 до 20 см, то есть имеет ширину всего лишь10 см.
Несмотря на эти различия между двумя совокупностямиинопланетян имеется и существенное сходство. В обоих ростлюбого члена скорее близок к середине распределения, нежелизаметно от нее удален и одинаково вероятно может быть каквыше, так и ниже середины. Распределения на рис. 2.1 и 2.2имеют схожую форму и приближенно определяются одной итой же формулой.Раз существует множество похожих распределений, значит,для характеристики одного из них достаточно указать чем оноотличается от других ему подобных, то есть всю собранную информацию мы можем свести к нескольким числам, которые называются параметрами распределения. Это среднее значениеи стандартное отклонение.• •• •• • •• • •N = 150101520• •••, ••Рис.
2.2. Распределение венерианцев по росту. Венерианцы ниже марсиан, разброс значений меньше. Однако по форме распределения, напоминающей колокол, венерианцыи марсиане схожи друг с другом.30ГЛАВА 2Расположив мысленно распределения марсиан и венерианцевна одной шкале роста, мы увидим, что распределение венерианцев находится ниже, чем распределение марсиан. Характеристика положения распределения на числовой оси называетсясредним. Среднее по совокупности обозначают греческой буквой µ (читается "мю") и вычисляют по формуле:Сумма значений признакаСреднее по совокупности =для всех членов совокупности.Число членов совокупностиЭквивалентное математическое выражение имеет видµ=∑X ,Nгде X — значение признака, N — число членов совокупности.Как всегда, большая греческая буква Σ (читается «сигма») обозначает сумму.
Подставив в формулу добытые нами данные,получим ценное дополнение к научному отчету: средний ростмарсиан 40 см, а венерианцев — 15 см.СТАНДАРТНОЕ ОТКЛОНЕНИЕЕще на Венере мы заметили, что тамошние жители более однородны по росту, нежели марсиане. Хотелось бы и это впечатление оформить количественно, то есть иметь показатель разброса значений относительно среднего. Ясно, что для характеристики разброса все равно, в какую сторону отклоняется значение— в большую или меньшую. Иными словами, отрицательные иположительные отклонения должны вносить равный вклад в характеристику разброса. Воспользуемся тем, что квадраты двухравных по абсолютной величине чисел равны между собой, ивычислим средний квадрат отклонения от среднего.
Этот показатель носит название дисперсии и обозначается σ2. Чем больше разброс значений, тем больше дисперсия. Дисперсию вычисляют по формуле:КАК ОПИСАТЬ ДАННЫЕ31∑( X − µ )=2σ2.NКак видно из формулы, дисперсия измеряется в единицах,равных квадрату единицы измерения соответствующей величины. Например, дисперсия измеряемого в сантиметрах роста самаизмеряется в квадратных сантиметрах. Это довольно неудобно.Поэтому чаще используют квадратный корень из дисперсии —стандартное отклонение σ (маленькая греческая буква «сигма»):∑( X − µ )2σ = σ2 =.NСтандартное отклонение измеряется в тех же единицах, чтоисходные данные. Например, стандартное отклонение ростамарсиан составляет 5 см, а венерианцев — 2,5 см.НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕТаблица 2.1 сжато представляет то, что мы узнали о марсианахи венерианцах.
Таблица очень информативна, из нее можно узнать об объеме совокупности, о среднем росте и о том, насколько велик разброс относительно среднего.Вновь обратившись к рис. 2.1 и 2.2, мы обнаружим, что наобеих планетах рост примерно 68% обитателей отличается отсреднего не более чем на одно стандартное отклонение и примерно 95% — на два стандартных отклонения. Подобные распределения встречаются очень часто. Можно сказать, что это происходит всегда, когда некая величина отклоняется от средней поддействием множества слабых, независимых друг от друга фактоТаблица 2.1.
Параметры распределения марсиан и венерианцев по ростуОбъемсовокупности Среднее, смМарсиане20040Венерианцы 15015Стандартноеотклонение, см52,532ГЛАВА 2ров. Распределение такого рода называется нормальным (илигауссовым) и описывается формулой:21 ( X −µ )12f (X ) =e2 σ .σ 2πЗаметим, что нормальное распределение полностью определяется средней µ и стандартным отклонением σ. Поэтому сведения в табл. 2.1 — это не просто удачное представление данных.МЕДИАНА И ПРОЦЕНТИЛИИ снова в путь! Обогатившись теоретическими познаниями, мыотправляемся на Юпитер.