Стентон Гланц - Медико-биологическая статистика (1034784), страница 59
Текст из файла (страница 59)
Несомненно, пытливый исследователь не преминул бы связать это различие с использованием «рандомизина».Однако, увы, по самому важному признаку — выживаемости— различие было статистически не значимым (см. рис. 12.1А).В этой ситуации исследователь наверняка продолжил бы поиск различий, разделив больных на более мелкие группы. Так ипоступил Ли. Больные были разделены (стратифицированы) подвум признакам: числу пораженных коронарных артерий (1, 2или 3) и сократимости левого желудочка (нормальной или сниженной). В результате получилось 6 подгрупп. Влияние рандомизина на выживаемость изучалось в каждой из этих подгрупп.Но этого мало.
Каждая подгруппа была разделена еще на две взависимости от наличия или отсутствия сердечной недостаточности. В каждой из получившихся 12 подгрупп вновь оценивалась эффективность рандомизина. Упорные усилия были вознаграждены. В одной из подгрупп (больные с поражением 3коронарных артерий и сниженной сократимостью левого желудочка) рандомизин оказался эффективен: различия выживаемости «леченых» и «нелеченых» были статистически значимыми, Р < 0,025 (рис. 12.1 Б).Рандомизин — выдумка. Но многочисленные препараты, эффективность которых была доказана совершенно таким же способом, существуют в действительности.
Секрет их «эффективности» очень прост — это множественность сравнений. В исследовании рандомизина бьыо построено 18 пар подгрупп и выполнено 18 сравнений. Чему равна вероятность получить хотябы один значимый результат в 18 сравнениях, уровень значимости в каждом из которых равен 0,05? Находим: α′ = 1 – (1 – α)k == 1 – (1 – 0,05)18 = 1 – 0,40 = 0,60. Таким образом, истиннаявероятность ошибки I рода оказалась в 12 раз выше той, о которой доложил бы исследователь.Как избежать несостоятельных выводов, не отказываясь отвозможности группировать данные? Для этого достаточно вуровне значимости каждого отдельного сравнения учесть, что их416ГЛАВА 12Рис. 12.1. А. Больных с ишемической болезнью сердца (1073 человека) случайным образом разделили на 2 группы.
Статистически значимых различий выживаемости не обнаружено. Б. Выделив больных с поражением 3 коронарных артерий и сниженной сократимостью левого желудочка, их вновь случайным образом разделили на 2 группы.На этот раз различия выживаемости статистически значимы (Р < 0,025). Выделяя всеновые подгруппы, мы в конце концов всегда найдем различия там, где их нет.КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ417более одного. Поправка Бонферрони дает уровень значимости,равный α′/k, где α′ — выбранный уровень значимости для всегонабора из k сравнений.
Это чрезмерно жесткая, заниженная оценка. Наиболее продуктивный подход состоит в применении многофакторных статистических методов*. Помимо прочего, онипозволяют обнаружить одновременное влияние более чем двухметодов лечения, что в принципе недоступно методам, изложенным ранее.КОГО МЫ ИЗУЧАЕМВ лабораторных исследованиях, в исследованиях общественногомнения или потребительского спроса существует достаточнаяопределенность, что представляет собой исследуемая совокупность. Понятно и как организовать представительную выборкуиз нее. Иначе обстоит дело в клинических исследованиях.
Здесьнет ясности ни в том, какова изучаемая совокупность, ни в том,как построить представительную выборку из нее.Чаще всего исследования проводятся в крупных клиниках,куда попадают далеко не все больные. При всей своей условности рис. 12.2, тем не менее, отражает реальную картину. Из 1000больных госпитализируется лишь девять и только один попадает в клинику. Ясно, что сложный путь больного по медицинским учреждениям далеко не случаен — он определяется прежде всего тяжестью, сложностью случая или редкостью болезни.Поэтому при всем желании больных в клиниках трудно признать представительной выборкой. Это несоответствие обязательно нужно иметь в виду, решая, на какую совокупность больных могут быть (и в какой мере) распространены полученные висследовании результаты.Данные, относящиеся к госпитализированным больным, ипрежде всего к больным из крупных клиник, не отражают ни общий спектр болезней и их стадий, ни их взаимосвязь.
Исследователи вынуждены изучать взаимосвязь болезней, опираясь на дан*С ними вы можете познакомиться в нашей книге: S. A. Glantz,В. К. Sliriker. Primer of Applied Regression and Analysis of Variance.McGraw-Нill, N.Y., 1990.ГЛАВА 12418− Взрослое население− Болели хотя бы1 раз в месяц− Обращались к врачу1000750250ГоспитализированыНаправленына консультацию9 6 1 Переведенв специализированноемедицинское учреждениеРис. 12.2.
В специализированных медицинских учреждениях оказывается лишь оченьнезначительная доля больных — обычно они лечатся амбулаторно или не лечатся вообще. На рисунке показано, сколько человек на 1000 населения болеют, обращаются кврачу и попадают в больницу в течение месяца.ные, относящиеся к госпитализированным или амбулаторнымбольным. Но разные заболевания и разные стадии одного заболевания требуют разных форм лечения. В результате связь заболеваний представляется искаженной.
Человек, страдающий несколькими болезнями, имеет больше шансов попасть в больницу,чем человек с одной болезнью. Поэтому наиболее частый видискажения — это мнимое обнаружение связи заболеваний илипреувеличение действительно существующей связи. В задаче5.10 мы встретились с более сложным видом искажения, когдаиз-за неравной вероятности госпитализации создается впечатление о более сильной связи болезни Х с болезью Z, чем с болезнью Y.
Данные о связи заболеваний, полученные при изучении госпитализированных больных, следует оценивать с чрез-КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ419вычайной осторожностью. Эта проблема названа по имени Берксона*, первым обратившего на нее внимание.КАК УЛУЧШИТЬ ПОЛОЖЕНИЕСпособность применить статистический подход в медицине несводится к заучиванию нескольких формул и умению отыскатьтабличное значение. Как и любая творческая деятельность, применение статистических методов и интерпретация полученныхрезультатов требуют глубокого проникновения в суть дела —понимания как возможностей и ограничений используемыхметодов, так и существа решаемой клинической задачи. В гл.
1мы говорили, что значение статистических методов возрастаетпо мере ужесточения требований к обоснованию эффективности предлагаемых методов лечения. Статистическое обоснование зачастую оказывается важнейшим фактором, определяющимрешение в пользу предлагаемого лечения.В то же время сами медики редко занимаются статистическим обоснованием своих исследований в силу того, что их познания в этой области столь же скромны, сколь и оторваны отпрактики. Обычно вся статистическая сторона дела перепоручается консультантам, нередко действительно разбирающимсяв статистике, но имеющим довольно смутное представление омедицинских вопросах.
Единственный выход состоит в том,чтобы медики наконец сами занялись статистическим анализом,поскольку именно они знают цели исследования и несут за негоответственность.*J. Berkson. Limitations of the applications of fourfold table analysis to hospitaldata. Biometrics, 2:47—53, 1946. Менее формальное обсуждение вы найдете в работе D. Mainland. The risk of fallacious conclusions from autopsydata on the incidence of diseases with application to heart disease.
Am. Heart.J., 45:644—654, 1953. Пример того, сколь различны выводы, полученныев результате наблюдения больных из конкретной клиники, всех госпитализированных больных и, наконец, всех больных, приведен в комментарии Мюнча (N. Engl. J.
Med. 272:1134, 1965) к работе Н. Binder, A. Clement,W. Thayer, H. Spiro. Rarity of hiatus hernia in achalasia. N. Engl. J. Med.,272:680—682, 1965.420ГЛАВА 12Увы, проблема усугубляется еще и тем, что у немалой частиисследователей сбор данных предшествует формулировке вопроса, на который они должны бы ответить. На этом пути исследователя неизменно подстерегают малоприятные открытия. Всякий раз исследователь попадает в ситуацию, когда данные собраны и остается только вычислить значение Р, но тут обнаруживается, что это значение существует не само по себе, а лишь всвязи с проверкой гипотезы. Но самое обескураживающее —чтобы проверить гипотезу, ее, оказывается, нужно иметь.Не многие исследователи обременяют себя необходимостьюеще до начала сбора данных осознать цели исследования и подлежащие проверке гипотезы.
Например, лишь 20% протоколов,одобренных комитетом по клиническим исследованиям одногокрупного научно-медицинского центра, содержали четко сформулированные гипотезы*.Попытайтесь понять, что вы хотите от исследования, какойвопрос вы хотите решить. И когда у вас будет конкретная гипотеза, станет понятно, каким должен быть тип предстоящего эксперимента и какие потребуются данные. Тогда по табл.
12.1 вылегко определите нужный метод анализа. Придерживаясь этихправил, вы всегда соберете данные, необходимые и достаточные для анализа.Лишь очень немногие поступают таким образом. Поэтомунеудивительно, что, когда настает время вычислить значение Р,исследователь обнаруживает, что собранные им данные мало связаны с проверяемой гипотезой, да к тому же нарушают предпосылки известных ему статистических методов. Но не начинатьже все с начала. Поэтому для устранения и сглаживания статистических несообразностей на этом, завершающем этапе призывается специалист, который оставляет от Монблана данных немногое, хоть как-то пригодное для анализа, заменяет неприменимые параметрические методы неприхотливыми, но менее чув*Подробнее об этой проблеме и той роли, которую могли бы сыграть вее решении комитеты по клиническим исследованиям, говорится вработе М. Giammona, S.
Glantz. Poor statistical design in research onhumans: the role of Committees on Human Research. Clin. Res., 31:571—577, 1983.КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ421ствительными непараметрическими или предлагает вместо одной гипотезы перейти к нескольким, пригодным для статистической проверки.
Отчет об исследовании приобретает приемлемый вид. Однако само исследование не становится более осмысленным. Способ избежать этого прост и состоит в том, чтобызадуматься о том, как анализировать данные, в начале, а не вконце исследования.С примерами несостоятельных работ мы неоднократно встречались в этой книге.