Диссертация (1136389), страница 39
Текст из файла (страница 39)
Данный вид регрессии наиболее частоиспользуетсяванализевыживания,таккакпредоставляетосновнуюинформацию, необходимую в рамках анализа выживания, например, уровеньриска (hazard rate), делая минимальное количество допущений об анализируемыхданных. Также пропорциональная регрессия Кокса является робастной моделью,в которой коэффициенты регрессии близко приближаются к результатамправильнойпараметрическоймодели.Здесьстоитсделатьнесколькокомментариев о параметрических и полу-параметрических моделях анализавыживания.ПропорциональнаярегрессияКоксаявляетсяполу-параметрическоймоделью, так как основывается на частичном максимальном правдоподобии(partial maximum likelihood).
Не углубляясь в математические детали того, какрассчитывается данная регрессия, необходимо отметить, что она фокусируется наанализе влияния независимых переменных на уровень риска, что некое событиепроизойдет (зависимая переменная). Параметрические модели, в свою очередь,основываются на максимальном правдоподобии (maximum likelihood), и могуттакже рассчитывать форму распределения времени «выживания».
В связи с этимодно из главных отличий параметрических моделей от полу-параметрических,199или пропорциональной регрессии Кокса, является то, что первые делают важноедопущение, что нам изначально известна форма распределения временивыживания. Когда мы симулируем данные для какого-либо анализа, мыизначально знаем, какая у них форма распределения. На практике, однако,истинноераспределениевременинаступлениясобытиянеизвестно.Пропорциональная регрессия Кокса допущения о форме такого распределения какраз не делает.357Одной из самых часто используемых параметрических моделей в анализевыживания является регрессия Вейбулла (Weibull regression). Она так же иногданазывается модель ускоренного времени отказа (accelerated failure-time model), таккак эффект независимой переменной мультипликативный по шкале времени и,условно говоря, «ускоряет» время выживания.
Напротив, эффект независимойпеременной в пропорциональной регрессии Кокса является мультипликативнымпо шкале опасности, приближая время риска, что определенное событиепроизойдет.358 Тем не менее, современные статистические пакеты позволяюттрансформироватьзначениярегрессииВейбуллавуровнирискапропорциональной регрессии Кокса. Многие статисты уже эмпирически показали,что уровни риска, полученные с помощью регрессионной модели Вейбулла,аналогичны тем, которые получены при регрессии пропорциональных рисковКокса.359Такимобразом,пропорциональнаярегрессияКоксаилимодель«пропорциональных рисков» является аналитической альтернативой регрессииВейбулла.
В модели Кокса функция риска пропорциональна функции параметров,но основной риск остается неопределенным. Однако важно обратить внимание,что функция риска имеет такое же экспоненциальное отношение к независимымGeorge B., Seals S., Aban I. Survival Analysis and Regression Models // J Nucl Cardiol. 2014. Vol. 21, № 4. P. 686694.358См., например: George B., Seals S., Aban I. Op.
cit. Zhang Z. Parametric Regression Model for Survival Data //Annals of Translational Medicine. 2016. Vol. 4, № 24. P. 1-8.359См., например: Crumer A. Comparison between Weibull and Cox Proportional Hazard Models. Master thesis, KansasState Univeristy, 2011. Haile S. (2015) Weibull AFT Regression Functions in R [Electronic source] // URL:https://cran.r-project.org/web/packages/SurvRegCensCov/vignettes/weibull.pdf(dateofaccess:02.09.2017).357200переменным в модели Кокса, как и в регрессии Вейбулла. То есть, повторюсь, напрактике параметры модели Вейбулла, как правило, очень похожи на результатымодели Кокса.360Суммируя, можно сказать следующее. Если мы знаем распределениевремени выживания для наших данных, то имеет смысл использовать подходмаксимального правдоподобия и, например, регрессию Вейбулла.
Реальнымпреимуществом пропорциональной регрессии Кокса является то, что мы попрежнему можем использовать модели выживания, не зная (или не предполагая)распределение времени выживания. Во многих случаях реального мира мы незнаем подобного соответствующего распределения (или даже достаточноблизкого приближения). Со структурой данных, используемой для анализавыживания, например, с цензурированными (censored) данными, мы не можемсделать простую гистограмму и сказать «это выглядит как <...> распределение».Поэтому очень полезно в таких случаях использовать статистическую технику,которая хорошо работает, не требуя конкретного распределения временивыживания.Несмотря на обоснованность выбора пропорциональной регрессии Кокса,также была рассчитана регрессию Вейбулла, чтобы снять возможные вопросы.Результаты представлены в Таблице 3.7.Таблица 3.7.
Регрессия Вейбулла (n=75)ЗначениеСтандартная ошибкаКонстанта4.354***0.976Дистанция (лог)0.257***0.073-0.1210.080-0.022*0.009-0.286***0.080Зависимость от субсидий2006 (логит)ЕР 2007ЭЧП региональныйпарламент360Rogers, W., Henley, J. (1982) Weibull Regression and Hazard Estimation [Electronic source] // URL:http://www.sascommunity.org/sugi/SUGI82/Sugi-82-113%20Rogers%20Hanley.pdf(accessed:02.09.2017).201Сменяемость мэров0.133**0.049Лог (шкала)-0.581***0.098Значимость: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1Шкала = 0.559Распределение Вейбулла:Лог правдоподобие (log likelihood) = -347.2Лог правдоподобие (log likelihood) (только константа) =-365.3Хи-квадрат = 36.15, 5 степеней свободы, р = 0.00000089Шкала – важный показатель регрессии Вейбулла, который такжепоказываетсявместесозначенияминезависимыхпеременных.Логправдоподобие показывает, что наша модель значительно лучше, чем нулеваямодель (только с константой), так как р-значение показывает статистическизначимый результат.
В целом, мы видим, что все переменные, за исключениемзависимости от субсидий в 2006 году, остались статистически значимыми, как и впропорциональнойрегрессииКокса.Дистанцияисменяемостьмэровположительно влияют на выживание прямых выборов мэра. Все остальныепеременные, как и ожидалось, оказывают отрицательное воздействие на времявыживания прямых выборов мэра. Для того чтобы показать, что значениявероятности риска введения института сити-менеджеров примерно равны длярегрессии Вейбулла и регрессии Кокса, были трансформированы значения изТаблицы 3.7. Результаты представлены в Таблице 3.8.Таблица 3.8.
Трансформированные значения регрессии ВейбуллаДистанция(лог)СменяемостьмэровЕР 2007Отношение95%временидоверительныйсобытия (eventинтервалВероятность95%риска (hazardдоверительныйratio)интервал0.63[0.49; 0.82]1.29[1.12; 1.49]0.79[0.66; 0.94]1.14[1.04; 1.26]1.04[1.01; 1.07]0.98[0.96; 1.00]202time ratio)ЭЧПрегиональный1.67[1.24; 2.24]0.75[0.64; 0.88]1.24[0.94; 1.64]0.89[0.76; 1.04]парламентЗависимость отсубсидий 2006(логит)Как мы видим, показатели вероятности риска из Таблицы 3.8 схожи споказателями риска пропорциональной регрессии Кокса (Таблица 3.5, столбец 3).Интерпретация показателей обеих таблиц одинаковая.
Например, увеличениесменяемости мэров на одного уменьшает риск введения сити-менеджерапримерно на 21% (Вероятность риска = 0.79). Увеличение доли голосов за ЕР в2007 году в региональной столице на один процент увеличивает риск введениясити-менеджера примерно на 4% (Вероятность риска = 1.04).
С другой стороны,мы можем интерпретировать значения с точки зрения их отношения к временисобытия (Столбец 4). То есть, например, увеличение сменяемости мэров наодного увеличивает время до наступления события (введение сити-менеджера)примерно на 14% (Отношение времени события = 1.14). Увеличение доли голосовза ЕР в 2007 году в региональной столице на один процент уменьшает время донаступления события (введение сити-менеджера) примерно на 2% (Отношениевремени события = 0.98) и т.д.Модель Вейбулла с категориальными переменными может быть проверенана ее адекватность стратифицированными кривыми Каплана-Мейера. Данныйграфик должен показывать линейные и параллельные линии, если модельадекватна. Данный график был построен применительно к единственнойкатегориальной переменной в модели – сменяемости мэров (График 3.12).График 3.12.