Диссертация (1174324), страница 18
Текст из файла (страница 18)
Частоты значений для переменных с оценкой миелотоксичностипредшествующего курса химиотерапии по выборкам исследованияНаличие тяжелогомиелотоксическогоосложнения послепредыдущего курсахимиотерапииАнемия ванамнезеТромбоцитопенияв анамнезеЛейкопения ванамнезеНейтропения ванамнезеМассив данных до внедренияРетроспективнаявыборка:2011-2014 гг.Колич.ДоляПосле внедренияДополнительнаявыборка: 2014-2015 гг.Колич.ДоляПроспективнаявыборка: 2015-2017 гг.Колич.Доля01462898,3%979898,8%2250198,9%12561,7%1201,2%2491,1%01479599,4%987299,5%2264799,5%1890,6%460,5%1030,5%01464098,4%976798,5%2247998,8%12441,6%1511,5%2711,2%01396593,8%931693,9%2164495,1%19196,2%6026,1%11064,9%Количество курсов, для которых был установлен факт развития тяжелоймиелотоксичности (Таблица 20) в каждой из выборок исследования больше, чемколичество курсов, для которых установлен признак «Тяжелая токсичность ванамнезе» (Таблица 23).
Это объясняется тем, что для некоторых пациентов послеразвития тяжелой токсичности текущая схема химиотерапевтического лечения неприостанавливается для коррекции токсических эффектов, а отменяется совсем. Втаком случае решается вопрос о переходе на следующую линию лечения и заменесхемы химиотерапии или об отмене противоопухолевой химиотерапии длябольного. Для подобных пациентов с отмененным химиотерапевтическимлечением в выборке исследования просто нет записи о курсе лечения, для которогоможнобылобыустановитьанамнестическийпризнакотяжелоймиелотоксичности.Само по себе добавление нового анамнестического предиктора не исправляетчастичную связь наблюдений в выборке, однако дает возможность провестимоделирование по наиболее полному набору данных в условиях выраженнойнесбалансированности классов в массивах данных (Таблица 20), а потом проверитьустойчивость полученных моделей на дополнительной и проспективной выборках.1023.3.
Регрессионная функция для прогнозатоксической анемииДля создания всех регрессионных функций на входе использовалсяобучающийнаборданныхретроспективнойвыборки.Кпеременным,задействованным для обучения модели, были применены преобразования,описанные в главах 3.1 и 3.2: качественные переменные были приведены кпорядковым или бинарным формам, для использования в анализе.
Количественныепеременные использовались без дополнительных преобразований, но с учетом ихкорреляций между собой.Регрессионная функция для прогноза токсической анемии, полученная прианализе данных ретроспективной выборки, была построена на основе 10независимых переменных. Список использованных предикторов, значениякоэффициентов и p-уровни значимости приведены в Таблица 24 ниже.Таблица 24. Итоговый список независимые переменных, включенных в регрессионнуюфункцию для прогноза токсической анемии.Номер попорядкуНаименование независимой переменнойЗначениекоэффициентаp-уровеньзначимости1Номер курса (натуральное число)-0,066< 0,0012Возраст (лет)-0,027< 0,0013Стадия (натуральное число)-0,1220,0024Лейкоциты (10^9/л)0,137< 0,0015Лимфоциты, абсолютное количество (10^9/л)-0,2810,0016Гематокрит (%)-0,228< 0,0017Оксалиплатин (мг/м^2)-0,0090,0028Карбоплатин (мг/м^2)0,002< 0,0019Бевацизумаб (мг/м^2)-0,0040,005Этопозид (мг/м^2)0,010< 0,001Константа5,738< 0,00110-103При построении модели был отмечен положительный эффект от заменыконцентрации гемоглобина на показатель уровня гематокрита.
Одновременное ихиспользование в модели было невозможно, так как эти показатели физиологическисвязаны между собой, а во время лабораторного исследования гематокритрассчитывается по показателю гемоглобина по алгоритму, встроенному вгематологический анализатор Sysmex.Данный факт отражается в сильной корреляции между концентрациейгемоглобина и уровнем гематокрита в крови (ρ-Спирмена = 0,961p<0,001;τ-b Кендалла = 0,739 p<0,001).Положительный эффект для качества регрессионной функции также дало«ручное» добавление к уже использованному в модели общему количествулейкоцитов умеренно коррелирующего с ним показателя абсолютного количествалимфоцитоввкрови(ρ-Спирмена=0,543p<0,001;τ-b Кендалла = 0,360 p <0,001).Данная манипуляция с регрессионной функцией более «объемно» описалакартину состояния белой крови, позволяя оценить соотношение разных фракцийлейкоцитов.
Вследствие короткого времени жизни лейкоцитов в кровотоке,изменения в показателях лейкоцитарной формулы могут быть предиктором другихвидов токсичности. Уровни значимости для включения обеих переменных врегрессионную функцию были около одной тысячной, что заметно меньшепорогового значения p = 0,05; поэтому дополнительная переменная была оставленав модели (Таблица 24).Учитывая ранее описанную проблему с частично связанными наблюдениямибыло проведено по 100 статистических экспериментов с обоими способами(«несколько курсов на одного пациента» и «строго один курс на каждогопациента»)выделенияобучающейчастиизретроспективнойвыборкиисследования.
Показатели площади под ROC-кривой, полученные для каждогоспособа распределения, приведены в Таблица 25.104Таблица 25. Распределение показателя площади под ROC-кривой для регрессионнойфункции прогноза анемии, полученных при разных способах случайного формированияобучающей части ретроспективной выборки исследования (2011-2014 гг.).Характеристика распределения показателяAUROC полученных регрессионных функцийНесколько курсов наодного пациентаСтрого один курс накаждого пациента100100Наименьшее значение0,9080,889Наибольшее значение0,9130,9090,912[0,912; 0,912]0,912[0,912; 0,912]<0,000010,00090,01%0,0001D=0,3418Отклонитьнормальность(p<0,001)0,903[0,902; 0,904]0,903[0,903; 0,904]0,000020,00390,43%0,0004D=0,1142Отклонитьнормальность(p=0,003)Количество экспериментовСреднее арифметическое95% ДИ для арифметического среднегоМедиана95% ДИ для медианыДисперсияСреднеквадратическое отклонениеОтносительное среднеквадратическое отклонениеСтандартная ошибка среднегоКритерий Колмогорова-Смирновадля проверки на нормальность распределенияпоказателей AUROC внутри выборкизначение U-критерия Манна-Уитни для сравнениявыборок между собой по уровню показателяAUROCуровень статистической значимости(двухсторонний) для сравнения выборок поуровню показателя AUROCU=6p<0,001Подход «несколько курсов на одного пациента» показал статистическизначимые более высокие результаты: при использовании критерия Манна-Уитнидля сравнения выборок между собой по уровню показателя AUROC значение U=6,p<0,001.
Хотя в абсолютном значении данная разница не велика и составляет всегодевять тысячных (0,009) при учете, что теоретическое максимальное значениеAUROC ровно единице.На Рисунок 6 представлены диаграммы размаха показателя площади подROC-кривойвзависимостиотспособаретроспективной выборки исследования.выделенияобучающейчастиСледует отметить крайне узкоераспределение показателя AUROC при формировании обучающих выборок сподходом «несколько курсов на одного пациента», так при округлении до 3 знаковпосле запятой значение среднего арифметического (0,912) совпадает с границами105его доверительного интервала [0,912; 0,912], а также совпадает со значениеммедианы (0,912) и ее доверительного интервала [0,912; 0,912].Данные результаты были достигнуты за счет более глубокой настройкирегрессионной функции на обучающей выборке, составлявшей 70% курсов ХТ отвсей ретроспективной выборки 2011-2014 гг.
в предположении, что небольшоеколичество частично связанных между собой наблюдений не ухудшает качествополученнойрегрессионнойфункции(дляобъективногоконтролябылозапланировано использование дополнительной контрольной выборки, собранной в2014-2015 гг).Рисунок 6. Диаграммы размаха показателя площади под ROC-кривой (AUROC) длярегрессионной функции прогноза анемии, полученные при разных способах случайногоформирования обучающей части ретроспективной выборки исследования (2011-2014 гг.).Расходящимися клиньями показаны доверительные интервалы медианы.106Для проведения дальнейших оценок из всех результатов статистическихэкспериментов с разбиением ретроспективной выборки на части была выбранарегрессионнаяфункциясплощадьюподROC-кривойравной0,912,соответствующей медиане полученных значений AUROC.Согласно алгоритму построения ROC-кривой в IBM SPSS Statisticsстатистическая значимость для отличия полученного значения площади отAUROC=0,500 составила p<0,001;95%-доверительный интервал полученногозначения площади был равен [0,900; 0,924], что подтверждает отличное качествополученной регрессионной функции.При разделяющем (пороговом) значении равном 0,028, которое быловыбрано согласно методу, приведенном в главе 2.4: обеспечивалась максимальнаясумма чувствительности и специфичности для полученной регрессионнойфункции прогноза миелотоксической анемии (Таблица 26): чувствительность (Se)составила 90,1% ДИ [86,2%; 93,1%], специфичность (Sp) – 79,9% ДИ [79,8%;80,0%]; данные параметры устойчивы на контрольной выборке с показателями:Se=88,4% ДИ [81,1%; 93,3%], Sp=80,5% ДИ [80,3%; 80,6%].Также были рассчитаны дополнительные характеристики для регрессионнойфункции: распространенность (P) составила 3,0% ДИ[2,7%; 3,4%]; при такойраспространенностипрогностическаяценностьположительногорезультата(ПЦПР) составила 12,3% ДИ[11,7%; 12,7%], а прогностическая ценностьотрицательного результата (ПЦОР) – 99,6% ДИ [99,5%; 99,7%].Учитывая выраженный во всех выборках исследования дисбаланс групп сзафиксированныминезафиксированныммиелотоксическимосложнением,показатели прогностической ценности можно скорректировать на обобщеннуюраспространённость миелотоксических осложнений у пациентов (описано в главе2.4),получающиххимиотерапевтическоелечениепоповодусолидныхзлокачественных новообразований.Достаточно мощных исследований, обобщающих распространенностьмиелотоксичности при химиотерапии ЗНО, обнаружить не удалось, однако сами107производители лекарственных препаратов для медицинского применения, какправило, указывают во вкладышах-инструкциях распространенность осложненийсо стороны кроветворения, как «очень часто >10%» [13], не уточняя ее верхнююграницу.