Диссертация (1174324), страница 15
Текст из файла (страница 15)
Для возможности произвести сравнение с оценками ПЦОР и ПЦПРиз других исследований ряд авторов предлагает производить их коррекцию надругой уровень распространенности, известный по исследовательским работам илипредлагаемый в качестве референтного [64, 86, 92].Для всех вычисленных характеристик качества прогноза были рассчитаныдоверительные интервалы (ДИ) по методу Клоппера-Пирсона [77, 86].
Расчетдоверительных интервалов для скорректированных на распространенностьмиелотоксических осложнений показателей ПЦПР и ПЦОР осуществлялся пометоду Вильсона [64].Дополнительным сравнительным методом построения прогностическихфункций было использование искусственных нейронных сетей (персептронов).Данный алгоритм применялся с целью проверки полученных результатов навозможные ограничения регрессионных методов анализа в тех случаях, когдафункции, полученные с помощью бинарной логистической регрессии, не обладаливысоким качеством классификации (площадь под ROC-кривой составляла менее0,800).
Для построения моделей на основе нейронных сетей в исследованиииспользовалась процедура многослойный персептрон, имеющаяся в составе IBMSPSS Statistics for Windows [57]. Эта процедура позволяет строить нейронные сетис одним или двумя скрытыми слоями. Количество нейронов в скрытых слояхопределялось автоматически. Функцией активации нейрона внутри сети былвыбран гиперболический тангенс [32, 57].84Глава 3.
Результаты и их обсуждение3.1. Описательные статистики и разведочный анализ3.1.1. Анализ количественных переменныхЗа счет встроенных в модули медицинской информационной системысредств управления целостностью данных и форматно-логического контроля, атакже благодаря сформированным в разделе 2.1 критериям отбора, сократившим в2 раза исходную ретроспективную выборку курсов химиотерапии, в итоговуювыборку для анализа были выгружены данные, не имеющие пропусков значений вважных для исследования показателях. Таким образом, не требовалосьиспользовать специальные процедуры заполнения неизвестных пропущенныхзначений или коррекции ошибок в данных: явных выбросов и отрицательныхзначений.
Исключение составили показатели биохимического анализа крови(общий белок, креатинин, мочевина и т.д.): курсы химиотерапии с пропусками вданных включались в выборку, однако механизмы заполнения пропусков все равноне применялись – при необходимости использования этих показателей дляпостроения регрессионных функций курсы без проведенных исследований простоне включались в активный набор данных.Нулевые значения медиан и квартилей для курсовых доз некоторыхпрепаратов обусловлены высокой вариативностью схем лечения, вследствие чегокаждый конкретный препарат применялся лишь в небольшом количестве курсовхимиотерапии из имевшихся в итоговой выборке.
Это обуславливает преобладаниенулевых доз из курсов химиотерапии в тех ячейках значений, где этот препарат неиспользовался. Так, в Таблица 9, представленной в разделе 2.2, только 3химиопрепарата назначались в ретроспективной выборке 2011-2014 гг. чаще, чемв 25% курсов химиотерапии.В итоговой выгрузке оказалось 59 количественных переменных. Для всехпеременных были собраны описательные статистики и проведена проверка насоответствие нормальному распределению с помощью критерия Колмогорова-85Смирнова, результаты приведены в Таблица 13. Для всех переменных былаотклонена гипотеза о нормальном характере распределения (p <0,001).Таблица 13.
Описательные статистики для независимых количественных переменных,вошедших в ретроспективную выборку данных для исследования.ПеременнаяСтандарКол-во Среднеетноезначе- арифмеотклоненийтическоениеСтатистикакр.КолмогороваСмирноваПроцентили (квантили)50%75%Медиана25%Значимость,pАнтропометрические данные и общая информация (единицы измерения приведены в скобках):Возраст (лет)Рост (см)Вес (кг)Площадь поверхноститела (м^2)Индекс массы телаНомер курса1488456,011,85057647,346< 0,00114884166.98.71601661739,374< 0,0011488472,415,86171826,487< 0,001148841,8230,2201,671,811,974,145< 0,0011488425,9865,29122,1525,5029,065,654< 0,001148846,65,525918,724< 0,0013,772< 0,001Лабораторные показатели (единицы измерения приведены в скобках):Гемоглобин (г/л)Эритроциты (10^12/л)Тромбоциты (10^9/л)Лейкоциты (10^9/л)Нейтрофилы абс.(10^9/л)Нейтрофилы (%)Лимфоциты абс(10^9/л)Лимфоциты (%)Гематокрит (%)MCH (пг)MCV (фл)MCHC (г/л)Общий белок (г/л)Мочевина (ммоль/л)Креатинин (мкмоль/л)Глюкоза (ммоль/л)Билирубин общий(мкмоль/л)Билирубин прямой(мкмоль/л)Лактатдегидрогеназа,ЛДГ (Ед./л)Щелочная фосфатаза(Ед./л)Аланинаминотрасфераза, АЛТ (Ед./л)Аспартатаминотрасфераза, АСТ (Ед./л)14884116,419,0104117129148843,9980,6573,594,044,453,827< 0,00114884256,0116,117723630910,693< 0,001148845,982,554,25,57,210,665< 0,001148843,2272,0161,842,814,0912,050< 0,0011488450,7414,1241,951,860,64,298< 0,001148841,8370,7721,301,722,258,021< 0,0011488431,8211,5023,631,339,32,624< 0,0011488436,675,3633,3036,940,23,604< 0,0011488429,293,2627,629,531,37,900< 0,0011488492,148,2387,592,597,24,546< 0,00114884316,418,630831832610,924< 0,0011377071,295,9267,971,5754,773< 0,001137785,5332,1594,15,26,69,205< 0,0011377990,4423,9875,886,299,612,089< 0,001137675,8321,3475,105,546,1119,874< 0,0011377110,7958,5507,19,212,424,305< 0,001119582,2404,2011,21,72,436,765< 0,00113767273,53213,48191,8230,2284,628,877< 0,00113772137,39142,8279,6100,1138,029,881< 0,0011377628,2829,2013,720,432,924,155< 0,0011377633,4526,912026,137,523,793< 0,001Курсовые дозы препаратов, нормированные на площадь поверхности тела пациента(единица измерения – мг/м2, нулевая доза – препарат не назначался в курсе ХТ):86ПеременнаяФторурацилОксалиплатинИринотеканЦисплатинГемцитабинПаклитакселВинорелбинКарбоплатинДоцетакселБевацизумабКапецитабинДоксорубицинЭпирубицинТрастузумабИфосфамидЦиклофосфамидМитомицинЭтопозидВинкристинБлеомицинПеметрекседКальция фолинатПреднизолонОндансетронДексаметазонРанитидинДифенгидраминМаннитолФилграстимМеснаЗоледроновая кислотаСтандарКол-во Среднеетноезначе- арифмеотклоненийтическоение148841131,11297,2Статистикакр.Колмо50%горова25%75%МедианаСмирнова00258642,975Процентили (квантили)Значимость,p< 0,0011488420,86336,8830042,756,524< 0,0011488432,8966,6100059,615< 0,001148849,4023,9300055,366< 0,0011488478,8257,400064,651< 0,0011488411,6131,9500061,991< 0,001148842,9197,80900063,543< 0,0011488430,7788,0800063,522< 0,001148844,2414,9700062,987< 0,0011488422,574,000064,277< 0,001148842,450,100059,156< 0,001148842,1379,75200065,498< 0,001148841,4898,68100065,225< 0,001148847,4042,2900065,498< 0,0011488411,2157,700062,780< 0,001148844,1851,7200063,030< 0,001148840,1020,89200064,861< 0,001148841,38613,22800064,598< 0,001148840,0080,11700063,533< 0,001148840,0280,62800062,878< 0,001148840,8821,4800062,783< 0,00114884140,06173,3100352,944,743< 0,001148840,0080,50000061,511< 0,001148846,00310,4034,215,106,7838,680< 0,001148842,4749,5141,422,082,8349,752< 0,001148840,3061,75400052,547< 0,001148840,3231,37000055,050< 0,001148846,9945,8000064,422< 0,001148842,0738,5200061,552< 0,001148840,8634,7700059,825< 0,001148840,1060,53900065,900< 0,001Площадь поверхности тела и индекс массы – расчетные показатели, они быливычислены по имеющимся в выгруженных данных значениям роста в сантиметрахи веса в килограммах.
Для расчета площади поверхности тела использоваласьформула (1) Мостеллера [112]:Площадь поверхности тела = √Рост∗Вес3600(1)Для расчета индекса массы тела использовалась стандартная формула ВОЗ(2) с предварительным переводом роста из сантиметров в метры:87Индеск массы тела =Вес(Рост/100)2(2)Вследствие такой методики расчета площадь поверхности тела сильнокоррелирует с индексом массы тела (коэффициент по Спирмену: ρ=0,749; p<0,001),весом (ρ=0,978; p<0,001) и ростом пациента (ρ=0,540; p<0,001).
Таким образом, припостроении моделей могла использоваться только одна из четырех представленныхв выборке антропометрических переменных.Чтобы не допустить эффекта «переобучения» при создании прогностическоймодели, было необходимо выявить подобные зависимости и между другимиколичественными предикторами, чтобы впоследствии обязательно учесть их связипри отборе переменных для построения регрессионных функций.Предикторы, имеющие сильную корреляционную связь между собой (модулькоэффициента корреляции больше 0,6), не использовались одновременно припостроениипрогностическихиспользованиевторого.функцийУмеренно–добавлениекоррелирующиеодногоисключалопеременные(модулькоэффициента корреляции между 0,4 и 0,6) планировалось вводить в уравнение вединичных случаях, с проверкой степени значимости и поведения на контрольнойвыборке – потенциально это позволяло улучшить регрессионную функцию, недопустивее«переобучения».Наодновременноеиспользованиеслабокоррелирующих и не коррелирующих друг с другом предикторов (модулькоэффициента корреляции меньше 0,4) ограничений не накладывалось.Поиск коллинеарных количественных предикторов проводился с помощьюкорреляционного анализа, с определением парных коэффициентов корреляциимежду всеми переменными.
Использовались непараметрические методы поСпирмену и Кендаллу, т.к. все переменные количественные и непрерывные, а ихраспределение в выборке не соответствует нормальному (как представлено вТаблица 13).Две итоговые корреляционные матрицы (59 на 59) оказались слишкомбольшими для представления их в тексте работы, поэтому ниже приведены88наиболее показательные пары предикторов и фрагменты из матрицы корреляцийпо Спирмену (ρ-Спирмена), в которых сразу для нескольких пар наблюдалисьсильные и умеренные корреляции (ρ> 0,4).
Рассчитанные значения коэффициентовконкордации Кендалла показали аналогичные уровни корреляции, поэтому неприводятся в таблицах.Среди курсовых доз медикаментов была отмечена сильная корреляционнаясвязь между курсовыми дозами фолината кальция и фторурацила (ρ=0,885;p<0,001) – эти химиопрепараты, как правило, назначаются совместно и впропорциональных курсовых дозах, поэтому обе переменные не моглиодновременно присутствовать в модели для прогнозирования токсичности вкачестве предикторов.Вбиохимическомисследованиисильныекорреляционныесвязиобнаружились между общим и прямым билирубином (ρ=0,876; p<0,001), уровнямимочевины и креатинина (ρ=0,473; p<0,001).