Диссертация (1174324), страница 16
Текст из файла (страница 16)
Взаимосвязи для измеренныхактивностей ферментов представлены в Таблица 14.Ожидаемо высокаякорреляция между печеночными трансаминазами (ρ=0,763; p<0,001) дополняетсяих умеренными корреляциями с щелочной фосфатазой и лактатдегидрогеназой.Таблица 14. Парные корреляции по Спирмену для активностей ферментов сыворотки вбиохимических исследованиях, вошедших в ретроспективную выборку исследования.
Длявсех коэффициентов p <0,001.ЛДГЩелочная фосфатазаАЛТАСТЛДГ-0,3060,3000,503Щелочная фосфатаза0,306-0,3150,420АЛТ0,3000,315-0,763АСТ0,5030,4200,763-Таким образом, использование АСТ в модели исключало использованиепоказателей любого другого фермента, и наоборот, исключение АСТ из спискапредикторов позволяло одновременноиспользовать все трипоказателя: ЛДГ, АЛТ и щелочную фосфатазу.оставшихся89Еслирассмотретьвзаимосвязигематологическихпоказателейлейкоцитарного ряда, представленные в Таблица 15, то обнаруживаются сильныекорреляционные связи между общим количеством лейкоцитов и количествомнейтрофилов, что в абсолютном (ρ=0,903; p<0,001), что в процентном (ρ=0,808;p<0,001) выражении.Наличие такой связи обосновывается теоретически, так как нейтрофилыявляются наиболее крупной популяцией лейкоцитов в крови взрослого человека.Этим же объясняется и сильная обратная корреляция (ρ=-0,797; p<0,001) долилимфоцитов с долей нейтрофилов.
Отсутствие сильных корреляционных связеймежду другими показателями объясняется наличием среди лейкоцитов ещенескольких вариативных фракций, таких как базофилы, эозинофилы, моноциты.Таблица 15. Парные корреляции по Спирмену для гематологических показателейлейкоцитарного ряда, вошедших в ретроспективную выборку исследования.Для всех коэффициентов p<0,001.Лейкоциты(10^9)Нейтрофилыабс.
(10^9)-0,903Нейтрофилы абс.0,903Нейтрофилы %Лимфоциты абс.ЛейкоцитыЛимфоциты %Нейтрофилы (%)Лимфоцитыабс. (10^9)Лимфоциты(%)0,5100,543-0,328-0,8080,223-0,5970,5100,808--0,286-0,7970,5430,223-0,286-0,526-0,328-0,597-0,7970,526-Таким образом, из пяти показателей лейкоцитарного ряда, представленных вТаблица 15, одновременно доступны для использования в модели не более трех,причем два из них нужно будет вводить с проверкой качества модели, дляисключения ее «переобучения».Парные коэффициенты корреляции по Спирмену для гематологическихпоказателей эритроцитарного ряда представлены ниже (Таблица 16, значениявыделены полужирным шрифтом).
Среди них обращают на себя внимание сильныекорреляции с показателем гематокрита для количества эритроцитов (ρ=0,815;90p<0,001) и уровня гемоглобина (ρ=0,960; p<0,001). Корреляции с гематокритом уних оказались выше, чем между собой (ρ=0,713; p<0,001).Это объясняется тем, что, хотя в классическом определении гематокрит – этоотношение объема всех форменных элементов к объему плазмы, но подавляющаячасть объема форменных элементов приходится именно на объем эритроцитов,которые в свою очередь полностью заполнены гемоглобином.
Связь же междуколичеством эритроцитов и уровнем гемоглобина должна учитывать степеньвыраженности и характер анизоцитоза эритроцитов (микроцитоз, нормоцитоз,макроцитоз), поэтому ее коэффициент корреляции несколько ниже.Также сильные корреляционные связи отмечены и среди эритроцитарныхиндексов (Таблица 16, выделены полужирным шрифтом). Среднее содержаниегемоглобина в отдельном эритроците, MCH, показывает высокую корреляцию сосредним объёмом эритроцитов, MCV, (ρ=0,909; p<0,001) и средней концентрациейгемоглобина в эритроцитарной массе, MCHC, (ρ=0,620; p<0,001) при том, чтомежду собой они коррелируют слабо (ρ=0,291; p<0,001).Данный факт объясним самим определением индексов: средний объем,умноженный на среднюю концентрацию, даст среднее количество с точностью доразмерности: MCV (фл) * MCHC (г/л) = 10-3* MCH (пг).Таблица 16.
Парные корреляции по Спирмену для гематологических показателейэритроцитарного ряда, вошедших в ретроспективную выборку исследования.Для всех коэффициентов p<0,001.ГемоглобинЭритроцитыГематокрит0,7320,7320,9600,2730,1190,512Эритроциты-0,374-0,4780,058Гематокрит0,9600,8150,815-0,120MCH0,273-0,3740,1200,2860,620MCV0,119-0,4780,0440,9090,0440,909-0,2910,2860,6200,291-ГемоглобинMCHCОтсутствие0,512сильных0,058корреляционныхMCHсвязейMCVмеждуMCHCиндексамиинатуральными величинами среди гематологических показателей эритроцитарного91ряда, представленных в Таблица 16, позволяет выбирать для использования впрогностических моделях по одному любому показателю из каждой группы.3.1.2.
Анализ категориальных переменныхПри выгрузке из базы данных многие признаки были описаны номинальнымикатегориями. В таком виде они не пригодны для использования в регрессионноманализе, поэтому для включения в уравнение логистической регрессии такиепеременные необходимо привести к набору порядковых признаков, имеющихчисловой индекс, отражающий их семантический смысл.В роли такого примера можно привести переменную со стадиейонкологического заболевания, для которой еще во время выгрузки была проведенасоответствующая модификация: значения вида “Ia2”, “IIc”, ”III” или “IVa” былизаменены на числовые индексы от 0 до 4, где положительные числа обозначалистадии, а ноль использовался при невозможности ее установить на основаниивыгруженных данных.
Частоты для таких укрупненных стадий по всем выборкамисследования представлены в Таблица 17 ниже.Таблица 17. Распределение курсов химиотерапии по укрупненным стадиямонкологических заболеваний в выборках исследования.Укрупненнаястадия ЗНО намоментназначения курсахимиотерапии0 – неизвестноМассив данных до внедренияРетроспективнаявыборка:2011-2014 гг.Колич.ДоляПосле внедренияДополнительнаявыборка: 2014-2015 гг.Колич.ДоляПроспективнаявыборка: 2015-2017 гг.Колич.Доля818755%405741%760533%1 - первая1661%2472%5723%2 - вторая8516%101710%289713%3 - третья191713%196020%509022%4 - четвертая376325%263727%658629%Для номинальных признаков, у которых нельзя семантически (по смыслу)упорядочить категории, применяется операция бинаризации. В общем виде онапредставляет собой вычисление специальных дихотомических (бинарных)92переменных для каждой категории номинативного признака, кроме одной –наименеераспространеннойили,вероятно,несвязаннойсразвитиеммиелотоксических осложнений, или заменяющей категорию «Прочие …».Например, пол пациента был представлен категориальной переменной созначениями «Мужской» или «Женский», которая была приведена к однойбинарной переменной «Пол пациента - Женский» с возможными значениями «Да»(1) или «Нет» (0).
Нулевое значение в данном случае означало мужской полпациента. Половозрастные характеристики всех выборок исследования приведеныв Таблица 4, представленной в разделе 2.2 главы «Материалы и методы» даннойработы.Аналогично категориальная переменная «Характер лечения» со значениями«радикальный» или «паллиативный» становится бинарной переменной «Характерлечения - радикальный» с возможными значениями «Да» (1) или «Нет» (0).Отсутствие радикального характера лечения в данном случае будет обозначатьпаллиативную химиотерапию.Бинаризация для переменной с видом курса химиотерапевтического лечения,имеющей 4 категории, выделяет три переменных для подачи на вход логистическойрегрессии: адъювантное лечение (Да/Нет), неоадъювантное лечение (Да/Нет) ихимио-лучевое лечение (Да/Нет).
Самостоятельное лечение подразумевается вслучае, если все три перечисленных бинарных переменных имеют значение «Нет».Частотыиспользованиярадикальныхипаллиативныхрежимовхимиотерапевтического лечения, а также их связь с видом химиотерапиипредставлены в Таблица 7 раздела 2.2 данной работы.Еще на момент выгрузки данных стало понятно, что основной диагноз, дажезакодированный по МКБ-10 и укрупненный до трехзначного кода рубрики,использовать как предиктор будет невозможно: в выборке оказалось более 50равнозначных категорий из интервала C01-C75 кодов рубрик МКБ-10.Из них были выделены в отдельные бинарные переменные 14 наиболее частовстречающихся кодов трехзначных рубрик МКБ-10: C16, C18, C19, C20, C25, C32,93C34, C40, C49, C50, C53, C54, C56, C67, которые покрывали более 90% курсовхимиотерапии ретроспективной выборки (13441 из 14884 курсов).
Нулемкодировалось отсутствие нозологии, единицей – указание диагноза в качествепервого основного в плане химиотерапии пациента.Так как пациенты с первично множественными опухолями не включались висследование, согласно алгоритму бинаризации, указание единицы для любой избинарных переменных диагнозов гарантировало нули для остальных. Всеоставшиеся нозологии вошли в категорию «Прочие нозологии ЗНО», котораякодируется отсутствием признака во всех 14 выделенных группах ЗНО.Распределение частот ЗНО у пациентов, включенных в выборки исследования,также было приведено в Таблица 6 раздела 2.2 данной работы.943.2. Вычисление и кодирование зависимых переменных идополнительных факторов, связанных с нимиДля того чтобы статистически подтвердить влияние проведенной пациентамхимиотерапиинанепараметрическиепоказателикритериидляпериферическойсвязанныхкрови,использовалисьпеременных. Был проведенсравнительный анализ гематологических показателей, полученных за неделю допроведения курса: гемоглобин, тромбоциты, лейкоциты, абсолютное количествонейтрофилов; с их контрольными значениями, полученными в течение двух недельпосле химиотерапии, которые рассматривались как связанные и зависимыепеременные.
С помощью критерия знаков для связанных выборок и критериязнаковых рангов Вилкоксона были отклонены (p<0,001) гипотезы о том, чтомедианы разности показателей до лечения и после лечения равны нулю, в пользуальтернативной гипотезы о ненулевой разнице медиан, подтверждающей различиямежду показателями до и после лечения, представленные в Таблица 18.Таблица 18. Сравнение центральных тенденций гематологических показателейретроспективной выборки исследования (2011-2014 гг.), измеренных до и после курсахимиотерапии: критерий знаков и критерий знаковых рангов Вилкоксона.Критерийзнаковых ранговВилкоксонаПроцентили (квантили)Гематологическиепоказатели25%50%(Медиана)75%Гемоглобин104,0117,0129,0Гемоглобин контроль101,0114,0126,0Тромбоциты177,0236,0309,0Тромбоцитыконтроль154,0209,0273,0Лейкоциты4,205,507,20Лейкоциты контроль3,604,816,401,8422,8054,091Нейтрофилы абс.Нейтрофилы абс.Контроль1,4712,3373,495Критерий знаковСтатистикакритерияЗначимостьpСтатистикакритерияЗначимостьp-43,520< 0,001-36,391< 0,001-49,688< 0,001-42,458< 0,001-40,041< 0,001-32,868< 0,001-32,944< 0,001-27,469< 0,00195Гипотезы об одинаковости распределений гематологических показателей дои после химиотерапии были отклонены (p<0,001) с помощью ранговогодисперсионного анализа по Фридману и вычисления коэффициента конкордацииКендалла (результаты представлены в Таблица 19).