Главная » Просмотр файлов » Диссертация

Диссертация (1174222), страница 15

Файл №1174222 Диссертация (Клинико-эпидемиологическая характеристика инсульта в российской федерации по данным территориально-популяционного регистра) 15 страницаДиссертация (1174222) страница 152020-05-24СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 15)

Таким образом, при описании каждого показателя-предикторабыли получены уравнения логистической регрессии, уровень статистическойзначимости p для модели, OR для показателя (с 95% ДИ для OR), значения Se иSpe полученной модели с порогом отсечения оценки.842.4.3. Метод прогнозирования отдаленной летальности при инсультеПо результатам выявления предикторов летального исхода инсульта набазе методики создания «деревьев решений» была создана комплексная прогностическая модель для прогнозирования отдаленной летальности от инсульта.«Деревья решений» являются одним из методов машинного обучения ииспользуются для задач классификации и регрессии. Любое «дерево решений»можно представить в виде набора правил в иерархической, последовательнойструктуре, где каждому объекту соответствует единственный узел, дающийрешение. Под правилом понимается логическая конструкция, представленная ввиде "если ..., то ...".

Деревья решений используются в качестве прогностических моделей и систем для поддержки принятия решений в различных областяхмедицины, особенно для решения сложно формализуемых задач [251].«Деревья решений» состоят из узлов и листьев. Узлом называется структурный элемент дерева решений, в котором находится решающее правило; сэтим узлом связано определённое множество наблюдений.

С помощью правилаэто множество разбивается на подмножества, ассоциированные с дочернимиузлами. «Листьями дерева» называются терминальные узлы «дерева» – структурные элементы, в которых находятся результаты классификации. «Лист» завершает ветвь «дерева», и дальнейшее разбиение связанного с ним подмножества наблюдений не производится.Преимущества использования «деревьев решений» для задач классификации и регрессии заключаются в следующем:•быстрый процесс обучения модели;•построение непараметрических моделей;•генерация правил в трудно формализуемых областях;•извлечение правил на естественном языке;85•интуитивно понятная классификационная модель;•высокая точность прогноза, сопоставимая с другими методами (ста-тистика, нейронные сети).При построении «дерева» на каждом узле ищется такое условие, котороебы разбивало множество, ассоциированное с этим узлом, на подмножества.

Вкачестве такого условия выбирается один из заранее подобранных показателей.Выбранный показатель должен разбить множество так, чтобы получаемые витоге подмножества состояли из объектов, принадлежащих к одному классу(или были максимально приближены к этому). При этом, количество объектовиз других классов в каждом из этих множеств должно быть, как можно меньше.Если построенное «дерево» слишком громоздко и его сложно интерпретировать, применяется отсечение (pruning) тех ветвей «дерева», которые неприведут к возрастанию ошибки распознавания. При этом, под точностью распознавания понимается отношение правильно классифицированных объектов кобщему количеству объектов из обучающего множества, а под ошибкой – количество неправильно классифицированных.В настоящей работе для прогнозирования отдаленной летальности от инсульта использовалась методика LOTUS, позволяющая создавать гибридные«деревья решений» с логистической регрессией на терминальных узлах.

В результате использования этой методики можно получить прогностическую модель, сочетающую в себе четко формализованную структуру в виде логическихправил с определением процента вероятности попадания в один из предсказываемых классов.Методика LOTUS характеризуется следующими свойствами:1.применимость к выборкам с количественными и качественными пе-ременными;2.возможность выбора пользователем ролей для переменных-предикторов (только для разбиения на узлах; только для моделирования терминального узла; и для разбиения, и для моделирования);863.пригодность для анализа выборок с пропущенными значениями;4.возможность выбора между множественной или простой линейнойлогистическими моделями на терминальных узлах.Для создания множества генераций «деревьев» в нашем исследованиибыли выбраны следующие показатели-предикторы типа инсульта: пол; возрастна момент начала инсульта; группа по возрасту; факт выполнения КТ и/илиМРТ; наличие в анамнезе инсульта и инфаркта миокарда; АГ; курение; заболевания сердца ишемического генеза; ФП; дислипидэмия; СД; факта наличиястресса.Перед построением «дерева» показателям-предикторам присваивалисьследующие роли в модели:1.номинальная категориальная переменная (c – categorical nominal).Она используется только для разбиения на узлах и не используется для наполнения логистических моделей на терминальных узлах в качестве регрессора;2.порядковая категориальная переменная, используемая только дляразбиения на узах, но не для наполнения моделей (o – categorical ordinal);3.численная переменная, используемая только для наполнения моде-лей на узлах (f – fitting);4.числовая переменная, используемая только для разбиения на узлах,но не в качестве регрессора в логистических моделях (s – splitting);5.численная переменная, используемая как для разбиения на узлах,так и для наполнения моделей на узлах (n – numerical);6.зависимая переменная (d – dependent) – переменная, содержащаяпредсказываемое значение или метку класса; только одной переменной в наборе может быть присвоена эта роль.Также переменная могла быть исключена из анализа (x – excluded).

Этавозможность позволяла проводить анализ на различных комбинациях переменных, без необходимости каждый раз реструктурировать набор данных87Для создания «дерева решений» в наборе данных должна была присутствовать как минимум одна переменная для наполнения модели (f или n) и какминимум одна переменная для разбиения на узлах (c, или o, или s, или n).В процессе создания «дерева» выбирался один из 3-х вариантов моделейлогистической регрессии для наполнения терминальных узлов:•множественнаялинейнаялогит-регрессия(multiplelinearregression);•множественная линейная логит-регрессия с пошаговым выборомпоказателей (multiple linear stepwise regression);•простая линейная логит-регрессия (best simple linear regression).Если была выбрана опция пошаговой модели, необходимо было ввестиуровень p, используемый для входа показателя в модель на узле и уровень p дляисключения показателя из модели.В результате применения методики LOTUS на некотором обучающеммножестве создавалась последовательность «деревьев решений», отличающихся по структуре – начиная с максимально ветвистого «дерева» и заканчивая«деревом», содержащим минимальное число ветвей.

Далее с помощью соответствующей выборки проводилось отсечение ветвей для каждого «дерева» в последовательности. Желаемый размер «дерева» после отсечения ветвей определялся величиной стандартной ошибки оценки по модели (SE – standard error).Величина SE, равная 0, приводила к получению «дерева» с наименьшим средним отклонением оценки (к максимальному дереву); величина SE, равная 1,приводила к получению «дерева» с минимальным числом ветвей. Варьируя величину SE, можно было получить модели различной комплексности. После отсечения ветвей из всей последовательности «деревьев» в качестве оптимального выбиралось то «дерево», которое давало наименьшее отклонение от максимального «дерева» и соответствовало выбранной величине SE.

После нахождения оптимального «дерева» с помощью построения ROC-кривой вычислялисьего чувствительность, специфичность и порог отсечения оценки; определялась88общая прогностическая точность и соответствие критерию согласия ХосмераЛемешова.В процессе создания прогностической модели было создано несколькодесятков генераций «деревьев решений». Полученные модели отличались поструктуре набором предикторов в своем составе, их ролями и сочетаниями, атакже значениями общей точности, чувствительности и специфичности. В качестве финального «дерева» выбиралась одна модель, имеющая наибольшиезначения общей прогностической точности, чувствительности и специфичности, и в то же время, обладающая наиболее комплексной структурой.Далее проводилось тестирование финальной модели на тестовой выборке,также с определением чувствительности, специфичности и общей точностираспознавания.При описании терминальных узлов финального «дерева решений» приводилось общее число случаев на узле, число случаев с летальным исходом, уравнение регрессии, уровни статистической значимости p для коэффициентовуравнения, отношения шансов для показателей уравнения.2.4.4.

Вычисление эпидемиологических показателейСтатистический анализ проводился с использованием языка программирования статистических расчетов R версии 3.3.2.Стандартизация показателей заболеваемости и смертности выполняласьпрямым методом стандартизации (DMDR – Direct Method Death Rate) по следующей формуле: = ∑( × 1000),где Ps – среднегодовая численность данной возрастной группы, Mx – коэффициент заболеваемости/смертности в данной возрастной группе.89Показатели заболеваемости и смертности подвергались стандартизациина 1000 населения по стандарту Европейского региона ВОЗ.Таблица 2.4Стандарт населения для расчета эпидемиологических показателей (Европейский)Возрастнаягруппа го0 ды1-45-910-1415-1920-2425-2930-3435-3940-4445-4950-5455-5960-6465-6970-7475-7980-8485 и старшеВсегоДля мужчинДля женщин1345530368007108757081638206781174487068599759375521501541392449222810947981000001218480061606452686374387552725869866661573958175585546351963392353620761808100000Для обоихполов вместе1305502164726772720877927871752872126860586558765553524546802932289716061305100000Динамика временных рядов всех изучаемых показателей оценивалась спомощью темпа прироста/убыли и отражалась в табличном виде и графически.Темп прироста/убыли показывал, на сколько процентов текущий сравниваемыйуровень показателя больше/меньше предшествующего уровня показателя, при-90нятого за базу сравнения.

В настоящей работе рассчитывался цепной темп прироста (Тцпр ) – за базу сравнения принималось значение показателя за предыдущий год:Тцпр = − −1× 100,−1где – уровень текущего сравниваемого периода, −1 – уровень предшествующего периода. Таким образом, значение цепного темпа прироста показывало относительную скорость роста/снижения уровня показателя.Расчет описательных статистик, сравнение пациентов по значениям показателей проводились в полной популяции исследования и в группах по возрастам.Проверку нормальности распределения проводили несколькими способами: графическим – оценивали графическое изображение распределения данныхв форме гистограммы и диаграммы нормального распределения (Q-Q); проводилась оценка эксцесса и асимметрии. Определение распределения пациентовпо значениям количественных показателей проводилось с помощью критерияШапиро-Уилка.

Проверку гипотез о гомогенности генеральных дисперсий проводили с помощью теста Левене. Выбор параметрических или непараметрических критериев для тестирования статистических гипотез определялся типомраспределения пациентов по значениям показателей.Количественные показатели представлялись в виде числа случаев (N),среднего значения (M) и стандартного отклонения (SD), 95% доверительногоинтервала (95% ДИ) для среднего, медианы (Me) интерквартильного интервала(InterQuartile range – IQR), минимума (Min) и максимума (Max).

Характеристики

Список файлов диссертации

Клинико-эпидемиологическая характеристика инсульта в российской федерации по данным территориально-популяционного регистра
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6451
Авторов
на СтудИзбе
305
Средний доход
с одного платного файла
Обучение Подробнее