Лекция 12. Байесовские сети_ анализ выживаемости (2014 Лекции (Сенько))
Описание файла
Файл "Лекция 12. Байесовские сети_ анализ выживаемости" внутри архива находится в папке "2014 Лекции (Сенько)". PDF-файл из архива "2014 Лекции (Сенько)", который расположен в категории "". Всё это находится в предмете "(ммо) методы машинного обучения" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Лекция 12Байесовские сетиМетоды анализа выживаемостиЛектор – Сенько Олег ВалентиновичКурс «Математические основы теории прогнозирования»4-й курс, III потокСенько Олег Валентинович ()МОТП, лекция 121 / 29Содержание лекции1Байесовские сети2Анализ выживаемости3Временные рядыСенько Олег Валентинович ()МОТП, лекция 122 / 29Байесовские сетиРассмотренные ранее в курсе методы позволяют прогнозироватьзначения отдельных целевых переменных. Однако более высокаяточность прогноза для сложных технических, биологических илисоциальных систем может быть достигнута на основе описаниявзаимодействия наборов переменных, характеризующих данныесистемы.
Подробное наглядное описание взаимодействия большихнаборов переменных может быть достигнуто с использованиемсовременных графических вероятностных моделей. К числу подобныхмоделей относятся байсовские сети (БС), сочетающие графическуюнаглядность с математической строгостью. Аппарат байесовских сетейпринципиально позволяет полностью охарактеризовать многомерноесовместное распределение больших наборов переменных.Определение 1.
Байесовской сетью называется ориентированныйациклический граф, вершинам которого поставлены в соответствиеслучайные переменные.Сенько Олег Валентинович ()МОТП, лекция 123 / 29Рис.1. Пример байесовской сети.Сенько Олег Валентинович ()МОТП, лекция 124 / 29При этом наличие ребра между двумя вершинами указывает наналичие статистической связи между соответствующимипеременными. Иногда направление ребра интерпретируют как наличиепричинно-следственной связи между соответствующими переменными.Для того, чтобы более точно охарактеризовать смысловую связьграфической структуры БС с совместными распределениями наборовпеременных, введём дополнительные определения. Вершина Xiназывается предком вершины Xj , если они соединены ребром,ориентированным от Xi к Xj . Соответственно вершина Xj считаетсяпотомком вершины Xi .
Вершины, не имеющие предком, называютсякорневыми. Обозначим через P ar(X) – множество предков вершиныX, V i (X) - множество вершин БС, не являющихся потомкамивершины X и не содержащее вершину X. Вершина называетсякорневой, если у неё нет вершин предков. Пример БС, описывающейвзаимосвязь переменных X1 , . . .
, X8 , приведён на рисунке 1. Вершины,соответствующие переменным X1 , X2 , X7 , X8 являются корневыми.Вершины, соответствующие переменным X1 и X2 являются предкамивершины, соответствующей переменной X3 .Сенько Олег Валентинович ()МОТП, лекция 125 / 29Вершины, соответстющие переменным X3 и X7 , являются предкамивершины, соответствующей переменной X4 и т.д.Условие 1. Байесовская сеть строится исходя из требования обусловной независимости каждой вершины X от множества вершинV i (X) при известных значениях родителей из P ar(X).Можно показать, что выполнение условия 1 эквивалентносправедливости разложения для совместного распределения вершинX1 , .
. . , Xn :Условие 2.nYP [Xi |P a(Xi )].(1)P (X1 , . . . , Xn ) =i=1Из условия 2 видно, что совместная вероятность P (X1 , . . . , Xn ) можетбыть описана с помощью n условных распределений P [Xi |P ar(Xi )].Предположим, что переменные X1 , . . . , Xn являютсякатегориальными. Тогда о параметры распределений P [Xi |P ar(Xi )]задаются с помощью таблицы условных вероятностей (ТУВ).Сенько Олег Валентинович ()МОТП, лекция 126 / 29Ячейки ТУВ, соответствующей вершине (переменной) Xi , содержатвероятности каждого из возможных значений Xi при всевозможныхкомбинациях значений узлов, являющихся родителями Xi . В случае,когда БС является разреженной, (т.е.
когда число связей междувершинами оказывается существенно ниже общего числа парныхсочетаний вершин), суммарный объём ТУВ оказывается существенномеьше общего числа всевозможных комбинаций значенийпеременных(X1 , . . . , Xn ). Построении БС производится по обучающейвыборке, содержащей значения векторов переменных X1 , . . . , Xn ,измеренные, например, в различные моменты времени. Для оценкиусловной независимости используются статистические тесты.Обучающие выборки используются для вычисления ТУВ. Вместе стем задание общего каркаса БС часто производится экспертом вобласти знаний,где используется БС.
Построенная БС может бытьиспользована для решения нескольких типов задач. В первую очередьнеобходимо отметить задачу вероятностного вывода.Сенько Олег Валентинович ()МОТП, лекция 127 / 29Целью вероятностного вывода является оценка вероятности состоянийкаждой из вершин сети, исходя из известных значений переменных,соответствующих корневым вершинам. Для расчётов может бытьиспользована представление совместной вероятности условия 2.Предположим, что переменные X1 , .
. . , X8 являются бинарнымии,принимающими значения из множества {0, 1}. Рассчитаемвероятность X6 = 1 при следующих условиях, наложенных накорневые переменных: X1 = 0,X2 = 0,X7 = 1,X8 = 1. Для этогодостаточно вычислить, использую формулу (1) вероятность каждой изкомбинаций значений переменных вида (0, 0, u3 , u4 , u5 , u6 , 1, 1), гдеu3 , u4 , u5 , u6 выбираются из множества {0, 1}. Обозначим множествоef . Разобъём множество Uef на подмножестватаких комбинаций через Ue0 , включающие комбинации из Uef с u6 = 0, и Ue1 . , включающиеUeкомбинации из Uf с u6 = 1.Сенько Олег Валентинович ()МОТП, лекция 128 / 29e является суммойОчевидно, что вероятность множества комбинаций Ueвероятностей комбинаций, входящих в U . Вероятность X6 = 1 приусловии X1 = 0,X2 = 0,X7 = 1,X8 = 1 очевидно равнаe1 |Uef } =P {Ue1 )P (U.ef )P (UПри моделировании с помощью БС сложных технических системкорневым вершинам соответствуют переменные, характеризующиевнешние воздействия, или управляющие параметры.
Процедуравероятностного вывода позволяет оценить распределениявероятностей для переменных, характеризующих возникновениенарушений функционирования технической системы при заданныхвнешних воздействиях в зависимости от значений наборауправляющих параметров.Сенько Олег Валентинович ()МОТП, лекция 129 / 29Анализ выживаемостиРанее нами рассматривались разнообразные средства решения задачираспознавания и задачи прогнозирования непрерывных переменных(регрессионного анализа).
Однако в различных прикладныхисследованиях и практической деятельности встречаются задачи,которые не могут быть адекватно решены только лишь с помощьюданных средств. К числу таких задач следует отнести задачу анализавыживаемости в медицине и биологии или задачу анализа надёжностив технике. Целью таких задач является восстановление вероятноститого, что ожидаемое критическое событие с исследуемым объектомпроизойдёт не ранее произвольного момента времени.
Такимкритическим событием может быть отказ изделия в технике, гибельиспытуемого организма в биологии или смерть пациента в медицине.Таким образом целью анализа является вычисление функции (кривой)выживаемости S(t) = P {T > t} , где через T обозначено времянаступления критического события, P {T > t} обозначает вероятностьтого, что критическое событие произойдёт позже момента t.Сенько Олег Валентинович ()МОТП, лекция 1210 / 29Обычно момент t отсчитывается от от некоторой важной дляизучаемого процесса точки. Такой точкой может быть, например,момент производства изделия или момент начала лечения.
Следуетотметить, что в большинстве практических исследованиях важно нетолько вычислить кривую выживаемости, но и оценить влияние на неёпеременных, характеризующих исследуемые объекты. Такимипеременными могут быть, например, возраст пациента и различныеклинические показатели в биомедицинских исследованиях, илипараметры, характеризующие условия изготовления изделия, взадачах анализа надёжности.Задача расчёта кривых выживаемости и оценки влияния на нихразличных переменных может быть решена с помощью методовмоделирования по эмпирическим данным.
Методы анализавыживаемости по эмпирическим данным тесно связаны сцензурированностью информации. Наблюдение в статистике считаетсяцензурированным, если известно не точное значение наблюдаемойвеличины, а только интервал, которому оно принадлежит.Сенько Олег Валентинович ()МОТП, лекция 1211 / 29Данный интервал может быть как конечным, так и бесконечным(ограниченным с одной стороны).
В данных, связанных с анализомвыживаемости или надёжности нередко цензурированной оказываетсяинформация о наступлении критического события. Например, ванализируемой выборке может содержаться информация не только обобъектах, для которых критическое событие уже наступило, и моментэтого события был точно зафиксирован, но также и об объектах, длякоторых критическое событие на момент последнего наблюдения непроизошло. Выборки данных в задачах анализа выживаемости обычноимеют видSe = {s1 = (α1 , t1 , x1 ), . . . , sm = (αm , tm , xm )},где ti - время, прошедшее от начального момента до моментапоследнего наблюдения за объектом;αi - индикатор, равный 1, если в момент ti для объекта si былозафиксировано критическое событие, и равный , если в моменткритическое событие не наступило;xi = (xi1 , . .
. , xin )- вектор переменных X1 , . . . , Xn , которыепотенциально могут оказывать влияние на форму кривойвыживаемости.Сенько Олег Валентинович ()МОТП, лекция 1212 / 29Анализ выживаемостиРассмотрим методы восстановления кривых выживаемости приигнорировании влияния на их форму переменных X1 , . . . , Xn Одним изнаиболее популярных методов восстановления кривых выживаемости вэтих случаях является процедура Каплан-Майера, учитывающаясуществование цензурированных наблюдений. При отсутствии такихнаблюдений процедура Каплан-Майера эквивалентна вычислениюобычных эмпирических наблюдений.
Предположим, что наблюдения внекоторой выборке Se фиксировались в моменты t1 , . . . , tN . Пусть ni число объектов, для которых критический момент не наступил домомента времени ti , di -число критических событий в момент ti .Оценка значения кривой выживаемости мо методу Каплан-Майера наполуинтервале (ti , ti+1 ] вычисляется по формулеS(t) =iYnj − dj.njj=1На рисунке 1 представлены примеры оценок кривых выживаемости пометоду Каплан-Майера.Сенько Олег Валентинович ()МОТП, лекция 1213 / 29Анализ выживаемостиРис. 1.
Сравниваются оценки для кривых выживаемости по методуКаплан-Майера групп пациентов с двумя вариантами генотипа.Сенько Олег Валентинович ()МОТП, лекция 1214 / 29В настоящее время существует целый ряд методов оценки влиянияпеременных X1 , . . . , Xn на форму кривой выживаемости. Одной изпопулярных моделей до сих пор является модель Кокса, основанная наконцепции мгновенного риска.