Лекции. ММО. Сенько (all in one) (1185303), страница 19
Текст из файла (страница 19)
1. Сравниваются оценки для кривых выживаемости по методуКаплан-Майера групп пациентов с двумя вариантами генотипа.Сенько Олег Валентинович ()МОТП, лекция 1214 / 29В настоящее время существует целый ряд методов оценки влиянияпеременных X1 , . . . , Xn на форму кривой выживаемости. Одной изпопулярных моделей до сих пор является модель Кокса, основанная наконцепции мгновенного риска. Мгновенный риск λ(t) в момент tопределяется как пределlim =∆t→0f (t)P [T ≤ (t + ∆t)|T ≥ t]=,∆tS(t)где f (t) плотностью вероятности наступления критического события вточке t. То есть f (t) = dFdt(t) , где F (t) = 1 − S(t). Таким образомочевидна справедливость простого дифференциального уравненияλ(t)dt = −−dS(t).S(t)(2)Проинтегрировав левую и правую части уравнения (1) на отрезке [t0 , t]убеждаемся в справедливости равенствRtln[S(t)] = −Λ(t) или S(t) = exp[−Λ(t)] где Λ(t) = t0 λ(t).Сенько Олег Валентинович ()МОТП, лекция 1215 / 29В случае если форма кривой выживаемости зависит от переменныхX1 , .
. . , Xn , мгновенный риск также оказывается функциейпеременных X1 , . . . , Xn . В основе модели Кокса (моделипропорциональных рисков) лежит предположение о возможностипредставления мгновенного риска для произвольного объекта s∗ сописанием x∗ = (x∗1 , . . . , x∗n ) в виде произведенияλ(t|x∗ ) = λ0 (t) exp (β1 ∗ x∗1 + . . . + βn ∗ x∗n ),где λ0 (t) - базовая компонента, зависящаятолько от времени. ПустьRtS0 (t) = exp[−Λ0 (t)], где Λ0 (t) = t0 λ0 (t). В результате получаем∗∗S(t) = S0 (t)[exp (β1 ∗x1 +...+βn ∗xn )] .Для поиска вектора параметров (β1 , . . .
, βn ) используется методмаксимального правдоподобия.Сенько Олег Валентинович ()МОТП, лекция 1216 / 29Модель пропорциональных рисков КоксаПредположим, что для настройки модели пропорциональных рисковиспользуется обучающая выборкаSe = {s1 = (α1 , t1 , x1 ), . . . , sm = (αm , tm , xm )}. Предположим, чтокритическое событие для объекта si произошло в момент времени ti .Вероятность того, что среди всех объектов, для которых критическоесобытие до момента ti не наступало, это событие в момент tiпроизошло именно с si оценим с помощью отношенияλ0 (ti ) exp (β1 ∗ xi1 + . .
. + βn ∗ xin )λ(ti |xi )=P=tj >ti λ(ti |xj )tj >ti λ0 (ti ) exp (β1 ∗ xj1 + . . . + βn ∗ xjn )Pexp (β1 ∗ xi1 + . . . + βn ∗ xin )tj >ti exp (β1 ∗ xj1 + . . . + βn ∗ xjn )=PСенько Олег Валентинович ()МОТП, лекция 1217 / 29Функционал правдоподобия записывается в видеL(β1 , . . . , βn ) =mYexp (β1 ∗ xi1 + . . . + βn ∗ xin ).tj >ti exp (β1 ∗ xj1 + . .
. + βn ∗ xjn )Pi=1В модели используются значения (β1 , . . . , βn ), при которыхL(β1 , . . . , βn ) достигает максимума. Наряду со значением параметров(β1 , . . . , βn ) неизвестным параметром модели пропорциональныхрисков является форма базовой функции выживаемости S0 (t). Однимиз возможных способов восстановления S0 (t) является подход,основанный на аппроксимация отношенияS(ti |β1 , . .
. , βn , xi )S(ti−1 |β1 , . . . , βn , xi )величиной1− Pexp (β1 ∗ xi1 + . . . + βn ∗ xin )tj >ti exp (β1 ∗ xj1 + . . . + βn ∗ xjn )(3)для произвольной пары последовательных моментов времени (ti−1 , ti ),для которых имели место критические события.Сенько Олег Валентинович ()МОТП, лекция 1218 / 29При этом предполагается, что вектор параметров (β1 , . .
. , βn ) уже былранее найден с помощью описанного ранее варианта методамаксимального правдоподобия. Очевидно, что для вектора xi ,описывающего объект si из обучающей выборки, справедливоравенствоS(ti |β1 , . . . , βn , xi )S0 (ti ) exp(β1 ∗xi1 +...+βn ∗xin )=[].S(ti−1 |β1 , . . . , βn , xi )S0 (ti−1 )(4)0 (ti )Обозначим отношение SS0 (tчерез γi . Из равенств (2) и (3) следуетi−1 )справедливость равенстваexp (β1 ∗ xi1 + . . . + βn ∗ xin )−1][exp(β1 ∗xi1 +...+βn ∗xin )]tj >ti exp (β1 ∗ xj1 + . . . + βn ∗ xjn )γi = [1 − PОчевидно, величина γi может быть рассчитана для каждого объектаиз выборкиe.Сенько Олег Валентинович ()МОТП, лекция 1219 / 29Оценка базовой функции выживаемости на отрезке времени [ti , ti+1 ]может оцениваться в виде произведения коэффициентов γi поe для которых критическое событиевсевозможным объектам S,наступило до момента ti .
То естьYS0 (ti ) =γj .tj <tiСенько Олег Валентинович ()МОТП, лекция 1220 / 29Временные рядыПод временным рядом понимается множество значений некоторойпеременной Z, измеренных в моменты времени, разделённыеодинаковыми интервалами. . . , Z(ti−1 ), Z(ti ), Z(ti+1 ), . . .Временной ряд считается многомерным, если в каждый моментвремени измеряются значения нескольких переменных. Многомерныйряд, содержащий значения переменных Z1 , . .
. , Zk , может бытьпредставлен в виде набора последовательностей:. . . , Z1 (ti−1 ), Z1 (ti ), Z1 (ti+1 ), . . ....,...,...,...,...,.... . . , Zk (ti−1 ), Zk (ti ), Zk (ti+1 ), . . .Сенько Олег Валентинович ()МОТП, лекция 1221 / 29Временные рядыОсновной задачей анализа временных рядов является поискалгоритма, позволяющего предсказывать значения переменной Z илизначения переменных из некоторого подмножества Z1 , .
. . , Zk в ещё ненаступившие моменты времени. Дополнительными задачами анализвременных рядов является поиск существующих эмпирическихзакономерностей, включая поиск циклических изменений переменных.Прогнозирование временного ряда производится с помощьюалгоритма, обученного по доступному в результате наблюденийучастку временного ряда достаточной длины. Одним из способовпрогнозирования временных рядов является использованиеодномерной регрессионной функции f (t), зависящей от времени.
В техслучаях, когда прогностическая способность f (t) являетсястатистически достоверной, а функция f (t) является линейной,говорят о наличии во временном ряду линейного тренда. Для поискалинейного тренда может быть использован метод простой одномернойрегрессии с использованием в качестве прогнозирующей переменнойX время t.Сенько Олег Валентинович ()МОТП, лекция 1222 / 29Временные рядыЗначения переменной Z в различных точках временного ряда. . . , Z(ti−1 ), Z(ti ), Z(ti+1 ), . .
.могут рассматриваться как реализации случайных функций. . . , Z̆i−1 , Z̆i , Z̆i+1 , . . . .Процесс, отображаемый временным рядом, называется стационарным,если совместное распределение вероятности для произвольных rпоследовательно расположенных в ряду случайных величинZ̆i+1 , . . . , Z̆i+rСовпадает с совместным распределением r случайных величинZ̆i+1+l , . . . , Z̆i+r+l , . . .при некотором целом l.Сенько Олег Валентинович ()МОТП, лекция 1223 / 29Временные рядыОчевидно, что процесс является стационарным, если переменные. .
. , Z̆i−1 , Z̆i , Z̆i+1 , . . .являются независимыми и одинаково распределёнными.Предположим, что функция f (t) полностью характеризует процесс.Это означает, что Z(ti ) = f (ti ) − εi , где . . . , εi−1 , εi , εi+1 , . . . независимые и одинаково распределённые ошибки с нулевымматематическим ожиданием. Тогда случайный процесс, отображаемыйвременным рядо. . .
, [Z(ti−1 ) − f (ti−1 )], [Z(ti ) − f (ti )], [Z(ti+1 ) − f (ti+1 )], . . . ,оказывается стационарным.Сенько Олег Валентинович ()МОТП, лекция 1224 / 29Временные рядыДля прогнозирования временного ряда в произвольной точке ti нарядус методами, основанными на выделении тренда, используютсяметоды, основанные на поиске оптимального алгоритма A ,вычисляющего оценку Z(ti ) по набору предшествующих значений{Z(tj1 ), . . .
, Z(tjl )}, где (j1 , . . . , jl ) является набором целых чисел. Тоесть оценка Ẑ(ti ) вычисляется по формулеẐ(ti ) = A[Z(tj1 ), . . . , Z(tjl )].Простейшим примером такого рода прогнозирования является методскользящего среднего, вычисляющего оценку Ẑ(ti ) в видеl1XẐ(ti ) =Z(ti−j ).lj=1Сенько Олег Валентинович ()МОТП, лекция 1225 / 29Временные рядыИспользуется также метод взвешенного скользящего среднего,вычисляющего оценку Ẑ(ti ) в видеlẐ(ti ) =1Xcj Z(ti−j ),lj=1где (c1 , . . .
, cl ) являются неотрицательнымикоэффициентами,Pудолетворяющими условию lj=1 cj = 1.Нетрудно видеть, что прогностическая способность методаскользящего связана с относительным постоянство математическогоожидания случайных величин Z̆i−1 , . . . , Z̆i−l , . . .. Метод скользящегосреднего используется для “сглаживания” временных рядов,фильтрации высокочастотной шумовой составляющей.Сенько Олег Валентинович ()МОТП, лекция 1226 / 29Временные рядыВ общем случае для обучения алгоритма A могут быть использованывсевозможные методы регрессионного анализа и распознавания, еслипрогнозируемая переменная Z является категориальной. Обучениеалгоритма A может производится по таблице, составленный изэлементов, принадлежащих известному участку временного ряда.Предположим, что в результате наблюдений стали известны значенияZ(t1 ), .
. . , Z(tN ). По данному ряду может быть построена таблицаZ(tN ), Z(tN −1 ), . . . , Z(tN −l ),Z(tN −1 ), Z(tN −2 ), . . . , Z(tN −l−1 ),...,...,...,...,...,...,Z(tN −l ), Z(tN −l−1 ), . . . , Z(tN −2l ).Сенько Олег Валентинович ()МОТП, лекция 1227 / 29Временные рядыПри этом первый слева элемент в каждой строке рассматривается вкачестве прогнозируемой величины Y . Далее последовательно слеванаправо значения переменной Z в строке рассматриваются в качествезначений прогнозирующих переменных X1 , .
. . , Xl . В случаемногомерных временных рядов при прогнозировании некоторойпеременной Zj могут быть использованы значения и другихпеременных из набора Z1 , . . . , Zk . .Сенько Олег Валентинович ()МОТП, лекция 1228 / 29Временные рядыДля поиска циклических (сезонных) колебаний переменной Z могутбыть использованы методы корреляционного анализа. Для каждойпредполагаемой длины цикла l строится таблица, состоящая из двухстолбцов:Z(tN ), Z(tN −l ),Z(tN −1 ), Z(tN −l−1 ),...,...,...Z(tl+1 ), Z(t1 ).Вычисляется коэффициента корреляции между столбцами.
Реальносуществующему циклу длины l∗ соответствует максимальная величинакоэффициента корреляции для таблицы, построенной по сдвигу l∗ , поотношению к коэффициентам корреляции для таблиц, построеннымисходя из других величин сдвига.Сенько Олег Валентинович ()МОТП, лекция 1229 / 292Кластерный анализЦелью методов кластерного анализа является разбиение выборок многомерных данных нагруппы объектов близких в смысле некоторой заданной меры сходства. Такие компактныегруппы называются кластерами, классами или таксонами.Методыкластерногоанализаназываюттакжеметодамиобучениябезучителя,автоматической группировки или таксономии.Методыкластерногоанализамогутиспользоватьсявкачествавспомогательныхинструментов при решении задач прогнозирования или распознавания.
Однако нередкокластеризация может иметь самостоятельное значение.2Кластерный анализБольшинство известных алгоритмов кластеризации предполагает задание расстояния (x, y) между произвольными векторами-описаниямиобъектов. В качестве расстояния могут выступать, например, евклидова метрика: (x, y ) n2(xy) i ii 1Используются и другие функции расстояния.2Кластерный анализОдним из наиболее известных методов кластеризации является алгоритмk внутригрупповыхсредних.
Предположим, что у нас задана выборка векторов- описаний S {x1 ,, xm}. Алгоритмнаходит такие кластеры, для объектов которых центр «своего кластера» будет ближе центра любого«чужого кластера».Метод предполагает, что число кластеров изначально задано.2Кластерный анализПоиск оптимальной кластеризации методом квнутригрупповых среднихПредположим, что предполагаемое число кластеров равно r.Зададим произвольным образом исходное разбиение выборкиS {x1, , xm}на группыG10 , , Gr0Вычисляем геометрические центры исходных группПусть группаGi0состоит из объектовm(i )01{x , , x0m(i )}.Тогда центр0iGxi0 m1(i ) x0jвычисляется по формулеВычисляются расстояния между объектами изSи центрамиj 1x10 , , xr02Кластерный анализПоиск оптимальной кластеризации методом kвнутригрупповых среднихОбъекты изS затем переносятсяполучаем новый набор группв группу с наименее удалённым центром. В результате мыG11 , , Gr1 .Повторяем для набора группG11 , , Gr1 те же00G,,Gсамые операции, которые ранее выполнялись для групп 1r………………………………………………………………………………………………………………………………………………………………Процесс завершается на некотором шаге k+1, когда переносы объектов изSв другиегруппы не требуются.То есть каждый объект наименее удалён от центра той же самой группы, которой он ипринадлежит.