Лекции. ММО. Сенько (all in one) (1185303), страница 19

Файл №1185303 Лекции. ММО. Сенько (all in one) (2015 Лекции (Сенько)) 19 страницаЛекции. ММО. Сенько (all in one) (1185303) страница 192020-08-252020-08-25СтудИзба

2015 Лекции (Сенько)

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 19)

1. Сравниваются оценки для кривых выживаемости по методуКаплан-Майера групп пациентов с двумя вариантами генотипа.Сенько Олег Валентинович ()МОТП, лекция 1214 / 29В настоящее время существует целый ряд методов оценки влиянияпеременных X1 , . . . , Xn на форму кривой выживаемости. Одной изпопулярных моделей до сих пор является модель Кокса, основанная наконцепции мгновенного риска. Мгновенный риск λ(t) в момент tопределяется как пределlim =∆t→0f (t)P [T ≤ (t + ∆t)|T ≥ t]=,∆tS(t)где f (t) плотностью вероятности наступления критического события вточке t. То есть f (t) = dFdt(t) , где F (t) = 1 − S(t). Таким образомочевидна справедливость простого дифференциального уравненияλ(t)dt = −−dS(t).S(t)(2)Проинтегрировав левую и правую части уравнения (1) на отрезке [t0 , t]убеждаемся в справедливости равенствRtln[S(t)] = −Λ(t) или S(t) = exp[−Λ(t)] где Λ(t) = t0 λ(t).Сенько Олег Валентинович ()МОТП, лекция 1215 / 29В случае если форма кривой выживаемости зависит от переменныхX1 , .

. . , Xn , мгновенный риск также оказывается функциейпеременных X1 , . . . , Xn . В основе модели Кокса (моделипропорциональных рисков) лежит предположение о возможностипредставления мгновенного риска для произвольного объекта s∗ сописанием x∗ = (x∗1 , . . . , x∗n ) в виде произведенияλ(t|x∗ ) = λ0 (t) exp (β1 ∗ x∗1 + . . . + βn ∗ x∗n ),где λ0 (t) - базовая компонента, зависящаятолько от времени. ПустьRtS0 (t) = exp[−Λ0 (t)], где Λ0 (t) = t0 λ0 (t). В результате получаем∗∗S(t) = S0 (t)[exp (β1 ∗x1 +...+βn ∗xn )] .Для поиска вектора параметров (β1 , . . .

, βn ) используется методмаксимального правдоподобия.Сенько Олег Валентинович ()МОТП, лекция 1216 / 29Модель пропорциональных рисков КоксаПредположим, что для настройки модели пропорциональных рисковиспользуется обучающая выборкаSe = {s1 = (α1 , t1 , x1 ), . . . , sm = (αm , tm , xm )}. Предположим, чтокритическое событие для объекта si произошло в момент времени ti .Вероятность того, что среди всех объектов, для которых критическоесобытие до момента ti не наступало, это событие в момент tiпроизошло именно с si оценим с помощью отношенияλ0 (ti ) exp (β1 ∗ xi1 + . .

. + βn ∗ xin )λ(ti |xi )=P=tj >ti λ(ti |xj )tj >ti λ0 (ti ) exp (β1 ∗ xj1 + . . . + βn ∗ xjn )Pexp (β1 ∗ xi1 + . . . + βn ∗ xin )tj >ti exp (β1 ∗ xj1 + . . . + βn ∗ xjn )=PСенько Олег Валентинович ()МОТП, лекция 1217 / 29Функционал правдоподобия записывается в видеL(β1 , . . . , βn ) =mYexp (β1 ∗ xi1 + . . . + βn ∗ xin ).tj >ti exp (β1 ∗ xj1 + . .

. + βn ∗ xjn )Pi=1В модели используются значения (β1 , . . . , βn ), при которыхL(β1 , . . . , βn ) достигает максимума. Наряду со значением параметров(β1 , . . . , βn ) неизвестным параметром модели пропорциональныхрисков является форма базовой функции выживаемости S0 (t). Однимиз возможных способов восстановления S0 (t) является подход,основанный на аппроксимация отношенияS(ti |β1 , . .

. , βn , xi )S(ti−1 |β1 , . . . , βn , xi )величиной1− Pexp (β1 ∗ xi1 + . . . + βn ∗ xin )tj >ti exp (β1 ∗ xj1 + . . . + βn ∗ xjn )(3)для произвольной пары последовательных моментов времени (ti−1 , ti ),для которых имели место критические события.Сенько Олег Валентинович ()МОТП, лекция 1218 / 29При этом предполагается, что вектор параметров (β1 , . .

. , βn ) уже былранее найден с помощью описанного ранее варианта методамаксимального правдоподобия. Очевидно, что для вектора xi ,описывающего объект si из обучающей выборки, справедливоравенствоS(ti |β1 , . . . , βn , xi )S0 (ti ) exp(β1 ∗xi1 +...+βn ∗xin )=[].S(ti−1 |β1 , . . . , βn , xi )S0 (ti−1 )(4)0 (ti )Обозначим отношение SS0 (tчерез γi . Из равенств (2) и (3) следуетi−1 )справедливость равенстваexp (β1 ∗ xi1 + . . . + βn ∗ xin )−1][exp(β1 ∗xi1 +...+βn ∗xin )]tj >ti exp (β1 ∗ xj1 + . . . + βn ∗ xjn )γi = [1 − PОчевидно, величина γi может быть рассчитана для каждого объектаиз выборкиe.Сенько Олег Валентинович ()МОТП, лекция 1219 / 29Оценка базовой функции выживаемости на отрезке времени [ti , ti+1 ]может оцениваться в виде произведения коэффициентов γi поe для которых критическое событиевсевозможным объектам S,наступило до момента ti .

То естьYS0 (ti ) =γj .tj <tiСенько Олег Валентинович ()МОТП, лекция 1220 / 29Временные рядыПод временным рядом понимается множество значений некоторойпеременной Z, измеренных в моменты времени, разделённыеодинаковыми интервалами. . . , Z(ti−1 ), Z(ti ), Z(ti+1 ), . . .Временной ряд считается многомерным, если в каждый моментвремени измеряются значения нескольких переменных. Многомерныйряд, содержащий значения переменных Z1 , . .

. , Zk , может бытьпредставлен в виде набора последовательностей:. . . , Z1 (ti−1 ), Z1 (ti ), Z1 (ti+1 ), . . ....,...,...,...,...,.... . . , Zk (ti−1 ), Zk (ti ), Zk (ti+1 ), . . .Сенько Олег Валентинович ()МОТП, лекция 1221 / 29Временные рядыОсновной задачей анализа временных рядов является поискалгоритма, позволяющего предсказывать значения переменной Z илизначения переменных из некоторого подмножества Z1 , .

. . , Zk в ещё ненаступившие моменты времени. Дополнительными задачами анализвременных рядов является поиск существующих эмпирическихзакономерностей, включая поиск циклических изменений переменных.Прогнозирование временного ряда производится с помощьюалгоритма, обученного по доступному в результате наблюденийучастку временного ряда достаточной длины. Одним из способовпрогнозирования временных рядов является использованиеодномерной регрессионной функции f (t), зависящей от времени.

В техслучаях, когда прогностическая способность f (t) являетсястатистически достоверной, а функция f (t) является линейной,говорят о наличии во временном ряду линейного тренда. Для поискалинейного тренда может быть использован метод простой одномернойрегрессии с использованием в качестве прогнозирующей переменнойX время t.Сенько Олег Валентинович ()МОТП, лекция 1222 / 29Временные рядыЗначения переменной Z в различных точках временного ряда. . . , Z(ti−1 ), Z(ti ), Z(ti+1 ), . .

.могут рассматриваться как реализации случайных функций. . . , Z̆i−1 , Z̆i , Z̆i+1 , . . . .Процесс, отображаемый временным рядом, называется стационарным,если совместное распределение вероятности для произвольных rпоследовательно расположенных в ряду случайных величинZ̆i+1 , . . . , Z̆i+rСовпадает с совместным распределением r случайных величинZ̆i+1+l , . . . , Z̆i+r+l , . . .при некотором целом l.Сенько Олег Валентинович ()МОТП, лекция 1223 / 29Временные рядыОчевидно, что процесс является стационарным, если переменные. .

. , Z̆i−1 , Z̆i , Z̆i+1 , . . .являются независимыми и одинаково распределёнными.Предположим, что функция f (t) полностью характеризует процесс.Это означает, что Z(ti ) = f (ti ) − εi , где . . . , εi−1 , εi , εi+1 , . . . независимые и одинаково распределённые ошибки с нулевымматематическим ожиданием. Тогда случайный процесс, отображаемыйвременным рядо. . .

, [Z(ti−1 ) − f (ti−1 )], [Z(ti ) − f (ti )], [Z(ti+1 ) − f (ti+1 )], . . . ,оказывается стационарным.Сенько Олег Валентинович ()МОТП, лекция 1224 / 29Временные рядыДля прогнозирования временного ряда в произвольной точке ti нарядус методами, основанными на выделении тренда, используютсяметоды, основанные на поиске оптимального алгоритма A ,вычисляющего оценку Z(ti ) по набору предшествующих значений{Z(tj1 ), . . .

, Z(tjl )}, где (j1 , . . . , jl ) является набором целых чисел. Тоесть оценка Ẑ(ti ) вычисляется по формулеẐ(ti ) = A[Z(tj1 ), . . . , Z(tjl )].Простейшим примером такого рода прогнозирования является методскользящего среднего, вычисляющего оценку Ẑ(ti ) в видеl1XẐ(ti ) =Z(ti−j ).lj=1Сенько Олег Валентинович ()МОТП, лекция 1225 / 29Временные рядыИспользуется также метод взвешенного скользящего среднего,вычисляющего оценку Ẑ(ti ) в видеlẐ(ti ) =1Xcj Z(ti−j ),lj=1где (c1 , . . .

, cl ) являются неотрицательнымикоэффициентами,Pудолетворяющими условию lj=1 cj = 1.Нетрудно видеть, что прогностическая способность методаскользящего связана с относительным постоянство математическогоожидания случайных величин Z̆i−1 , . . . , Z̆i−l , . . .. Метод скользящегосреднего используется для “сглаживания” временных рядов,фильтрации высокочастотной шумовой составляющей.Сенько Олег Валентинович ()МОТП, лекция 1226 / 29Временные рядыВ общем случае для обучения алгоритма A могут быть использованывсевозможные методы регрессионного анализа и распознавания, еслипрогнозируемая переменная Z является категориальной. Обучениеалгоритма A может производится по таблице, составленный изэлементов, принадлежащих известному участку временного ряда.Предположим, что в результате наблюдений стали известны значенияZ(t1 ), .

. . , Z(tN ). По данному ряду может быть построена таблицаZ(tN ), Z(tN −1 ), . . . , Z(tN −l ),Z(tN −1 ), Z(tN −2 ), . . . , Z(tN −l−1 ),...,...,...,...,...,...,Z(tN −l ), Z(tN −l−1 ), . . . , Z(tN −2l ).Сенько Олег Валентинович ()МОТП, лекция 1227 / 29Временные рядыПри этом первый слева элемент в каждой строке рассматривается вкачестве прогнозируемой величины Y . Далее последовательно слеванаправо значения переменной Z в строке рассматриваются в качествезначений прогнозирующих переменных X1 , .

. . , Xl . В случаемногомерных временных рядов при прогнозировании некоторойпеременной Zj могут быть использованы значения и другихпеременных из набора Z1 , . . . , Zk . .Сенько Олег Валентинович ()МОТП, лекция 1228 / 29Временные рядыДля поиска циклических (сезонных) колебаний переменной Z могутбыть использованы методы корреляционного анализа. Для каждойпредполагаемой длины цикла l строится таблица, состоящая из двухстолбцов:Z(tN ), Z(tN −l ),Z(tN −1 ), Z(tN −l−1 ),...,...,...Z(tl+1 ), Z(t1 ).Вычисляется коэффициента корреляции между столбцами.

Реальносуществующему циклу длины l∗ соответствует максимальная величинакоэффициента корреляции для таблицы, построенной по сдвигу l∗ , поотношению к коэффициентам корреляции для таблиц, построеннымисходя из других величин сдвига.Сенько Олег Валентинович ()МОТП, лекция 1229 / 292Кластерный анализЦелью методов кластерного анализа является разбиение выборок многомерных данных нагруппы объектов близких в смысле некоторой заданной меры сходства. Такие компактныегруппы называются кластерами, классами или таксонами.Методыкластерногоанализаназываюттакжеметодамиобучениябезучителя,автоматической группировки или таксономии.Методыкластерногоанализамогутиспользоватьсявкачествавспомогательныхинструментов при решении задач прогнозирования или распознавания.

Однако нередкокластеризация может иметь самостоятельное значение.2Кластерный анализБольшинство известных алгоритмов кластеризации предполагает задание расстояния (x, y) между произвольными векторами-описаниямиобъектов. В качестве расстояния могут выступать, например, евклидова метрика: (x, y ) n2(xy) i ii 1Используются и другие функции расстояния.2Кластерный анализОдним из наиболее известных методов кластеризации является алгоритмk внутригрупповыхсредних.

Предположим, что у нас задана выборка векторов- описаний S  {x1 ,, xm}. Алгоритмнаходит такие кластеры, для объектов которых центр «своего кластера» будет ближе центра любого«чужого кластера».Метод предполагает, что число кластеров изначально задано.2Кластерный анализПоиск оптимальной кластеризации методом квнутригрупповых среднихПредположим, что предполагаемое число кластеров равно r.Зададим произвольным образом исходное разбиение выборкиS  {x1, , xm}на группыG10 , , Gr0Вычисляем геометрические центры исходных группПусть группаGi0состоит из объектовm(i )01{x , , x0m(i )}.Тогда центр0iGxi0  m1(i )  x0jвычисляется по формулеВычисляются расстояния между объектами изSи центрамиj 1x10 , , xr02Кластерный анализПоиск оптимальной кластеризации методом kвнутригрупповых среднихОбъекты изS затем переносятсяполучаем новый набор группв группу с наименее удалённым центром. В результате мыG11 , , Gr1 .Повторяем для набора группG11 , , Gr1 те же00G,,Gсамые операции, которые ранее выполнялись для групп 1r………………………………………………………………………………………………………………………………………………………………Процесс завершается на некотором шаге k+1, когда переносы объектов изSв другиегруппы не требуются.То есть каждый объект наименее удалён от центра той же самой группы, которой он ипринадлежит.

Характеристики

Тип файла

PDF-файл

Размер

7,89 Mb

Материал

2015 Лекции (Сенько)

Тип материала

Лекции

Предмет

(ММО) Методы машинного обучения

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов лекций

2015-lekcii-senko.rar

2015 Лекции (Сенько)

ROC-анализ. Цифровые методы диагностики и прогнозирования систем.docx

_ Доп. материалы по лекциям (Сенько).7z

Лекции. ММО. Сенько (all in one).pdf

Лекция 1. Задачи прогнозирования_ обобщающая способность_ байесовский классификатор_ скользящий контроль.pdf

Лекция 3. Линейн. регресс. Метод наименьших квадратов_ макс правдоподобия_ Одномерн модель_ ...pdf

Лекция 4. Задачи прогнозирования_ Линейная машина_ Теоретические методы оценки обобщающей способности.pdf

Лекция 5. Принцип частичной прецедентности_ тестовый алгоритм_ модель ABO.pdf

Лекция 6. Нейросетевые методы. перцептрон Розенблатта_ многослойный перцептрон.pdf

Лекция 7. Ядерные методы. Метод опорных векторов.pdf

Лекция 8. Решающие деревья. Сенько.pdf

Лекция 9.0. Коллективные решения. Ансамбли.pdf

Лекция 9.1. Структура ошибки выпуклых комбинаций_ комитетные методы_ логическая коррекция.pdf

Лекция 10. Коллективные методы_ бэггинг_ бустинг_ голосование по сист. закономерностей.pdf

Лекция 11. Байесовские сети (skipped)_ анализ выживаемости.pdf

Лекция 12. Кластерный анализ.pdf

Модели распознавания_ основанные на различных способах обучения. Часть 2.docx

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.