2010 Лекции МОТП (Ветров) (2010 Лекции МОТП (Ветров).pdf)
Описание файла
PDF-файл из архива "2010 Лекции МОТП (Ветров).pdf", который расположен в категории "". Всё это находится в предмете "(ммо) методы машинного обучения" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Лекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЛекция 1. Различные задачи машинногообученияОсновныепроблемымашинногообученияНапоминаниеД. П. Ветров11МГУ, ВМиК, каф. ММПКурс «Математические основы теориипрогнозирования»План лекцииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияОсновныепроблемымашинногообученияНапоминание1 Некоторые задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 НапоминаниеПолезные сведения из линейной алгебры и теории оптимизОсновные понятия мат.
статистикиКонцепция машинного обученияЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание• Решение задач путем обработки прошлого опыта(case-based reasoning)• Альтернатива построению математических моделей(model-based reasoning)• Основное требование – наличие обучающейинформации• Как правило в качестве таковой выступает выборкапрецедентов – ситуационных примеров из прошлого сизвестным исходом• Требуется построить алгоритм, который позволял быобобщить опыт прошлых наблюдений/ситуаций дляобработки новых, не встречавшихся ранее случаев,исход которых неизвестен.План лекцииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание1 Некоторые задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 НапоминаниеПолезные сведения из линейной алгебры и теории оптимизОсновные понятия мат.
статистикиКлассификацияЛекция 1.РазличныезадачимашинногообученияЖуравлев,Ветров• Исторически возникла из задачи машинного зрения,поэтому часто употребляемый синоним –распознавание образов• В классической задаче классификации обучающаяНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминаниевыборка представляет собой набор отдельных объектовX = {xi }ni=1 , характеризующихся векторомвещественнозначных признаков xi = (xi,1 , . .
. , xi,d )• В качестве исхода объекта x фигурирует переменная t,принимающая конечное число значений, обычно измножества T = {1, . . . , l}• Требуется постросить алгоритм (классификатор),который по вектору признаков x вернул бы меткукласса t̂ или вектор оценок принадлежности(апотериорных вероятностей) к каждому из классов{p(s|x)}ls=1КлассификацияЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминаниеПримеры задач классификацииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание• Медицинская диагностика: по набору медицинскиххарактеристик требуется поставить диагноз• Геологоразведка: по данным зондирования почвопределить наличие полезных ископаемых• Оптическое распознавание текстов: поотсканированному изображению текста определитьцепочку символов, его формирующих• Кредитный скоринг: по анкете заемщика принятьрешение о выдаче/отказе кредита• Синтез химических соединений: по параметрамхимических элементов спрогнозировать свойстваполучаемого соединенияПлан лекцииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание1 Некоторые задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 НапоминаниеПолезные сведения из линейной алгебры и теории оптимизОсновные понятия мат.
статистикиРегрессияЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание• Исторически возникла при исследовании влиянияодной группы непрерывных случайных величин надругую группу непрерывных случайных величин• В классической задаче восстановления регрессииобучающая выборка представляет собой наборотдельных объектов X = {xi }ni=1 , характеризующихсявектором вещественнозначных признаковxi = (xi,1 , .
. . , xi,d )• В качестве исхода объекта x фигурирует непрерывнаявещественнозначная переменная t• Требуется постросить алгоритм (регрессор), которыйпо вектору признаков x вернул бы точечную оценкузначения регрессии t̂, доверительный интервал (t− , t+ )или апостериорное распределение на множествезначений регрессионной переменной p(t|x)РегрессияЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминаниеПримеры задач восстановления регрессииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание• Оценка стоимости недвижимости: по характеристикерайона, экологической обстановке, транспортнойсвязности оценить стоимость жилья• Прогноз свойств соединений: по параметрамхимических элементов спрогнозировать температуруплавления, электропроводность, теплоемкостьполучаемого соединения• Медицина: по постоперационным показателям оценитьвремя заживления органа• Кредитный скоринг: по анкете заемщика оценитьвеличину кредитного лимита• Инженерное дело: по техническим характеристикамавтомобиля и режиму езды спрогнозировать расходтопливаПлан лекцииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание1 Некоторые задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 НапоминаниеПолезные сведения из линейной алгебры и теории оптимизОсновные понятия мат.
статистикиКластеризацияЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание• Исторически возникла из задачи группировки схожихобъектов в единую структуру (кластер) споследующим выявлением общих черт• В классической задаче кластеризации обучающаявыборка представляет собой набор отдельных объектовX = {xi }ni=1 , характеризующихся векторомвещественнозначных признаков xi = (xi,1 , . .
. , xi,d )• Требуется постросить алгоритм (кластеризатор),который разбил бы выборкуS на непересекающиесягруппы (кластеры) X = kj=1 Ck , Cj ⊂ {x1 , . . . , xm },Ci ∩ Cj = ∅• В каждый класс должны попасть объекты в некоторомсмысле похожие друг на другаКластеризацияЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминаниеПримеры задач кластерного анализаЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание• Экономическая география: по физико-географическими экономическим показателям разбить страны мира нагруппы схожих по экономическому положениюгосударств• Финансовая сфера: по сводкам банковских операцийвыявить группы «подозрительных», нетипичныхбанков, сгуппировать остальные по степени близостипроводимой стратегии• Маркетинг: по результатам маркетинговыхисследований среди множества потребителей выделитьхарактерные группы по степени интереса кпродвигаемому продукту• Социология: по результатам социологических опросоввыявить группы общественных проблем, вызывающихсхожую реакцию у общества, а также характерныефокус-группы населенияПлан лекцииЛекция 1.РазличныезадачимашинногообученияЖуравлев,ВетровНекоторыезадачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадача прогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияНапоминание1 Некоторые задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 НапоминаниеПолезные сведения из линейной алгебры и теории оптимизОсновные понятия мат.