Главная » Просмотр файлов » 1 Различные задачи машинного обучения

1 Различные задачи машинного обучения (1162169), страница 2

Файл №1162169 1 Различные задачи машинного обучения (Д.П. Веторв, Ю.И. Журавлёв - Лекции) 2 страница1 Различные задачи машинного обучения (1162169) страница 22019-09-19СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 2)

статистикиИдентификацияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Исторически возникла из классификации,необходимости отделить объекты, обладающиеопределенным свойством, от «всего остального»• В классической задаче идентификации обучающаявыборка представляет собой набор отдельных объектовX = {xi }ni=1 , характеризующихся векторомвещественнозначных признаков xi = (xi,1 , .

. . , xi,d ),обладающих некоторым свойством χA (x) = 1• Особенностью задачи является то, что все объектыпринадлежат одному классу, причем не существуетвозможности сделать репрезентативную выборку изкласса «все остальное»• Требуется постросить алгоритм (идентификатор),который по вектору признаков x определил бы наличиесвойства A у объекта x, либо вернул оценку степени еговыраженности p(χA (x) = 1|x)ИдентификацияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбезПримеры задач идентификацииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Медицинская диагностика: по набору медицинскиххарактеристик требуется установитьналичие/отсутствие конкретного заболевания• Системы безопасности: по камерам наблюдения вподъезде идентифицировать жильца дома• Банковское дело: определить подлинность подписи начеке• Обработка изображений: выделить участки сизображениями лиц на фотографии• Искусствоведение: по характеристикам произведения(картины, музыки, текста) определить, является ли егоавтором тот или иной авторПлан лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.

статистикиПрогнозированиеЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Исторически возникла при исследовании временныхрядов и попытке предсказания их значений черезкакой-то промежуток времени• В классической задаче прогнозирования обучающаявыборка представляет собой набор измеренийX = {x[i]}ni=1 , представляющих собой векторвещественнозначных величин x[i] = (x1 [i], .

. . , xd [i]),сделанных в определенные моменты времени• Требуется постросить алгоритм (предиктор), которыйвернул бы точечную оценку {x̂[i]}n+qi=n+1 , доверительныйинтервал {(x− [i], x+ [i])}n+qилиапостериорноеi=n+1распределение p(x[n + 1], . . . , x[n + q]|x[1], . . . , x[n])прогноза на заданную глубину q• В отличие от задачи восстановления регрессии, здесьосуществляется прогноз по времени, а не по признакамПрогнозированиеЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбезпрошлоенастоящеебудущееПримеры задач прогнозированияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Биржевое дело: прогнозирование биржевых индексов икотировок• Экономика: прогноз цен на недвижимость• Демография: прогноз изменения численностиразличных социальных групп в конкретном ареале• Гидрометеорология: прогноз геомагнитной активностиПлан лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.

статистикиИзвлечение знанийЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Исторически возникла при исследованиивзаимозависимостей между косвенными показателямиодного и того же явления• В классической задаче извлечения знаний обучающаявыборка представляет собой набор отдельных объектовX = {xi }ni=1 , характеризующихся векторомвещественнозначных признаков xi = (xi,1 , . . . , xi,d )• Требуется постросить алгоритм, генерирующий наборобъективных закономерностей между признаками,имеющих место в генеральной совокупности• Закономерности обычно имеют форму предикатов«ЕСЛИ ...

ТО ...» и могут выражаться как в цифровыхтерминах ((0.45 ≤ x4 ≤ 32.1)&(−6.98 ≤ x 7 ≤ −6.59) ⇒(3.21 ≤ x2 ≤ 3.345)), так и в текстовых («ЕСЛИДавление – низкое И (Реакция – слабая ИЛИ Реакция– отсутствует) ТО Пульс – нитевидный»)Извлечение знанийЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбезПримеры задач извлечения знанийЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Медицина: поиск взаимосвязей (синдромов) междуразличными показателями при фиксированной болезни• Социология: определение факторов, влияющих напобеду на выборах• Генная инженерия: выявление связанных участковгенома• Научные исследования: получение новых знаний обисследуемом процессе• Биржевое дело: определение закономерностей междуразличными биржевыми показателямиПлан лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.

статистикиОбъем выборки IЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Основным объектом работы любого метода машинногообучения служит обучающая выборка• Большой объем выборки позволяет• Получить более надежные результаты• Использовать более сложные модели алгоритмов• Оценить точность обучения• НО: Время обучения быстро растет• При малых выборках• Можно использовать только простые моделиалгоритмов• Скорость обучения максимальна – можно использоватьметоды, требующие много времени на обучение• Высока вероятность переобучения при ошибке ввыборе моделиОбъем выборки IIЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Одна и та же выборка может являться большой дляпростых моделей алгоритмов и малой для сложныхмоделей.• Для методов с т.н.

бесконечной емкостьюВапника-Червоненкиса любая выборка является малой.• С ростом числа признаков увеличивается количествообъектов, необходимое для корректного анализаданных• Часто рассматривается т.н. эффективная размерностьвыборкиnd• При объемах данных порядка десятков и сотен тысячвстает проблема уменьшения выборки с сохранением еерепрезентативности (active learning)План лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.

статистикиНеполнота признакового описанияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Отдельные признаки могут отсутствовать у некоторыхобъектов. Это может быть связано с отсутствиемданных об измерении данного признака для данногообъекта, а может быть связано с принципиальнымотсутствием данного свойства у данного объекта• Такое часто встречается в медицинских и химическихданных• Необходимы специальные процедуры, позволяющиекорректно обрабатывать пропуски в данных• Одним из возможных способов такой обработкиявляется замена пропусков на среднее по выборкезначение данного признака• По возможности, пропуски следует игнорировать иисключать из рассмотрения при анализесоответствующего объектаПротиворечивость данныхЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Объекты с одним и тем же признаковым описаниеммогут иметь разные исходы (принадлежать к разнымклассам, иметь отличные значения регрессионнойпеременной и т.п.)• Многие методы машинного обучения не могутработать с такими наборами данных• Необходимо заранее исключать или корректироватьпротиворечащие объекты• Использование вероятностных методов обученияпозволяет корректно обрабатывать противоречивыеданные• При таком подходе предполагается, что исход t длякаждого признакового описания x есть случайнаявеличина, имеющая некоторое условное распределениеp(t|x)Разнородность признаковЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Хотя формально предполагается, что признакиявляются вещественнозначными, они могут бытьдискретными и номинальными• Номинальные признаки отличаются особенностямиметрики между значениями• Стандартная практика состоит в замене номинальныхпризнаков на набор бинарных переменных по числузначений номинального признака• Текстовые признаки, признаки-изображения, даты ипр.

Характеристики

Тип файла
PDF-файл
Размер
229,13 Kb
Тип материала
Высшее учебное заведение

Список файлов лекций

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6510
Авторов
на СтудИзбе
302
Средний доход
с одного платного файла
Обучение Подробнее