1 Различные задачи машинного обучения (1162169), страница 2
Текст из файла (страница 2)
статистикиИдентификацияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Исторически возникла из классификации,необходимости отделить объекты, обладающиеопределенным свойством, от «всего остального»• В классической задаче идентификации обучающаявыборка представляет собой набор отдельных объектовX = {xi }ni=1 , характеризующихся векторомвещественнозначных признаков xi = (xi,1 , .
. . , xi,d ),обладающих некоторым свойством χA (x) = 1• Особенностью задачи является то, что все объектыпринадлежат одному классу, причем не существуетвозможности сделать репрезентативную выборку изкласса «все остальное»• Требуется постросить алгоритм (идентификатор),который по вектору признаков x определил бы наличиесвойства A у объекта x, либо вернул оценку степени еговыраженности p(χA (x) = 1|x)ИдентификацияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбезПримеры задач идентификацииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Медицинская диагностика: по набору медицинскиххарактеристик требуется установитьналичие/отсутствие конкретного заболевания• Системы безопасности: по камерам наблюдения вподъезде идентифицировать жильца дома• Банковское дело: определить подлинность подписи начеке• Обработка изображений: выделить участки сизображениями лиц на фотографии• Искусствоведение: по характеристикам произведения(картины, музыки, текста) определить, является ли егоавтором тот или иной авторПлан лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.
статистикиПрогнозированиеЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Исторически возникла при исследовании временныхрядов и попытке предсказания их значений черезкакой-то промежуток времени• В классической задаче прогнозирования обучающаявыборка представляет собой набор измеренийX = {x[i]}ni=1 , представляющих собой векторвещественнозначных величин x[i] = (x1 [i], .
. . , xd [i]),сделанных в определенные моменты времени• Требуется постросить алгоритм (предиктор), которыйвернул бы точечную оценку {x̂[i]}n+qi=n+1 , доверительныйинтервал {(x− [i], x+ [i])}n+qилиапостериорноеi=n+1распределение p(x[n + 1], . . . , x[n + q]|x[1], . . . , x[n])прогноза на заданную глубину q• В отличие от задачи восстановления регрессии, здесьосуществляется прогноз по времени, а не по признакамПрогнозированиеЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбезпрошлоенастоящеебудущееПримеры задач прогнозированияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Биржевое дело: прогнозирование биржевых индексов икотировок• Экономика: прогноз цен на недвижимость• Демография: прогноз изменения численностиразличных социальных групп в конкретном ареале• Гидрометеорология: прогноз геомагнитной активностиПлан лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.
статистикиИзвлечение знанийЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Исторически возникла при исследованиивзаимозависимостей между косвенными показателямиодного и того же явления• В классической задаче извлечения знаний обучающаявыборка представляет собой набор отдельных объектовX = {xi }ni=1 , характеризующихся векторомвещественнозначных признаков xi = (xi,1 , . . . , xi,d )• Требуется постросить алгоритм, генерирующий наборобъективных закономерностей между признаками,имеющих место в генеральной совокупности• Закономерности обычно имеют форму предикатов«ЕСЛИ ...
ТО ...» и могут выражаться как в цифровыхтерминах ((0.45 ≤ x4 ≤ 32.1)&(−6.98 ≤ x 7 ≤ −6.59) ⇒(3.21 ≤ x2 ≤ 3.345)), так и в текстовых («ЕСЛИДавление – низкое И (Реакция – слабая ИЛИ Реакция– отсутствует) ТО Пульс – нитевидный»)Извлечение знанийЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбезПримеры задач извлечения знанийЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияЗадачаклассификацииЗадачавосстановлениярегрессииЗадачакластеризации(обучения безучителя)ЗадачаидентификацииЗадачапрогнозированияЗадачаизвлечениязнанийОсновныепроблемымашинногообученияЛикбез• Медицина: поиск взаимосвязей (синдромов) междуразличными показателями при фиксированной болезни• Социология: определение факторов, влияющих напобеду на выборах• Генная инженерия: выявление связанных участковгенома• Научные исследования: получение новых знаний обисследуемом процессе• Биржевое дело: определение закономерностей междуразличными биржевыми показателямиПлан лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.
статистикиОбъем выборки IЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Основным объектом работы любого метода машинногообучения служит обучающая выборка• Большой объем выборки позволяет• Получить более надежные результаты• Использовать более сложные модели алгоритмов• Оценить точность обучения• НО: Время обучения быстро растет• При малых выборках• Можно использовать только простые моделиалгоритмов• Скорость обучения максимальна – можно использоватьметоды, требующие много времени на обучение• Высока вероятность переобучения при ошибке ввыборе моделиОбъем выборки IIЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Одна и та же выборка может являться большой дляпростых моделей алгоритмов и малой для сложныхмоделей.• Для методов с т.н.
бесконечной емкостьюВапника-Червоненкиса любая выборка является малой.• С ростом числа признаков увеличивается количествообъектов, необходимое для корректного анализаданных• Часто рассматривается т.н. эффективная размерностьвыборкиnd• При объемах данных порядка десятков и сотен тысячвстает проблема уменьшения выборки с сохранением еерепрезентативности (active learning)План лекцииЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез1 Основные задачи машинного обученияЗадачаЗадачаЗадачаЗадачаЗадачаЗадачаклассификациивосстановления регрессиикластеризации (обучения без учителя)идентификациипрогнозированияизвлечения знаний2 Основные проблемы машинного обученияМалый объем обучающей выборкиНекорректность входных данныхПереобучение3 ЛикбезОсновные понятия мат.
статистикиНеполнота признакового описанияЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Отдельные признаки могут отсутствовать у некоторыхобъектов. Это может быть связано с отсутствиемданных об измерении данного признака для данногообъекта, а может быть связано с принципиальнымотсутствием данного свойства у данного объекта• Такое часто встречается в медицинских и химическихданных• Необходимы специальные процедуры, позволяющиекорректно обрабатывать пропуски в данных• Одним из возможных способов такой обработкиявляется замена пропусков на среднее по выборкезначение данного признака• По возможности, пропуски следует игнорировать иисключать из рассмотрения при анализесоответствующего объектаПротиворечивость данныхЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Объекты с одним и тем же признаковым описаниеммогут иметь разные исходы (принадлежать к разнымклассам, иметь отличные значения регрессионнойпеременной и т.п.)• Многие методы машинного обучения не могутработать с такими наборами данных• Необходимо заранее исключать или корректироватьпротиворечащие объекты• Использование вероятностных методов обученияпозволяет корректно обрабатывать противоречивыеданные• При таком подходе предполагается, что исход t длякаждого признакового описания x есть случайнаявеличина, имеющая некоторое условное распределениеp(t|x)Разнородность признаковЛекция 1.РазличныезадачимашинногообученияВетров,КропотовОсновные задачимашинногообученияОсновныепроблемымашинногообученияМалый объемобучающейвыборкиНекорректностьвходных данныхПереобучениеЛикбез• Хотя формально предполагается, что признакиявляются вещественнозначными, они могут бытьдискретными и номинальными• Номинальные признаки отличаются особенностямиметрики между значениями• Стандартная практика состоит в замене номинальныхпризнаков на набор бинарных переменных по числузначений номинального признака• Текстовые признаки, признаки-изображения, даты ипр.