Лекция 10 (2012 Лекции МОТП (Сенько)), страница 2
Описание файла
Файл "Лекция 10" внутри архива находится в папке "2012 Лекции МОТП (Сенько)". PDF-файл из архива "2012 Лекции МОТП (Сенько)", который расположен в категории "". Всё это находится в предмете "(ммо) методы машинного обучения" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Примеры разбиений для каждого из семействприведены на рисунке.Семейство I включает всевозможные разбиения интерваловдопустимых значений отдельных признаков на два интервала спомощью одной граничной точки.Метод статистически взвешенныхсиндромов (СВС)Метод статистически взвешенныхсиндромов (СВС)Семейство II включает всевозможные разбиения интерваловдопустимых значений отдельных признаков на 3 интервала спомощью двух граничных точек.Семейство III включает всевозможные разбиения совместныхдвумерных областей допустимых значений пар признаков на 4подобласти с помощью двух граничных точек ( по одной точкедля каждого из двух признаков)Метод статистически взвешенныхсиндромов (СВС)Семейство IV включает всевозможные разбиения совместныхдвумерных областей допустимых значений пар признаков на 2подобласти с помощью прямой граничной линии, произвольноориентированной относительно координатных осей.Найденные оптимальные разбиения используются для построениясистем синдромов, если соответствующая им максимальнаявеличина функционала качества превосходит некотороезаранее заданное пользователем пороговое значение .Метод статистически взвешенныхсиндромов (СВС)Причём величина порога зависит от сложности модели разбиений.Порог является минимальным для простейшей одномерноймодели I.
Для моделей II-IV величина порога домножается навеличину , задаваемую пользователем, что позволяетрегулировать влияние эффекта переобучения.Одномерные разбиения, найденные внутри семейств I и II могутбыть используются при построении не только одномерных, нотакже и двумерных синдромов.Метод статистически взвешенныхсиндромов (СВС)Предположим, что на этапе обучения для класса K j найдена*xсистема синдромов Q j . Предположим, что описание*sраспознаваемого объектапринадлежит синдромам q1,, qrиз системы Q j . Оценка за класс K j вычисляется по формулеr j ( s* ) ,jw iii 1rwi 1j, где i - доля класса K j в синдроме qiiwi - вес синдрома.Метод статистически взвешенныхсиндромов (СВС)Вес синдрома вычисляется по формулеmi1wi , где mi - число объектовjjmi 1 i (1 i )обучающей выборки с описанием, принадлежащемqi .Метод комитетовМетод комитетов представляет собой реализацию подхода крешению задач распознавания, объединяющего принципылинейного разделения классов и вычисления коллективныхрешений.Рассмотрим задачу распознавания с двумя классами K1и K 2.
Пусть f1 (x),, f r (x) - набор линейных функций видаfi (x) a1i x1 где x ( x1,признаков, ani xn a0i ,(a0i , a1i ,, xn ) - вектор, ani ) - вектор вещественных параметров..Метод комитетовПредположим, что для классификации произвольного объекта s*с описанием x* используется следующее решающее правило:r;sign[f(x)]0iобъект s относится в класс K , если1*i 1,объект s* относится в класс K 2, еслиr sign[ f (x)] 0 ;i 1rв случае, еслиi sign[ f (x)] 0 происходит отказ отi 1распознавания.i(1)Метод комитетовНабор функций f1 (x),, f r (x)называется комитетом, еслирешающее правило (1) правильно классифицирует объектыобучающей выборки.Распознающий алгоритм, основанный, на решающем правиле (1)потенциально позволяет производить распознавание линейнонеразделимых классов, реализуя кусочно-линейную разделяющую поверхность. Обучение сводится к поиску оптимальных(минимальных по числу функций) комитетов.
Теоретическипоказано существование комитета для непротиворечивыхданных..