Лекция 4 (1185269), страница 2
Текст из файла (страница 2)
Для оптимизации потерь необходимо использованиеметодов распознавания с учётом предпочтительной точностираспознавания для некоторых классов.Распознавание при заданной точностираспознавания некоторых классовОдним из возможных подходов является фиксированиепорога для точности распознавания одного из классов.Оптимальное решающее правило в задаче распознаванияс двумя классами K1 и K 2 , обеспечивающеемаксимальную точность распознавания K 2 прификсированной точности распознавания K1 ,описывается критерием Неймана-Пирсона.Распознавание при заданной точности длянекоторых классовКритерий Неймана-ПирсонаМаксимальная точность распознавания K 2 при точностираспознавания K1 равной обеспечиваетсяправилом: Объект с описанием x относится в классеслиP( K1 | x) P( K2 | x) , где параметр определяется из условия {x | P( K1 | x) P( K2 | x)}P( K1 | x) f (x)dx , аf (x) - плотность распределенияK 2 K1 в точке xK1 ,Распознавание при заданной точности дляотдельных классовКритерий Неймана-Пирсона может быть использован, еслиизвестны плотности распределения распознаваемыхклассов.
Плотности могут быть восстановлены в рамкахБайесовских методов обучения на основе гипотез о видераспределений.Однако существуют эффективные средства регулированияточности распознавания при предпочтительности одногоиз классов, которые не требуют гипотез о видераспределения.Распознавание при заданнойточности для отдельных классовДанные средства основаны на структуре распознающегоалгоритма.Каждый алгоритма распознавания классовK1,, K L может быть представлен как последовательноевыполнение распознающего оператораправилаC:R и решающегоA R CОператор оценок вычисляет для распознаваемого объектавещественные оценки за классы{ (s)1,, ( s) L }K1,, KL :sРаспознавание при заданнойточности для отдельных классовC производит отнесение объекта s повектору оценок { 1 ( s), , L ( s)} к одному из классов.Решающее правилоРаспространённым решающим правилом является простаяпроцедура, относящая объект в тот класс, оценка за которыймаксимальна.В случае распознавания двух классовраспознаваемый объект 1 ( s) 2 ( s) 0K1 и K 2s* будет отнесён к классу K1 , еслии классуK 2 в противном случае.Распознавание при заданнойточности для отдельных классовНазовём приведённое выше правило правилом C (0) .
Однакоточность распознавания правила C (0) может оказатьсяслишком низкой для того, чтобы обеспечить требуемуювеличину потерь, связанных с неправильнойклассификацией объектов, на самом деле принадлежащихклассуK1 . Для достижения необходимой величины потерьможет быть использовано пороговое решающее правилоC ( )ROC анализC ( ): распознаваемый объект s* будет отнесён к классу K1 ,если 1 ( s) 2 ( s) и классуK 2 в противном случае.Обозначим через pci ( , s* ) вероятность правильнойклассификации правилом C ( ) объекта s* , на самомделе принадлежащегоK i , i {1,2} ,При 0 pc1 ( , s* ) pc1 (0, s* ) , ноpc 2 ( , s* ) pc 2 (0, s* )Уменьшая , мы увеличиваем pc1 ( , s* ) и уменьшаемpc 2 ( , s* ).
Напротив, увеличивая , мы уменьшаемpc1 ( , s* ) и увеличиваем pc 2 ( , s* ) .ROC анализЗависимость между pc 2 ( , s* ) и pc1 ( , s* ) может бытьприближённо восстановлена по обучающей выборке Stвключающей описания объектов {s1,, sm}Пусть 1 ( s1 ) 1 ( sm ) - матрица оценок за классы 2 ( s1 ) 2 ( sm ) объектов St ,[ (s1 ) 1 (s1 ) 2 (s1 ),, (sm ) 1 ( sm ) 2 ( sm )],ROC анализПредположим, что величины [ ( s1 ),значений (1,, (sm )] принимают r, r ). Рассмотрим r пороговыхрешающих правил [C (1 ),, C (r )] Для каждого изправил C (i ) вычислим c1 (i ) - долюK1 средиобъектов обучающей выборки, удовлетворяющихусловию ( s* ) i , и c 2 (i ) - долюK 2 средиобъектов обучающей выборки, удовлетворяющихусловию ( s* ) i .
Отобразим результаты расчётов{[ c1 (1 ), c 2 (1 )],,[ c1 (r ), c 2 (r )]} как точки на вдекартовой системе координат.ROC анализСоединив точки отрезками прямых, получим ломаную линию (I),соединяющую точки (1,0) и (0,1). Данная линия графическиотображает аппроксимацию по обучающей выборкевзаимозависимости между pc1 ( , s* ) и pc 2 ( , s* ) привсевозможных значениях . Соответствующий примерпредставлен на рисунке 2. Взаимозависимость между c1и c2наиболее полно оценивает эффективностьраспознающего оператора R. Отметим, что c 2 постепенноубывает по мере роста c1 ..ROC анализРис.
2ROC анализОднако сохранение высокого значениязначениях c1при высоких c2соответствует существованию решающегоправила, при котором точность распознавания обоих классоввысока. Таким образомоператорусоответствуетэффективному распознающемублизостьсвязывающей точки (0,1) и (1,1).линииIкпрямой,То есть наиболее высокойэффективности соответствует максимально большая площадьпод линиейI .Отсутствиюраспознающей способностисоответствует близость к прямой II, связывающей точки (0, 1) и(1,0)ROC анализРис.
3ROC анализ• На рисунке 3 сравниваются линии, характеризующиеэффективность распознающих операторов, принадлежащих ктрём методам распознавания, при решении задачираспознавания двух видов аутизма по психометрическимпоказателям .•Линейный дискриминант Фишера;•Метод опорных векторов•Статистически взвешенные синдромыROC анализМетоды распознавания используются при решении многих задачидентификации объектов, представляющих важность дляпользователя. Эффективность идентификации для таких задачудобно описывать в терминах:«Чувствительность» - доля правильно распознанных объектовцелевого класса«Ложная тревога» - доля объектов нецелевого класса ошибочноотнесённых в целевой класс.Пример кривой, связывающей параметры «Чувствительность» и«Ложная тревога» представлен на рисунке 4.ROC анализРис.
4ROC анализАнализ, основанный на построении ианализе линий, связывающих параметры«Чувствительность» и «Ложная тревога»принято называть анализом ReceiverOperating Characteristic или ROC-анализом.Линии, связывающих параметры«Чувствительность» и «Ложная тревога»принято называть ROC-кривыми..