Анисимов Б.В., Курганов В.Д., Злобин В.К. - Распознование и цифровая обработка изображений (1033973), страница 22
Текст из файла (страница 22)
(3.25) Аналогично находится Аа а1с при исключении Ьго признака из описания класса А,: (3.2г) да а; =-ал — а'. Описанная здесь методика оценки эффективности признаков справедлива для дихотомического разделения классов. На практике чаще встречается ситуация, когда требуется классифицировать число классов объектов т ) 2. 5 3,6. ОПРЕДЕЛЕНИЕ ОШИБКИ РАСПОЗНАВАНИЯ ОБЪЕКТОВ МЕТОДОМ ДИХОТОМИИ Предлагаемая в дальнейшем методика (см.
3 3.9) для оценки информативности признаков учитывает в первом приближении наличие статистических связей между ними (парных связей) и легко реализуется на практике. На вероятность правильного распознавания влияют, в частности, информативность признаков и соответствующий выбор классифицирующего правила. Рассмотрим влияние информативности признаков на правильность распознавания. Будем считать, что используются адекватные статистические решающие функции (бейесовская стратегия).
Таким образом, прн необходимости можно будет оценивать потенциальные возможности классификатора при определенном наборе признаков распознавания. Составление минимального описания классов объектов (минимального маршрута обследования признаков распознавания)— разработка методики выбора признаков — ведется таким образом, чтобы потенциальные возможности распознающего устройства не были ниже определенного уровня. Предположим, что имеется А; (1 = 1, т) классов объектов. Вероят. ность наблюдения объектов класса А; обозначим через р (А~).
Кроме того, имеется некоторая совокупность из и признаков (х„х„..., ха, ..., х„), характеризующая т классов. Признак ха может быть дискретной или непрерывной величиной. Следовательно, каждая реааизация объекта А; может быть представлена и-мерным вектором или точкой в и-мерном евклидовом пространстве признаков х (х„ха,..., хд,..., х„). Пусть р; = р (х /А;) — функция плотности вероятности вектора х при условии, что А = А ь Для минимизации вероятности ошибки распознавания можно восользоваться бейесовскими решающими функциями Н1]. В этом слуае неизвестный объект будет распознан как объект, принадлежащий к лассу А, если измеренный вектор х находится в области; векторов (рнс. 3.13), в которой выполняется условие р (А;)р; = шах (р( 1)р1 1~1; 1, 1 = 1,2, ..., т), или, другими словами, 0; =(х: р(А;) р; =шах!р (Аз) р11).
Ошибка распознавания при этом определяется как Рош =-~ ) Р (Л1)Р1аХ+ ) Р(Л~)р*аХ1, (3 23) с<1 (О,. 01 На рис. 3.13 представлена геометрическая интерпретация выражения (3.28), когда т= 2,((= 1< 1= 2), 6; = 6, и 61=- "'и одномерного вектора х. При дихотомии бейесовская решающая функция, определяемая Выражением (3.27), относит неиз' естный объект к классу А о если ~ Яо В этом случае область 61 является дополнением к области 6ь так что 6, + 61 =- 1. Область 5, можно определить как а 3~=(х: р(А,)р~) р(Л ) РА (3.29) ;для каждой пары объектов. Тогда Рис. 333. Геометрическая иитерпре"'.Вероятность ошибки классифика- такия ошибки распозиаваиия ции будет вычисляться так: Рош Н 1) = ) р (л1) р1 дх+ ( р (А~) рс Ах. На рис.
3.14 условно приводятся области интегрирования для выражения (3.28), когда т = 2 и т ) 2. Из него видно, что Рош=~ Г ) Р(А1)Р1<~х+ )Р(Л;)Рс«х1 ~(~~ Рош(С В= с<1 (а,. а 1;<; =~', ( ( р(А1) р1дх+ ) р(Л~) р;Ах1 (3.3о) 1 . т. е. вероятность ошибки при распознавании т классов с использоваэнием выражения (3.28) меньше или равна суммарной ошибке, состоя'",щей из ошибок распознавания всех парных комбинаций т классов объ,: ектов с использованием (3.29).
Это положение важное, поскольку по- зволяет заменить определение р, одновременно для т классов на' хождением р, (1, 1) для соответствующих пар классов. При этом лю' бое количество т классов может быть разделено парным сопоставле;,пнем всех объектов. Это существенно упрощает нахождение вероятно:сти ошибки распознавания, 1' 95 тшг т>г г Количество парных разделений при т классов может быть равно 0,5 т (т — 1).
РоГР()) / /, Соответствующим выбором — эо,'( признаков суммарную веро','э,о '1",,' ятносгь ошибки при 0,5 т )( х (т — 1) разделениях классов рис. 3.14. Области иитегрироваиия для бУДет обеспечивать ниже не' т 2 и т>2 (т 3) ' ' которого заданного порога П. При этом вероятность ошибки при распознавании т классов с использованием (3.28) не б дет больше порога П. ) не удет Если при разделении двух классов объектов )р(А() р( — р(А)) р))бх~ /7, з) з) (3.31) то р,ш (1, /) < (1 — П)/2 и знаки равенства и неравенства соответствуют друг дру~у. 2(еиствительно, из рис. 3.13 видно, что условие (3.31) можно записать непосредственно в виде 2 1 Р (А() Р(((Х вЂ” Рош (1, )) ~ )П 1=1 З( (3.32) а также что 1 р(А()р(((я+рот(1 1)=1 ° 1 З) (з.зз) Тогда подстановкой (3.33) в (3.32) получим 1 — 2 р, (1, /) ) П и окончательно р, (1, /) ( (1 — П)/2, или рош (0,6 ~ 1 — ~ )р (А() р — р(А7) р; ! ((х.
З(-)-З ° Таким образом, чтобы рош было ниже некоторого уровня Ар,, необходимо выбрать такой многомерный вектор х, при котором соот- ветствующая взвешенная разность между вероятностями р( и р) была бы по крайней мере равной (1 — 2 Ар ). Ви ош . идеальном случае)р (А()р, — р (А)) р)'1 = 1 и р, = О. Однако рассмотренный путь нахождения ошибки распознавания иа практике затруднителен из-за многомерности вектора х и сложности вычисления в этом случае функций р, и рр Поэтому ниже будет рас- смотрена методика, позволяющая связать вероятность распознавания рир = 1 — р, с информативностью признаков, которая на практике реализуется значительно проще, чем нахождение рир через плотности вероятностей векторов х, 90 й 3.7.
ЭФФЕКТИВНОСТЬ ПРИЗНАКОВ ПРИ РАСПОЗНАВАНИИ ТРЕХ (И БОЛЕЕ) КЛАССОВ ОБЪЕКТОВ При распознавании белее чем двух классов задача оценки эффективности признаков существенно усложняется из-за неодинаковой роли одних и тех же признаков.
Решение этой задачи должно носить компромиссный характер в силу необходимости удовлетворения противоречивых требований. Рассмотрим алфавит А, включающий в себя т классов объектов, ,' причем т) 2. В соответствии с (3.20) для каждой пары классов А( и , А) (1. 1 = 1, т; 1 ~ /) этого алфавита могут быть определены оценки полезности произвольного /2-го признака исходного описания е(/, (а) которые удобно записать в виде квадратной матрицы Еа 0 е()..... е)) 12 '' ' ш е( ) 0 ..... е( ) 21 2ш (3.34) е , е,„а ..... О (а) (Й) Матрица Еа симметричная, так как е((14) = е)1). Совокупность элементов 1-й строки (столбца) матрицы характеризует полезность /г-го : признака при парном различении 1-го класса и каждого из остальных ,' классов заданного алфавита.
Средняя же полезность й-го признака в '' 1-м классе представит собой величину а'О- — ~ е("). ! (3. Зб) т — ! /=1 Величины аа, так же как и величины е(1', могут принимать поло- (1) (а) жительные, нулевые и отрицательные значения. На основе величин ', аа введем неотрицательную характеристику а„— добротность (() /а-го признака в заданном алфавите 1 "' 1+Иди а1') аа — ~' аь ), т 2 (3.30) 1=1 обращающуюся в нуль только в случае, если во всех классах заданного алфавита средняя полезность й-го признака меньше или равна нулю. Если матрица Е„ является обобщенной характеристикой полезности произвольного й-го признака, то сумма матриц Еа по всем признакам исходного описания (/2 = 1, и) дает матрицу 0 ем ..
еи„ е21 0 ... еа, (з. з7) еш1 еша ... 0 представляющую собой обобщенную характеристику исходной системы признаков при различении всех классов заданного алфавита. Каждый 4 зак. 1Оаа 97 элемент матрицы Š— это сумма оценок полезности признаков при парном различении классов А; и А; (1,) 1,и; 1Ф 1): Я 1») е; ~~ ен »1 Совокупность элементов 1-й строки (столбца) матрицы Е характери.
зует полезность исходной системы признаков при различении 1-го класса и каждого из остальных классов заданного алфавита. Средняя полезность признака исходного описания в 1-м классе будет выражаться величиной 1 (3.39) 1=1 (3.38) Средняя добротность признака исходного описания в заданном алфавите классов вычиоляется по аналогии с выражением (З.Зб): 1 ~.е ! + «1яп ап! 1О ° ее~ 2 1=1 она является, по определению, неотрицательной величиной, характеризующей эффективность исходной системы признаков при распознавании заданного алфавита классов А. Полезность некоторого признака в исходном описании тем выше, чем больше значение его добротности ее» в заданном алфавите классов, поскольку наибольшие значения добротности й-го признака, как следует из (3.35), будут только при высоких и положительных значениях оценок полезности е)11 этого признака при парном различении всех классов.