Анисимов Б.В., Курганов В.Д., Злобин В.К. - Распознование и цифровая обработка изображений (1033973), страница 33
Текст из файла (страница 33)
Тогда при прочих равных условиях Т Я) ( Т' ($) (где Т"' ($) — минимальное значение Т ($, х) для всех а ка й Е 1)). Зго значит, что бейесов риск может быть ум т уменьшен введением ние С к возможного решения. При этом можно пок о показать, что уменьше- „относительно С, снижает бейесов риск.
Если С„эСь то мно- жество Е,м — — (х:/» (х) =-0). Следовательно, Е,„является в извест- ном смысле пустым; если С„(Сь то Е есть мй с — т, то введение а» в качестве возможного решения нецеле- сообразно (это условие, однако, недостаточно). Бейесовы решающие функции могут быть найдены только тогда, ког- да потери и априорные вероятности классов известны. Если потери не- известны, то поиск оптимальных решаю их фу ет ыть предпринят.
Например, можно рассмотреть решающие унк- ции н, минимизирующие вероятность ошиб Р ( ), нк и" фу ции, вероятность отклонения Р„(х) которых р равна заранее пред- писанной величине (). В этом случае, когда ошибка влечет за собой бо- лее неприятные последствия чем отклонен бо ие, лее подходящими яв- ляются условие Р, (н) ~ Р и минимизация вероятности Р» (н). шения Однако наиболее часто в рассматриваемом слу ря используется критерий «идеального наблюдателя». Ем с ветствует матрица штрафов юдателя». му соот- (4.23) СО=О, СП=! Ц, /=(,2,..., пн /~)). соответс При этом сс, как возможное решение исключае . Т тся.
акая матрица твует простои регистрации ошибочных распознаваний. Поэто- му средний риск равен полной вероятности ошибки. Действительно, поскольку н (О/х) = О, из (4.18), (4.21) и (4.23) следует, что та )= ° ()=! — Я; ( ц/)/4()л). /=1б матиеш Для получения оптимального алгоритма опозн р це штрафов каждому х Е»1 должен отвечать такой класс А авания при данной апостериорная вероятность которого ать такои класс Ан Р(//х)=(йоду(х)) / »', 2ти>(х) (4.24) / ! в данной точке пространства максимальна. Ы2 При принятии решения в соответствии с (4.24) часто вводится дополительное условие, заключающееся'в том, что устанавливается опрееленная пороговая величина А,. Решение считается принятым, если 'разность между максимальным и ближайшим к нему по величине значе'ниями апостериорных вероятностей некоторых классов превышает за'данный порог Л .
В противном случае либо принимается нулевое решение (отказ), либо указывается на конкурирующие классы, Во многих практических задачах априорные вероятности классов 4г неизвестны, поскольку их либо слишком трудно получить из опыт'ных даннкх, либо они в данной задаче вообще не имеют смысла Функция х'доминирует над функцией и Е/), если Т(Ан мэ) ( "( Т (Ан н) Ц =- 1, ..., т) и неравенство выполняется по крайней мере для одйого /. Функция н* называется допустимой функцией, если ' ад ней не доминирует ни одна н Е /). Класс 1)' решающих функций н' из Р считают полным классом, ';если для любой к Е 0* всегда найдется к" Е 0*. которая доминирует над и, Доказано. что класс решакхцих функций 'Бейеса, соот,'ветствующих различным значениям к, полный.
При этом все допусти: мые к Е В являются бейесовыми и почти всегда верно обратное ут»'' верждениее. Вычисление риска Т (Ан н) (см. соотношение (4.13)) не требует ;;. знания $. Поэтому возможно использование в случае отсутствия сведений об априорных вероятностях классов такой решающей функции 'и', которая минимизирует шах (Т (А, и), Т (А„н), ..., Т (Ан и)). ," Такая функция реализует ппп и шах (Т(А;, и)) и является оптимальи / ' ной в минимаксном смысле. Эта функция будет бейесовой для некото,'Рых значений $», $„..., $ . При этом величины Т (Ан н') Ц = 1, :2, ..., т), соответствующие 'ненулевым членам последовательности 4 $„2„..., $, равны между собой. Минимаксная решающая функция гарантирует минимум среднего , риска при наиболее неблагоприятном значении $. Однако поиск н' ! при многоальтернативной ситуации довольно сложен. Кроме того, ,;ориентация на наихудшую ситуацию в ряде задач — слишком несси;мистический подход.
В этой связи даже в рассматриваемом случае "' иногда имеет смысл пользоваться бейесовыми решающими функциями, .',поскольку класс всех бейесовых функций, соответствующих всем воз"можным значениям $, содержит класс всех допустимых функций (бейе'";,совы функции могут быть найдены сравнительно легко; если даже зна,»)чение 5 выбрано в значительной степени произвольно, бейесовой и '.минимаксной решающим функциям соответствуют очень близкие зна',чения риска).
При этом весьма желательно получение хотя бы ориен- ~,"тировочных оценок априорных вероятностей классов. Большой интерес в связи с вышесказанным представляет компаунд,, ный подход при принятии решения, который может быть кратко опи"Сан следующим образом. Пусть Хи>, Хм>, ... — последовательность , реализаций, подлежащих опознаванию, а хР>, х<»), ... — соответствующие им значения вектора параметров х = (х,, х„..., х„). Не (, будем пытаться опознавать отдельные реализации окончательно, пока 153 последовательность значений х не станет достаточно большой. Используем значения вектора х®, хая!, ... для оценки априорных вероятностей классов, а затем попытаемся опознать всю последовательность реализаций сразу.
Г. Роббинс, впервые предложивший' этот метод, показал, что компаундиый подход асимптотически субминимаксный, При отсутствии сведений о значении $ часто используется также прикг(ал максимума правдоподобия. Он соответствует принципу максимума' апостериорной вероятности, если компоненты вектора $ считать равными друг другу. Соответствующее решающее правило легко получается из (4.24) или (4.18) в случае произвольной матрицы штрафов. Идентификация трехмерного объекта возможна по двум (и более) проекциям. Многократное наблюдение объекта в различных ракурсах эквивалентно увеличению размерности пространства признаков. В процессе обучения и принятия решения в этом случае можно эффективно использовать методы последовательного статистического анализа.
$4.5. ОБУЧЕНИЕ ЭВМ И ПРИНЯТИЕ РЕШЕНИЯ В СИСТЕМАХ РАСПОЗНАВАНИЯ ПОРОГОВОГО ТИПА При построении систем автоматического распознавания в настоящее время широко используются элементы, реализующие различные пороговые функции. Введение порогов по признакам, используемым для Распознавания, позволяет также свести процесс принятия решения к Ряду последовательных дихотомий и существенно упростить отыскание вероятностей отнесения ситуации, предъявленной для Распознавания, к тому или иному классу.
Однако назначение порогов часто выполняется произвольно и в лучшем случае обосновывается некотоРымн соображениями довольно общего порядка. Назначение порогов при двухальтернатнвной ситуации. РассмотРим случай независимых признаков и отсутствия сведений о плотностях распределения их значений. Назначим по признаку х! (( = 1, 2, ..., п), например, с помощью случайного механизма с тем или иным распределением вероятностей порог Пг внутри интервала значений хг (данные об этом интервале обычно могут быть получены сравнительно легко).
В упомянутой ситуации из-за отсутствия нужной инфоРмации трудно дать другие какие-либо аргументированные рекомендации. Сопоставим каждой конкретной реализации по данному признаку символ 1 бинарного алфавита, если для нее х, эП, (возбужденное состояние признака), и символ 0 в противном случае. Аналогичное кодирование произведем по всем остальным признакам. В результате информация об изображении запишется некоторым словом а,а, ... а„ (а, — буква алфавита (1, 0)). В процессе обучения ЭВМ отдельные реализации и, следовательно, соответствующие им слова объединяются согласно указанию обучающего в то или иное множество (класс) и являются эквивалентными. Это позволяет при выполнении определенных требований к тренировочной последовательности оценить вероятности возбуждения и невозбуждения Рц и !/ц =1 — рц (-го признака для /-го класса ((=1,2..., хч ' = 1, 2) посредством подсчета частот превышения и непревы'.,хч/'=, п ния порога П, соответствующими значениями хц о у ятностн, как будет показано ниже, используются на этапе принятия Е ли необходимые для восстановления плотностей Р Р тей асп еделения мо ью восприниачений признаков измерения производятся с помощью Р ющего устройства или имеются некоторые априорные данные об этих отностях и требуется оценить лишь отдельные мо Р Р моменты оаспоеделей, то упомянутые выше вероятности могут быть подсчитаны по форуле (4.25) Пц — ) Яц(«!) "«! и ° де дц (х;) — п ( !) — лотность распределения значений г'-го признака для -го класса.
н и е. Для персептронз Розенблзттз нетрудно восстановить нз Примечание. ' зпе обучения распределения вероятносте р '«тупзющих нз возбуждающие и запрещающие входы того яли яного ')зля кзждого клзссз. ,-. - В лучае зависимых признаков целесообразно назначить по (-му с 'Признаку 2'-' порогов П! (з!) (з, = О, 1, ..., — ).