Анисимов Б.В., Курганов В.Д., Злобин В.К. - Распознование и цифровая обработка изображений (1033973), страница 16
Текст из файла (страница 16)
Такой подход к определению критерия полезности признаков пред,.полагает использование конкретного решающего правила, поскольку "только в его рамках имеет смысл ошибка распознавания. Если существование полезных или бесполезных признаков не вызы'вает никаких сомнений, так как подтверждается большим количеством легко контруируемых примеров, то концепция «вредности» признаков 'на первый взгляд кажется спорной. Однако она не противоречит утверждению, что вредной информации не существует.
Информация о .вредности признака есть полезная информация; весь вопрос о том, правильно ли она используется. Трудность восприятия и осознания концепции вредности признака заключается в том, что она возникает в чистом виде только при разли'чении двух классов. В случае большего числа классов «абсолютной» , вредности признака, как правило, не бывает: вредности признака прн ° различении одних пар классов противостоит его полезность при различении других пар.
П р и м е ч а в и е. Только указанными трудностями можно объясиить столь немногочисленные работы, в которых интуитивно вводится понятие вред. ного признака (см. [6, 7)). «Исчезновение» вредных признаков при различении более чем двух ' классов только кажущееся. Оно происходит за счет усреднения эффективности признаков по всем парам классов в условиях преобладаюто«щего числа полезных признаков. Отрицательное же влияние признаг«З ков, вредных для различения тех или иных классов, не исчезает и вы- ражается в увеличении вероятности ошибки распознавания этих классов, а следовательно, и суммарной ошибки распознавания. При распознавании более чем двух классов может возникнуть «порочный» круг: включение некоторого признака в описание классов окажется полезным для различения одних пар классов, но вредным для различения других; исключение этого признака из описаний классов, наоборот, окажется вредным для различения первых классов и полезным для различения вторых.
Следствие такого противоречия— обязательное возрастание количества ошибок распознавания с увеличением размера алфавита классов при любых решающих правилах, использующих один эталон на класс. Только на основе анализа полезности, бесполезности или вредности некоторого признака при разделении каждой из пар классов заданного алфавита можно решить альтернативу включения или исключения этого признака из исходного описания с точки зрения минимизации ошибки распознавания. й 3.2. НЕКОТОРЫЕ СИСТЕМЫ ПРИЗНАКОВ ПРИ РАСПОЗНАВАНИИ ОБЪЕКТОВ В настоящее время общепризнано, что опознавание сложных входных ситуаций наиболее целесообразно проводить на основе их относительного описания (описания в пространстве признаков).
Выбор эффективной системы признаков — наиболее важная задача теории распознавания. Однако удовлетворительного решения, определяющего порядок автоматического отыскания последних посредством переработки информации, получаемой на уровне абсолютного описания изображения, пока не найдено. Поэтому по-прежнему основным решением остается автоматизированный выбор наиболее информативных признаков из некоторого исходного множества (ансамбля) свойств проекций, задаваемого эвристически. При этом эвристика должна базироваться на фундаментальной основе, а не на легковесных предположениях.
От успешного решения данной задачи зависят процент ошибок на этапе экзамена и распознавания, быстродействие и объем памяти распознающего устройства. В настоящее время при решении этой задачи в лучшем случае формализуется лишь процедура выбора наиболее информативных признаков из заранее заданного ансамбля свойств. Иногда, правда, формализуется и процедура наращивания этого ансамбля в случае необходимости. Однако при этом, как правило, реализуется лишь получение заранее предписанных свойств.
Рассмотрим наиболее часто используемые для относительного опи. сания изображений свойства, Вначале приведем некоторые системы етерминированиых свойств — признаков, позволяющих определить отвечающие им алгоритмы измерения без применения тех или иных случайных механизмов, а затем вероятностных свойств, основанных на случайных факторах. Си истема детерминированных признаков. Приведем наиболее распространенные системы признаков, используемые при распознавании крупномасштабных изображений. 1. Одним из первых было предложено использовать для узнавания пологическое описание изображений, когда последние можно считать лоскими графами, если интересоваться только их внешними и внутенними контурами. При этом в отдельных задачах (автоматическое тение текста и др.) все возможные изображения, составляющие тот ли другой класс, можно представить при отсутствии помех как' реультат гомеоморфных преобразований некоторого эталонного изобраения, соответствующего этому классу.
Задача распознавания в этом учае может быть сведена к установлению гомеоморфности предъявнного изображения с одним из эталонных. Ве можно обнаружить с омощью топологических инвариантов — таких свойств изображения, оторые не изменяются при его гомеоморфных преобразованиях. Инариантом, позволяющим дать численное описание изображений, явяется, например, индекс точки, определяемый количеством сходяихся в ней линий. Соответствующее описание получается обходом в * пределенном порядке контуров изображения с одновременной фикса,цией индексов точек.
Установление гомеоморфности — собственно 'распознавания — сводится к сравнению описаний предъявленного Изображения и эталонных изображений классов (см. (8]). Важное достоинство топологического описания — его нечувствительность к сильным деформациям изображения, включающим все пребразовання подобия, если связывать с каждым изображением некото.'рую характерную точку, из которой начинается обход.
Однако это опи'сание обладает слабой помехозащищенностью и является, как правило, 'недостаточным для надежного опознавания: имеется неоднозначность ,перехода от описания к изображению (например, топологически неразличимы русские буквы Г, 3, Л, М, П, С или цифры 1,2, 3, 5, 7). 'Кроме того, в случае опознавания пространственных объектов гомео,морфность всех изображений класса не может быть гарантирована даже ,при идентификации. 2. В. С, Файн предложил использовать для описания формы изоб:ражения следующие инвариантные относительно преобразований по,добия соотношения, выбранные на основании сведений из интегральной геометрии и вычисляемые сравнительно легко: х, = Вй!Я, х, = := й1Ь, х, = (.1Р' Я, х, = ь/6, х» = Е,Ь, где В, 6 — меньшая и большая стороны минимального по площади прямоугольника, описанного ,вокруг изображения; 5, Т.
— площадь и периметр изображения соответственно. Для повышения надежности распознавания или упрощения и уде,шевления зрительного аппарата, а также если проверка покажет недостаточность выбранного числа признаков, может быть применена следующая процедура наращивания ансамбля свойств. Надо либо увели'чить число сторон описанного вокруг изображения многоугольника минимальной площади с заданными углами при вершинах, либо использовать значения длин сторон описанного прямоугольника при различных фиксированных его положениях относительно минимального .'по площади описанного прямоугольника.
Для каждой пары получаемых ; в последнем случае чисел могут быть вычислены соответствующие зна'чения х, — хв, Рассмотренная методика формализации изобразительной информации не свободна от недостатков, основные из которых заключаются в следующем: а) из пяти приведенных выше свойств функцчонально независимымн являются только три. Действительно, х, = х, )г х,х„х, = х, х,; б) разделительные возможности этих свойств весьма ограничены. Например, показанные на рис. 3.1 изображения имеют одинаковые значения Ь, Ь, Ю и Е, существенно отличаясь друг от друга по своей геометрической форме. Казалось бы, этот недостаток можно устранить, используя описанную выше процедуру наращивания ансамбля свой» ств.
Однако легко понять, что фигуры, имеющие одинаковые значения 8 и Е, а также одинаковую выпуклую оболочку в пространстве этих свойств„ неразличимы; в) процедура наращивания ансамбля свойств сравнительно трудоемка, поскольку вызывает необходимость перехода либо к другому типу описываемых вокруг изображения в с 3 ) П р и м е р ы из о ' е о м Р и ч к и ф и У Р, л и б о к п о с л ел он а е л ьбражеиия, ие различи- ности новых положений этих фигур относимых по признакам Ь, н, тельно исходного положения; о их, г) получаемое с помощью таких свойств описание обладает слабой помехозащищенностью.
Действительно, достаточно одной «шумовой» точки на «сетчатке» вне изображения, как значения этих свойств будут резко отличаться от их значений для «чистого» изображения. 3. Можно использовать для узнавания спектральное описание изображений. Под многомерным спектром абсолютно интегрируемой функции ~ ()гх; '«'„..., )г~) понимают в общем случае комплексную функцию вида ма М = О ...
)г((рг, )гз, ..., у~) ехр ~у ~эр~ м;, ю =.! )гс о'г'д,..., Вур. (3. 2) Спектральное описание изображения обладает рядом свойств, позволяющих обеспечить его нечувствительность к преобразованиям подобия и хорошую помехозащищенность при применении многомерных фильтров.
В (х, Плоское изображение полностью определяется двумерной функцией (3.2). (х, у), спектр которой нетрудно рассчитать с помощью соотношения С ущественный недостаток такого описания — длительная вычислительная процедура для его получения с преобладанием тригонометрических операций. 4. В некоторых работах, посвященных узнаванию, используется интегральное описание изображений, т. е. их описание с помощью мо- 72 ентов р »в (сс, р = 0,1,2, „.), Возможность применения такого опнсаия обоснована следующей теоремой: . Теорема: последовательность (ров) моментов изобраъсения одноо определяется его функцией яркости В (х, у) и, наоборот, В (х,у) нозначно определяется последовательностью (р в). К достоинствам интегрального описания изображений относят сравительную простоту его получения и легкость наращивания ансамбля войств в случае необходимости, высокую помехозащищенность, в осонностн при использовании для этих целей моментов нечетных порядов (в случае равномерных аддитивных помех «шумовые» точки в разых квадрантах системы координат, связанной с центром «сетчатки», удут в той или иной мере компенсировать друг друга).