Робототехника.Фу, Ли, Гонсалес (962794), страница 69
Текст из файла (страница 69)
Введем две следующие функции от Гм А (2) = Р, р, (г), (8,2-1 3) (2) = Рта (г). (8.2-14) Из теории принятия решений (290) известно, что средняя ошибка определения пиксела объекта в качестве фона (и наоборот) минимизируется с помощью следующего правила: рассматривая пиксел со значением интенсивности г, мы подставляем это значение г в уравнения (8.2-!3) и (8.2-14). Затем мы определяем пиксел как пикссл объекта„если г(г(г) ) г(а(2), или как пнксел фона, если г(е(2) ) г(г(г) Тогда оптимальный порог определяется величиной г, для которой г(г (г) = г(2(в).
Таким образом, полагач в уравнениях (8.2-13) и (8.2-14) г = Т, получаем, что оптимальный порог удовлетворяет уравнению Р,р,(т) = Р,ра(т). (8,2-15) Итак, если известны функциональные зависимости р,(2) и ра(г), это уравнение можно использовать для нахождения оптимального порога, который отделяет объекты от фона. Если этот порог известен, уравнение (8.2-!О) может быть использовано для сегментации данного образа. В качестве важной иллюстрации применения уравнения (8.2-15) предположим, что рг(г) и р,(г) являются плотностями вероятности распределения Гаусса, т, е.
1 Г (в — т,)Я 1 р,(г) =, ехр— .д2гг а, ~ 2о, 1 Г (в — лгя) 1 р,(г) =, ехр — ~ ятзи оа 2о„ (8.2-16) (8.2-!7) (8.2-18) Атг+ Вт+ с = О, где о'- — оя, а 2 (тго„-' — птаог), А= (8.2-19) Возможность двух решений указывает на то, что для получения оптимального решения могут потребоваться два значения поро- гового уровня, В этих выражениях положим г = Т, подставим их в уравнение (8.2-15) и после упрощения получим квадратное уравнение относительно Т: Если стапдартпые отклонения равны (а1 — — оз = о), в этом случае имеется единственное значение порогового уровня: (8.2-20) Рпс. 8.12. Оправ механических деталей, разлелеаный на области реыеткой (а), образ, полученный в результате определения глобально~о порогового уровня (б), гнстограм чы полобразов (а), илч~осграпия динамически~о порога (г) и образ, полученный н результате определения динамических порогов (д) [2о2). 410 41ь Если о = 0 или Р~ = Рз, оптимальное значение порогового уровня является арифметическим средним математических ожидании.
Сформулированное условие означает, что интенсивности объекта и фона постоянны для всего образа. Последнее условие означает, что пикселы объекта и фона имеют одинаковую вероятность появления, причем каждый раз число пикселов объекта равно числу пикселов фона. Пример. Рассмотрим сегментацию механических деталей, показанных на рис. 8.12,а, где мы пренебрежем решеткой, наложенной на образ.
На рис. 8.12,б приведен результат вычисления глобальной гистограммы, соответствующей бпмодальной гауссовой плотности распределения вероятности, устанавливающей оптимальный глобальный порог, который окончательно используется в уравнении (8.2-10) для сегментации образа. Видно, что отклонения в интенсивности делают этот подход практически непригодным. Однако он может быть реализован на локальных участках образа, определенных решеткой на рис. 8.12,а, После разбиения образа на подобразы для каждого из пих вычисляется гистограмма и проводится тест на бимодальность Бимодальные гистограммы соответствуют смешанной гауссовой плотности распределения вероятности, и оптимальное значение порогового уровня вычисляется по уравнениям (8.2-18) и (8.2- 19). Для подобразов, не имеющих бимодальных гистограмм, значения пороговых уровней не вычисляются, Для них эти значения вычисляются путем интерполяции порогов соседних подобразов, являющихся бимодальными.
Гистограммы для каждого подобраза приведены на рис, 812,в, где горизонтальные линии обозначают относительный диапазон этих гистограмм. В конце процедуры для определения порогового значения Т(х, у) проводится от точки к точке повторная интерполяция соседних пороговых значеншз. Отметим, что в данном случае мы имеем дело с динамическим значением порогового уровня, поскольку оно зависит от пространственных координат (х, у). Изменсние Т(х, у) в зависимости от положения показано на рис. 8.12,г, Окончагельно пороговый образ создается в результате сравнения каждого пиисела в первоначальном образе с соответствующим пороговым уровнем.
На рис. 8.!2, д показан результат использования этого метода в данном частном случае. Налицо улучшение по сравнению с применением глобального поро1ового уровня. Отметим, что данный метод предполагает установление порогового уровня для каждой ячейки, а локальные пороги ин- терполируются с целью создания динамического порога, который окончательно используется при сегментации. Изложенный выше подход применяется для выбора пороговых уровней изображения. Предположим, что мы можем моделировать многомодальную гистограмму в виде суммы и функций плотности вероятности: р(г)=Р,Р1(г)+ ... +Р.р.(г). (8.2-2!) Тогда задача оптимизации порогового уровня сводится к определению принадлежности данного пиксела к одной из ц возможных категорий.
Правило минимизации ошибки теперь основывается на н функциях вида г(, (г) = Р;р; (г), 1= 1, 2, ..., п. (8.2-22) Данный пиксел интенсивности г принадлежит й-й категории, если д»(г) » д,(г), /=1, 2, ..., гц 1Фй. Как прежде, оптимальный пороговый уровень между категорией Й и категорией 1, обозначаемый Т»ь определяется из уравнения Р,р,(Т„)=р,р,(Т„) (8.2-23) Как указывалось в равд. 7.6.5, при получении пороговых уровней на основе многомодальных гистограмм актуальной является задача идентификации гистограммных мод.
Определение порогового уровня на основе характеристик границы. Одним из наиболее важных аспектов при выборе порогового уровня является возможность надежно идентифицировать модовые пики для данной гистограммы. Это важно при автоматическом выборе порогового уровня в ситуациях, когда характеристики образа меняются вследствие большого разброса интенсивности, Из изложенного выше очевидно, что возможность выбора «хорошего» порогового уровня может быть существенно увеличена в случае, если пики гистограмм являются высокими, узкими, симметричными и разделены глубокими провалами. Одним из подходов для улучшения вида гистограмм является рассмотрение только тех пикселов, которые лежат на границе (или около нее) между объектами и фоном.
Одно из очевидных улучшений состоит в том, что этот подход позволяет получать гистограммы менее зависимыми от отношения между объектом и фоном. Например, гистограмма интенсивности образа, составленного из маленького объекта на большой площади постоянного фона, определялась бы большим пиком вследствие концентрации пикселов фона. С другой стороны, результирующие гистограммы имели бы пики с более сбалансированными высотами, если бы рассматривались ппкселы, лежащие только на (или около) границе между объектом и фоном. Кроме того, вероятность расположения пиксела на границе объекта практически равна вероятности того, что он лежит на границе фона, что улучшает симметрию гистограммных пиков, Окончательно, как показано ниже, использование пикселов, которые удовлетворяют некоторым простым критериям, основанным на операторах градиента и Лапласа, приводит к увеличению провалов между пиками гистограммы. Вьппе мы неявно подразумевали, что граница между объектами и фоном известна.
Очевидно, что во время проведения сегментации эта информация отсутствует, поскольку нахождение раздела между объектами и фоном является окончательной целью приведенной здесь процедуры. Однако из равд. 7.6.4 известно, что, вычислив градиент пиксела, можно определить, лежит ли он или не лежит на контуре. Кроме того, лапласиан может дать информацию о том, лежит ли данный пикссл на темной (т.
е. фон) или светлой (объект) стороне контура, Как установлено в равд. 7.6.4, с внутренней стороны идеального контура лапласиан равен нулю, поэтому на практике можно ожидать, что провалы гистограмм, образованных пикселами, выбранными по критерию градиент/лапласиан, будут располагаться достаточно редко н иметь желаемую высоту.
Градиент 6 [1(х, у) ] любой точки образа определяется уравнением (7.6-38) или (7.6-39), лапласиан Г, [1(х, у) ) — уравнением (7,6-47). Эти два свойства можно использовать для формирования трехуровиего образа: О, если»» [1(х, у)] < Т, э(х, у) = +, если 6[1(х, у)) »Т и Г.[7'(х, у))) О, (8.2-24 — если»1[1(х, у)))Т и Е[1(х, у)) (О, где символы О, +, — представляют три различных уровня освещенности, а Т вЂ” пороговый уровень. Предположим, что темный объект располагается на светлом фоне, тогда в соответствии с рис. 7.34,б применение уравнения (8.2-24) дает образ з(х, у), в котором все пикселы, не лежащие на контуре (для них значение 6[1(х, у)] меньше Т, помечены О, все пикселы на темной стороне контура помечены + и все пикселы на светлой стороне контура помечены —.
Для светлого объекта на темном фоне символы + и — в уравнении (8.2-24) меняются местами, На рис. 8.!3 показан объект, построенный иа светлом фоне по уравнению (8.2-24). Только что изложенная процедура может применяться для создания сегментированного, бинарного образа, в котором 1 со. ответствует обьектам, представляющим интерес, и 0 — фону. Отметим, что перемещение (вдоль горизонтальных илп вертикальных линий сканирования) от светлого фона к темному объекту должно характеризоваться заменой знака — фона иа объекта з(х, у). Внутренняя область объекта состоит из пикселов, помеченных либо 0 либо +. Окончательно перемеще- ние от объекта к фону характеризуется заменой знака + на —, Таким образом, горизонтальные или вертикальные линии сканирования, содержащие части объекта, имеют следующую структуру: (...) ( —, +)(О илп +)(+, — )(...), где (...) является произвольной комбинацией +, — или О.