Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 59
Текст из файла (страница 59)
Можно использовать это определе- ние как меру сходства между эталоном и областью изображения вблизи точки (т, п); эталон и изображение считаются похожими, если взаимная корреляция велика. Конечно, если мы поместим эта- лон в белую область изображения, взаимная корреляция будет иметь значительную величину. Другими словами, наше первоначальное предположение о независимости суммы Хяр' д'(/, !) от точки (т, и) совершенно не обосновано. Возможной альтернативой к вычис- лению функции Е' является вычисление нормированной функции взаимной корреляции /(/~/(т, и) по формуле й/~/ (т, п) =,, Я ~/ (т, и), 1 Хй(/.!)' "' / где мы накладываем обычные ограничения на область значений ! и !.
Согласно неравенству Коши — Шварца, у~,(т, и)( ~~~~ь„,/(/ — т, ) — п)с1'/*, (5) / причем равенство имеет место в том и только том случае, когда функция интенсивности в интересующей нас области пропорциональна Га. 7. Предстоеление ьэьдрахенца эталонной функции. Следовательно, нормированная функция взаимной корреляции принимает максимальное значение, когда соответствие эталона и функции интенсивности абсолютное (с точностью до масштабного коэффициента). С другой стороны, при некоторых условиях наше предположение относительно суммы Хауз выполняется в точности. Например, предположим, что у нас имеется бинарное изображение, и пусть белое соответствует 1, черное соответствует — 1, но не нулю, как обычно.
Тогда сумма квадратов значений функции интенсивности по любой области фиксированного размера постоянна, и взаимная корреляция имеет максимальное значение именно тогда, когда функция Е' минимальна. Использование взаимной корреляции в качестве критерия сходства имеет также свои корни в некоторых похожих, ио не идентичных задачах классификации образов и обнаружения сигналов. Взаимную корреляцию до сих пор еще часто применяют, возможно, потому, что известно много случаев ее эффективной реализации.
Как мы убедились, однако, использование взаимной корреляции для сравнения с эталоном влечет за собой неявное предположение о том, что энергия функции интенсивности внутри любого окна приблизительно одна и та же. Рассмотрим снова наш исходный пример — задачу обнаружения местонахождения треугольника иа рис. 7.3. Предположив, что мы уже приняли одно из определений расстояния в качестве меры сходства, мы все-таки должны еще спроектировать сам эталон. После некоторого размышления придем к заключению, что эта проблема в том виде, в каком она поставлена, может быть решена только с помощью целого набора эталонов. Клин, например, если нет каких-либо явных ограничений, может находиться в любом месте сцены и может быть виден под любым углом.
Следовательно, видимый размер его треугольной грани будет колебаться в широких пределах и кажущаяся величина его внутренних углов также может быть самой разной. Для каждого такого положения клина нам, очевидно, необходим отдельный эталон, и в связи с тем, что каждый эталон нужно перемещать по всей сцене, объем вычислений будет, по-виднмому, большим. В такой ситуации естественным подходом к решению этой задачи является замена глобального эталона набором лоаиьных эталонов. Локальные эталоны проектируются таким образом, что они соответствуют различным частям интересующего нас объекта. Основной довод в пользу этого разделения заключается в том, что отдельные части меняются по своему виду меньше, чем целый объект.
В нашем примере с треугольником мы можем сначала поискать три отдельные линии и затем уже подумать над тем, как выяснить, когда три прямые образуют треугольник. Этот подход является разумным по отношению к большому классу проблем, отличительным признаком которых является сильная изменчивость внвшнвго 7.5. Сровнено«с»пименом вида интересуюшего нас объекта. С другой стороны, существуют некоторые задачи классификации образов, которые можно так ограничить или стилизовать, чтобы была уверенность в том, что каждый образ всегда будет появляться изолированно от других и иметь один н тот же размер и одинаковую ориентацию.
При решении таких простых задач иногда оказывается целесообразно построить один эталон, соответствующий образу как целому. Другими словами, выбор локального или глобального эталона диктуется главным образом ожидаемой изменчивостью в обрабатываемых изображениях. Сравнение с эталоном применяется во многих внешне различных но, по существу, эквивалентных формах. Выбор формы в конечном счете определяется соображениями удобства и эффективности. В качестве простого примера предположим, что мы хотим обнаружить наличие вертикального края. Мы могли бы использовать «бинарный» эталон (подобный эталону на рис.
7.13, ио в форме одной верти- 74 В кальной линии) и применять его к И в( градиентному изображению. С другой стороны„можно было бы легко придумать эталон, соответствующий по Я Я форме вертикальной линии на исходном изображении. (На самом деле, если бы мы оперировали с исходным изображением, мы, возможно, захотели бы использовать два эталона: Рке 714' Эталон аля верта" квльаых краев.
один для переходов «темное — светлое» и другой для переходов «светлое — темное». Если мы работаем с градиентным изображением, этот связанный с симметрией вопрос не возникает, потому что мы обычно берем модуль градиента.) На рис. 7.14 показан эталон, который будет обнаруживать переходы слева направо от темного к светлому вдоль вертикальной линии, если для определения сходства использовать формулу (1).
Область эталона, отмеченная словом «иизкая», имела бы при этом значения интенсивности, соответствующие темному концу полутоновой шкалы, а область с пометкой «высокая» — светлому. Трудность, которая может возникнуть при использовании этого эталона, заключается в том, что он не инвариантен к абсолютным значениям уровня полутонов; добавление константы к значениям полутонов изменит стенень соответствия. Это соображение может привести нас к процедуре, в которой областям эталона, отмеченным словами «низкая» и «высокая», приписаны значения — 1 и +1 соответственно, а в качестве меры сходства используется корреляция, вычисляемая по формуле (4).
Такая процедура эквивалентна вычитанию элементов из смежных столбцов и сумми- Гл. 7. Предстаааан«а июбражениа рованию разностей. Другими словами, процедура отыскивает различия в уровне полутонов вдоль вертикальной линии, а это почти равнозначно использованию бинарного эталона иа градиентном изображении. Следует заметить, что важным аспектом методов сравнения с эталоном независимо от того, выполняется ли сравнение на исходном изображении или на его обработанном варианте, является то, что при сравнении используется только локальная информация. Если мы пытаемся выяснить, скажем, имеется ли вертикальная линия в данной области изображения, единственное, что повлияет на наше решение,— это набор значений интенсивности в этой области.
Эта локальность придает методам сравнения с эталоном их привлекательную простоту и одновременно служит источником их наиболее существенных ограничений. 7.5.2. СРАВНЕНИЕ С ЭТАЛОНОМ— СТАТИСТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ Некоторые разновидности методов сравнения с эталоном можно интерпретировать в рамках теории статистических решений, развитой в ч.
1. Продемонстрируем такую интерпретацию с помощью простого примера. Предположим, что у нас есть бинарное изображение я(1,1), и пусть нам известно, что оно должно соответствовать одной нз двух возможных идеальных сцен, скажем г(1, 1) или з(<, 1). Реальное изображение д, однако, является только несовершенным представлением идеальной сцены. Предположим, что с вероятностью р) 1/2 произвольный элемент иэображения д имеет величину, определяемую идеальной сценой, которую представляет изображение д.
Если эти вероятности для всех элементов независимы, мы легко можем записать вероятности появления изображения д при условии, что либо г, либоз является для него исходной идеальной сценой. А именно если обозначить символами м, и <», события, состоящие в том, что идеальной сценой оказывается соответственно г(1, 1) и а(1, 1), то мы получим р(й<<а) П, -<а«.л- <Ал<(1 р)<а«,л-.«,л< (б) с,< Р(<<«< )=Пр -<а«,л- «,л<(1 о)<а«,л- «,л<. с,! Заметим, что в этих уравнениях показатели степени при р равны единице, если идеальное и реальное изображения имеют одно и то же значение в данной точке (1, 1), и равны нулю, если эти значения разные; наоборот, показатели степени при (! — Р) равны единице, если идеальное и реальное изображения в данной точке (<, 1) различны.