Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 75
Текст из файла (страница 75)
9.15, расположение координатной системы иногда может случайно привести к ситуации, при которой очень тонкий объект имеет отношение рдъ Описание формы 377 аспекта, близкое к единице. Более сложное определение предполагает, что стороны прямоугольника параллельны собственным векторам матрицы рассеяния ') точек объекта. Как мы видели в случае подбора линий, линия, параллельная главному собственному вектору, сама по себе явля- ется хорошей аппроксимацией точек объекта, если обьект похож на линию. Для произвольного объекта собственные векторы физически соответствуют направлениям, относительно которых объект имеет максимальный и минимальный моменты инерции; таким образом, они хорошо согласуются с нашим интуитивным представлением о направлениях, по которым объект толстый и тонкий.
Более р ис. 9Л5. Тонкая фигура с отногпеиием аспекта, раиным единице того, сами собственные значения представляют собой два момента инерции относительно этих осей; поэтому, согласно третьему альтернативному определению, отношение аспекта есть отношение собственных значений матрицы рассеяния. На практике вычисления, которые требуются всвязи с этим усовершенствованным определением, должны компенсироваться количеством получаемой информации. 9.3.4. ОПИСАНИЯ, ОСНОВАННЫЕ НА НЕРЕГУЛЯРНОСТЯХ Пы продолжим наше обсуждение метрических свойств, изложив два метода описания, рассчитанные на то, чтобы отображать существенные «нерегулярности» объекта.
Первый метод использует отклонения от выпуклости, второй построен на локальных экстремумах периметра. В Напомним, что матрица рассеяния и точек пропорциональна коаариационно» матрице реализации для »тих точек. У.о.т".1. Вьтуклая оболочка и дефицит выпуклости Выше мы определили выпуклое множество как множество, содержащее каждый отрезок прямой, соединяющий две его точки. Выпуклая оболочка О произвольного множества В есть наименьшее выпуклое множество, содержащее В. Если множество 5 выпуклое с самого начала, то, конечно, Н=В. Если множество 5 содержит только одну связную компоненту, то Н можно представить себе 378 Гл. 3.
Оииааиив линии и формы как множество, ограниченное резиновой лентой, натянутой по периметру множества 5. Разность множеств Н вЂ” 5 называется дефицитом выпуклости В множества 5. На рис. 9.16 дефицит выпуклости множества 5 показан в виде заштрихованной области. Очевидно, что любое множество полностью определяется его выпуклой оболочкой и дефицитом выпуклости. Причина, по которой мы рассматриваем эти множества в описаниях объектов, заключается в том, что они час- О, то позволяют разделить естественным образом сложный объект на несколько У менее сложных частей. Например, если читатель поставит задачу описать на английском языке множество 5 на рис. 9.!6, он морис.
9.!б. дефицит выпукластв объекта. жет с успехом ее решить, описав сначала выпуклую оболочку, а потом обе части дефицита выпуклости. Естественным образом можно получить дальнейшее разделение объекта, заметив, что компоненты всякого дефицита выпуклости распадаются на два различных вида: компоненты, лежащие на границе выпуклой оболочки, и компоненты, заключенные в множество 5. За неимением лучшего термина эти два вида компонент иногда называют заливами и озерами. На рис. 9.16 часть 1), есть залив, а часть Рв — озеро. Заливы и озера объекта могут быть описаны нх номером, приблизительным положением относительно объекта н в общем любыми средствами, имеющимися для описания объектов. Таким образом, описание объекта может состоять из описания его выпуклой оболочки, которая обычно проще, чем сам объект, а также его озер и заливов.
Мы должны здесь упомянуть, что расширение понятия выпуклости на дискретные объекты требует некоторой осторожности. Трудности связаны с тем обстоятельством, что, если дан выпуклый аналоговый объект, его кваитованный образ в общем случае не выпуклый. Квантованный круг, например, имеет ступенчатую границу и, таким образом, не попадает в число выпуклых. Простой и понятный способ решения этой задачи заключается в следующем: натянуть резиновую ленту вокруг квантованного объекта и считать, что дефицит выпуклости включает только те элементы фона, которые полностью лежат внутри резиновой ленты. Если дефицит выпуклости пуст, тогда, конечно, объект (квантованный) считается выпуклым.
Грубо говоря, эти определения сводятся к заданию некоторого допуска, который следует учитывать до того, как относить дискретный объект к числу невыпуклых. 9.9. Описание формы 379 9.8.4.2. Локальные экстремумы границы объекта В предыдущем пункте мы обсуждали способ описания кривой через ее точки высокой кривизны.
Довод здесь заключался в том, что информативными следует считать такие точки, в которых имеют место какие-либо резкие изменения. Подобным же образом мы можем описать границу объекта с помощью точек, в которых она достигает локального экстремума по оси Х или 1'. На рис. 9.17, например, точки 1, 2, 3 и 5 представляют собой попеременно локальные минимумы и максимумы в направлении оси Х, а точ- Ч ки 4 и 6 — максимум и минимум (единственные) в направлении оси У.
Как г видно из рисунка, эти точки находятся вблизи точек границы с высокой кривизной, что бывает часто, хотя и не всегда. г Если должно использоваться описание объекта че- Ркс. 9Л7, Локальные экстремумы объекта. рез экстремальные точки, необходимо, очевидно, сгладить малые флуктуации границы объекта. Один из способов выполнить эту операцию заключается в регуляризации объекта посредством скользящего среднего, но при этом неизбежно возникает существенная потеря разрешающей способности. Более мощный метод называется гистерезисным еглаясиванием.
Гистерезисное сглаживание на самом деле представляет собой нелинейную процедуру для отыскания «существенных» экстремумов вещественной функции; для целей описания объекта она просто применяетгя отдельно к координатам Х и У точек границы. Имея это в виду, проиллюстрируем ее действие на примере функции одной переменной. Предположим, как показано на рис. 9.18, нам дана функция д(х), существенный экстремум которой мы ищем, Вообразим, что вертикальный проволочный прямоугольник перемещается вдоль кривой посредством указателя, который точно отслеживает функцию д.
Считается, что проволочный прямоугольник обладает следующим свойством: не перемещается вверх до тех пор, пока его не потянет вверх указатель, и, наоборот, не перемещается вниз до тех пор, пока его не потянут вниз. Другими словами, прямоугольник просто тянут в сторону вдоль кривой, не изменяя его вертикального положения. В точке А объекта указатель при его движении вдоль кривой тянет прямоугольник вверх. В точке В указатель только что прошел малый локальный максимум, а прямоугольник просто перемещается в сторону на одной и той же высоте, поскольку его не тя- зво Гл. 9. Олисания линии и формы нут ни вверх, ни вниз. В точке С был достигнут другой локальный максимум (то, что здесь имеет место также и глобальный максимум, сейчас несущественно).
В точке 0 прямоугольник перемещался в сторону, не двигаясь ни вверх, ни вниз, а в точке Е указатель начал тянуть прямоугольник вниз. Функция д(х), вычерченная центром проволочного прямоугольника при его движении за указателем, представляет собой гистерезисно сглаженный вариант функции д(х). Высота прямоугольника й называется зазором гислтерезиса Рис. 9.1В. Механизм гистерезисного сглаживания. и играет роль независимого параметра, аналогичного ширине окна в процедуре получения скользящего среднего. Локальный экстремум сглаженной функции определяет существенный локальный экстремум исходной функции.
В типичном случае, как показано на рис. 9.18, сглаженная функция 'достигает локального экстремума не в единственной точке '). Когда это имеет место, разумно в качестве экстремальной выбрать точку с наименьшей координатой Х— в данном случае точку С. (Заметим, что область функции д(х) вблизи точки В является «областью перегиба», а не экстремума.) Было бы поучительным сравнить общие характеристики гистерезисного сглаживания с регуляризацией, поскольку это два основных метода, конкурирующих в решении текущей задачи отыскания экстремума функций.
Основная трудность при использовании регуляризации как метода отыскания экстремума заключается в том, что, если мы хотим сглаживать малые флуктуации полностью, то должны применять относительно широкое усредняющее окно; такое окно, видимо, может также смазать и существенный экстремум. т) Точка экстремума функиии д единственная, если выброс функции л до. статочно велик. 38! 9Л. Ояиеаяие формы Пример такого случая показан на рис. 9.!9, где мы изобразили функцию д(х), имеющую два заметных пика и несколько малых шумовых выбросов. Мы регуляризировали д(х), чтобы получить функцию д„(х), применяя в процессе усреднения окно ширины, достаточной, чтобы полностью подавить шумовые выбросы.
К сожалению, нам удалось при этом ликвидировать также всякий намек на то, что функция д(х) имеет два заметных пика. Конечно, можно использовать более узкое усредняющее окно. Тогда функция д (х) сохранит Рис. 9.19. Регуляриаация функций. какие-то признаки двугорбости, но она будет содержать также некоторый шум. Мы были бы поэтому вынуждены искать. некоторое правило, позволяющее решать, какие из ее локальных экстремумов существенны. Скорее всего, мы выбрали бы правило, очень похожее на гистерезисное сглаживание; следовательно, можно с таким же успехом решить использовать только гистерезисиое сглаживание и искжочить предварительное усреднение.