Алгоритмы цветовой сегментации, применимые в условиях сложного освещения сцены (1102324), страница 3
Текст из файла (страница 3)
2 показано, как выглядят уединённые кластеры цветовыхраспределений реальных сцен.Рис. 2. Примеры цветовых гистограмм реальных изображений в RGBпространстве. а) Объект ранга 1 (клубок синей шерсти при дневном освещении).б), в) Проекции кластера ранга 1 в ЦП. г) Объект ранга 2 (глянцевый красныйцилиндр при освещении лампой накаливания). д), е) Проекции кластера ранга 2в ЦП.ЦПВ разделе II.3. приводятся примеры сцен, создающих, согласно теории, всенсоракластерыразличныхрангов(минимальныхразмерностейнатянутого линейного подмногообразия). Показывается, что для некоторыхклассовсценперепроецированиецветовогораспределенияизЦПвпространства пониженной размерности сохраняет свойство вырожденностикластеров распределения, что позволяет существенно ускорить сегментациюпри использовании одних и тех же алгоритмов.
Чтобы обозначить классы сцен,позволяющих редукцию ЦП, была уточнена систематика рангов сцен с учетомрасположения линейных подмногообразий относительно главной диагоналинормализованного ЦП – ахроматической оси. Сведены в таблицу примеры сценразличных рангов расширенной систематики. Показано, для каких практическихслучаев возможно упрощение анализа цветовых распределений за счетпроекции трёхмерного ЦП на плоскость цветности, а для каких вообщедостаточно рассмотреть распределение цветового тона.В разделе II.4 вводится параметризация моделей линейных кластеровразличных рангов и сравниваются алгоритмы определения параметров ихраспределений – обобщённое преобразование Хафа и метод собственныхвекторов (или, что то же самое, метод наименьших квадратов).
В качествеоптимального выбора предлагается использовать преобразование Хафа, еслиэто позволяют вычислительные мощности системы. В противном случаепредлагается использовать метод пристрелки с начальным приближением,вычисляемым с помощью метода собственных векторов. Дополнительнорассматриваются особенности применения этих методов для анализа цветовыхраспределений на циклической оси цветового тона.Метод наименьших квадратов решает задачу аппроксимации формыодного сегмента оптимально в квадратичной метрике при наличии нормальногошума:r r rr r rr r,∫ c (r )− g ⋅ c + ∑= g (r )⋅ c dr ≡ ∫ ρ (r )dr → min r rгде (c ⋅ c ) = δ , а R – ранг линейного подмногообразия. В свою очередь, метод ОПХ решает ту же задачу, оптимизируя другой функционал, чтообеспечиваетметодуустойчивость(выбросовому) шуму:rexp(− ρ (r ) 2 ⋅ σ ) rdr → max,∫ 2 ⋅π ⋅σпоотношениюкимпульсному– параметр сглаживания.
Сглаживание исходного распределениягде σтребуется для подавления нормальной компоненты шума, что особенно важнопри малых размерах сегмента A .В разделе показано, что преобразование Хафа в некотором смыслеобратимо с гауссовским сглаживанием, что позволяет производить подгонкупараметрабезперевычисления преобразования. Если обозначитьпреобразование Хафа для -мерных линейных подмногообразий в n -мерномσпространстве как Н , то этот факт можно записать следующим образом:rr r rrr r rH {Gσ (c )∗ f (c )}( pϕ , p ρ ) = Gσ ( p ρ )∗ H {f (c )}(pϕ , p ρ ),rгде Gσ ( p ) =–его( 2 ⋅σ ) , prrexp − p(2 ⋅π ⋅σ)( )ϕпространственныеr– угловые координаты подмногообразия, а p ρкоординаты.Приэтомrdim(pϕ ) = k ⋅ (n − k ) ,rdim(p ρ ) = n − k .Кроме того, в разделе предложена простая быстрая схема суммирования дляпреобразования Хафа ( O (n ⋅ log n ) операций для Н ), не использующаяпреобразование Фурье.
В массиве с линейными размерами n × n = 2 × 2суммирование вдоль прямой, соединяющей точки (x, y ) и (x + shift , y + 2− 1) вгоризонтальную полоску n × 2y = k ⋅2(0 ≤ k < 2( 0 < deg ≤ D ) с вертикальным смещением), проводится по рекуррентной формуле−[(x, y ), (x + shift, y + 2 − 1)] = [(x, y ), (x + shift / 2, y + 2 − 1)] ∪,[(x + shift / 2, y + 2 ), (x + shift, y + 2 − 1)]−(6)−что и обеспечивает (при порядке суммирования по deg от 0 до D-1) увеличениебыстродействия за счёт отсутствия повторного суммирования для фрагментовдискретного представления прямых, входящих в несколько сумм.В главе III описан алгоритм быстрого выделения маски объекта нацветном изображении сцены со сложными условиями освещения подчастичным контролем пользователя.
Алгоритм позволяет определять искомуюоднородно окрашенную область по указанному малому участку области.Предлагаемыйалгоритмвыделенияобъектапостроеннапроцедуреитерационного уточнения его модели по мере роста области выделения. Вкачестве модели цветового распределения объекта выбрана линейная модельранга 1, поскольку, как было показано, большинство однородно окрашенныхобъектовприахроматическом(либомалонасыщенном)освещенииудовлетворяют модели ранга 1, – их цветовое распределение образует в ЦПотрезок прямой.Кластер ранга 1 задаётся уравнением прямой в канонической форме.rПараметры модели – координаты точки g ⋅ c , через которую проходит эта rrrr rпрямая, и вектора c , задающего ее направление ( c = 1 c = 1 (c ⋅ c ) = 0 ).Квадрат невязки ρ ( ) между пикселем изображения с координатами () имоделью равен:rrρ (x, y ) = c (x, y ) − g ⋅ c1.
).rr− (c (x, y )⋅ cСобственно алгоритм состоит в следующем:Методом обобщённого преобразования Хафа найти приближениеr rпараметров модели {g , c , c } для начального сегмента S , заданного навходе. Задать ρ , как среднюю невязку по области S.2.Построить карту невязок ρ (x, y ) , которая представляет собой массивr rрасхождений между моделью с параметрами {g , c , c } и пикселямиrисходного изображения c (x, y ) (для первой итерации = ). из области S.Результат заливки – новое приближение рассматриваемой области, S . Если S 3.Произвести заливку карты ρ (x, y ) по уровню ρпокрывает все изображение, перейти к (7).4. ρ~Вычислить среднее отношение невязок G = ρ~для оценки – средняя невязка среди пикселей, входящих вS , а ρ~ – средняя невязка среди пограничных с S пикселей.r r5.Методом пристрелки вычислить новые параметры модели {p , v } дляобласти S . 6.Увеличить порог заливки ρ = ρ + ∆ρ и перейти к (2) для“качества границы”.
Здесь ρ~+++следующего i .7.ПроанализироватьпоследовательностиGрезультатлокальныевыделенияобъекта:максимумы: длявыделитькаждоговi,удовлетворяющего условию (G − ≥ G < G + ), пометить S в качестве кандидатана искомое выделение.В результате работы данного алгоритма определяется несколько гипотезо границах объекта. Пользователь выбирает из них искомый. Пример работыалгоритма выделения объекта приведен на Рис. 3.Рис. 3. Результаты применения алгоритма выделения объекта.
а) Исходноеизображение, точка на правой щеке маркирует начальную точку выделения. б)Результат выделения (гипотеза 2 из 7).ВглавеIVдиссертацииописываетсяоригинальныйалгоритмгеометрическихособенностяхизображенийобъектовавтоматической сегментации изображений, полученных с линейного сенсора.Информацияоучитывается алгоритмом в минимальной степени, что обеспечивает высокоекачество сегментации для объектов произвольной сложной формы.В разделе IV.1. описывается алгоритм предварительной сегментации,позволяющий существенно сократить время обработки изображения основнымалгоритмом.
Задача предварительной сегментации – разделить изображение наобласти площадью хотя бы в несколько пикселей так, чтобы истинные границыобъектов не пересекали этих областей. В работе используется обобщённый наслучай цветных изображений алгоритм поиска водоразделов (ранее онприменялся только для случая монохромных изображений).
Основная посылкаалгоритма поиска водоразделов состоит в том, что каждый сегмент долженсодержать точно один минимум значения некоторого детектора границ, иградиентный спуск от любого пикселя сегмента по карте детектора границдолжен приводить к этому минимуму. Это условие реализуется проведениемградиентного спуска из каждой точки изображения и группированием точек поих принадлежности к минимумам. В результате границы сегментов (групппикселей) проходят вдоль «хребтов» значений детектора краев.
Посколькуклассический оператор градиента может быть применен только для скалярного,но не для векторного поля, в цветовой версии алгоритма используетсявекторный аналог градиента (т.н. цветовой градиент). Его модуль записываетсяследующим образом:G= Σ +Σ + )Здесь C (x , x(Σ− Σ )2+ 4⋅Σ , где Σ (x, x) = ∂C(x, x) ⋅ ∂C(x, x) .∑ ∂x∂x=– цветовые компоненты изображения в линейном ЦП, n –размерность ЦП (для RGB-пространства – 3), а– модуль цветового градиента(максимум модуля изменения вектора C по всем направлениям).В разделе IV.2. изложена техника сегментации слиянием областей спомощью графа соседства областей (ГСО).
Каждая вершина ГСО представляетсегмент изображения. Две вершины связаны ребром тогда и только тогда, когдасоответствующиесегментыимеютобщуюграницу.Каждомуребруприписывается вес, характеризующий вероятность того, что эти сегментыимеютнесовпадающиепараметрымодели.Графпоследовательномодифицируется слиянием пар вершин, соединённых ребром с наименьшимвесом. Слияние производится до тех пор, пока наилучшее ребро не будет иметьвес выше некоторого порога. Качество сегментации, очевидно, определяетсявыбором весовой функции и уровнем порога. Кроме того, метод ГСО требует вкачестве входных данных некоторую карту предварительной сегментации,которая будет только «огрубляться» в процессе обработки.В разделе строятся весовые функции ГСО, основанные на оптимальныхкритериях проверки статистических гипотез.