Алгоритмы цветовой сегментации, применимые в условиях сложного освещения сцены (1102324), страница 2
Текст из файла (страница 2)
В работах, выполненных вместе с соавторами,вклад автора является определяющим.Структура и объём диссертацииДиссертация состоит из введения, трех частей: литературного обзора(глава I), теоретической части (глава II), алгоритмической и экспериментальнойчасти (главы III, IV и V) и заключения. Работа изложена на 125 страницах,включающих 22 рисунка и список литературы из 120 наименований.СОДЕРЖАНИЕ РАБОТЫВо введении определяется место данной работы в общем рядуисследований по цветовой сегментации.
Вводится корректное с физическойточкизренияопределениезадачицветовойсегментациикакзадачицветоразличения. Формулируется цель диссертационной работы. Приводитсякраткая аннотация ее содержания.В главе I приведен обзор экспериментальных и теоретических работ,относящихся к проблеме цветовой сегментации. В конце главы ставится задачанастоящего исследования.В разделе I.1.
приводятся основные понятия цветовой теории, такие какпространство спектрального распределения, цветовые пространства (ЦП),цветовыекоординатыигистограммыцветовогораспределения,ирассматривается возможность перехода к квазиинвариантным цветовымкоординатамкакспособаизбежатьанализамногомерныхцветовыхраспределений. В разделе I.2. рассматриваются наиболее часто используемые наданныймоменталгоритмыцветовойсегментацииизображения,основывающиеся, как правило, на некоторых локальных свойствах самогоизображения и не использующие информацию о процессах, лежащих в основевзаимодействия света с объектами сцены, – процессов, которые собственно иформируют изображение. Анализируются причины неудовлетворительностиконечных результатов работы существующих алгоритмов и отмечаетсяценность некоторых из них как сервисных алгоритмов обработки изображения(в том числе и для разработанных в данной работе схем сегментации).
В разделеI.3. кратко описаны физические явления, лежащие в основе формированияизображения, и линейная модель формирования спектрального стимула,положенная в основу настоящего подхода к проблеме цветовой сегментации.Излагается представление о ранговой классификации сцен, опирающееся наразличия в форме цветовых распределений, соответствующих в ЦП сенсораобъектам сцены. На основе проведенного анализа обосновывается адекватностьиспользованиягеометрическихособенностейкластеровцветовогораспределения для сегментации изображений. Раздел I.4. посвящен обзоруисследований цветовой сегментации изображения в человеческом зрении.Глава II содержит материал, полученный диссертантом с соавторами, ипосвящена теоретическому рассмотрению преобразования спектра излученияпри отражении от поверхности объекта и при взаимодействии с сенсорнойсистемой для широкого многообразия типов сцен (содержащих тени, затенения,блики и интеррефлексы). На основе этого материала строится линейная модельформирования спектрального стимула, даётся обоснование ее корректности, атакже строятся критерии, позволяющие проверить её адекватность для данногоизображения.
Показывается, что для изображений, удовлетворяющих модели,задачацветовойсегментацииможетбытьпоставленавтерминахморфологического анализа математически строго и корректно как задачааппроксимации формы изображений.В разделе II.1. кратко приводятся определения морфологического анализа ивводится общая модель изображения. Изображение определяется как векторr rфункция c (r ), заданная на некотором поле зрения – подмножестве Ω плоскостиℜ , заданная в виде: r rr rrc (r ) = ∑ c (r )⋅ ω (r ),=(1) – число изображённых объектов, ω(rr ) – индикаторная функция i -гоr rобъекта, а c(r ) – его цветовое распределение. Индикаторные функцииопределяются следующим образом: поле зрение Ω разбито на области A ⊂ Ω ,гдесоответствующиеотдельныхобъектов( i = 1,..., N ;rr 1, r ∈ Ai ≠ j ⇒ A ∩ A = ∅ ; U A = Ω ).
Тогда ω (r ) = r.0,r∉A=r rПри этом функции цветового распределения c (r ) считаютсяизображениям принадлежащими некоторому классу функцийзадачи., определяемому из спецификиРаздел II.2. посвящён определению класса цветовых распределений,возникающих при регистрации изображений различных сцен. В этом разделестроится более общая, чем в других работах (Николаев, 1988; Klinker et al.,1990; Brill, 1990), модель формирования спектрального стимула, что позволяетраспространить её на более широкий круг реальных сцен. Обобщеннаялинейная модель основывается на трёх допущениях. Первое – адекватностьприближениялучевойоптики.Второе–возможностьпредставитьспектральную яркость источников света в сцене в виде произведенияспектрального и геометрического сомножителей.
Третье – возможностьпредставить спектральную двухлучевую функцию отражательной способности(ДФОС) поверхности объектов сцены в виде произведения спектрального игеометрического сомножителей или суммы таких произведений. На основеанализа известных экспериментальных данных демонстрируется адекватностьэтих допущений.В работе показано, что при таких допущениях спектральный стимулF (λ ) от каждой точки объекта является элементом линейного подмногообразияразмерности n пространства спектральных функций. Действительно, световойпоток, порождающий изображение сцены, формируется в результате двухпроцессов – распространения света в прозрачной среде и его рассеянияповерхностями объектов.
В общем случае источник может быть заданспектральной яркостью излучения:) = (nr ⋅ nr δ)⋅Pδλ ⋅ δω ⋅ δS , nr = 1 , nrr rBλ (λ , r , n= 1.rcРис 1. Схема формирования изображения сцены. Точечные источники света Sr rrr rсо спектральной яркостью излучения Bλ (λ , r , n ) = S (λ ) ⋅ B (n ) ⋅ δ (r − r ) (здесьrr – координаты i -го источника) освещают плоскость Φ с СДФОСr r rr rr rrf λ (λ , r , n , n ) = Φ(λ ) ⋅ f (n , n ) ⋅ δ (r ⋅ e ) (здесь e – орт вертикальной оси).rСенсор со спектральной чувствительностью датчиков χ (λ ) регистрирует вточке светочувствительной матрицы некоторый спектральный стимул F (λ ) ,преобразуя его в вектор-стимул, соответствующий данному элементуизображения.
–Здесь δинтегральная мощность излучения в диапазоне длин волн(λ , λ + δλ ) , излучаемая площадкой δ источника из точки rr внутри телесногоrrугла δω в направлении, заданном вектором n ; n– нормаль к площадке δ . В большинстве случаев распределение спектральной яркости может бытьпереписано в виде:∞) = S (λ )⋅ B(rr, nr), nr = 1 , ∫ S (λ )dλ = 1 .r rB (r , n ) – интегральная яркость излучения,r rBλ (λ , r , nЗдесьспектральное распределение излучения (Рис. 1).Еслинерассматриватьа S (λ ) – относительноенелинейно-оптическихэффектов,тоотражательные свойства тел, образующих сцену, можно охарактеризоватьr r rf λ (λ , r , n , n ) , задающей отношениеспектральной ДФОС (СДФОС) спектральной яркости поверхности к её освещённости в диапазоне длин волн(λ , λ + dλ ) в каждой точке rr поверхности тела при освещении в направленииrrn и наблюдении в направлении nв системе координат, связанной сrэлементарной площадкой поверхности в точке r (Рис.
1). При рассмотренныхограничениях ДФОС представима в виде суммы следующего вида:r r rr r rf λ (λ , r , n , n ) = ∑ Φ (λ ) ⋅ f (r , n , n ) , ∞ = 1 , ∫Φrrгде n = 1 , nЗдесь )r r rf (r , n , n(λ )dλ = 1 , иΦ (λ ) – линейно независимы.– интегральные ДФОС, а Φ (λ ) – относительныеспектральные распределения коэффициента отражения. Количество значимыхчленов этой суммы зависит от свойств материала поверхности.rПри этих условиях, спектральный стимул F (λ, r ) от сцены, содержащейнесколькоисточниковраспределениямисизлученияразличнымииотносительныминесколькоокрашенныхспектральнымиповерхностейсразличными СДФОС, с учетом интеррефлексов может быть записан вследующем виде:rrrF (λ , r ) = ∑ g (r ) ⋅ S (λ ) + ∑ g (r ) ⋅ S (λ ) ⋅ Φ (λ ) +,r+ ∑ g (r ) ⋅ S (λ ) ⋅ Φ (λ ) ⋅ Φ (λ ) + K (2)где S (λ ) – относительное спектральное распределение излучения i -тогоисточника света; Φ (λ ) – -тое относительное спектральное распределениекоэффициента отражения в разложении СДФОС n -ной поверхности, аrg (r ) – геометрический фактор для луча света от i -того источника света, последовательно отражённого от m поверхностей n , n ,K, n.Геометрические факторы зависят от мощности источника света, интегральныхДФОС поверхностей и взаимного расположения источников, объектов исенсора в сцене.Ранг объекта на изображении определяется через рассмотрение совокупностиспектральных функций L , элементами которой являются разности междуспектральными стимулами от каждой точки объекта и спектрального стимула отrrrпроизвольной фиксированной точки объекта r : L = {F (λ , r ) − F (λ , r )}.
Пустьранг L в линейном пространстве относительных спектральных функций равенn , тогда (2) можно переписать в виде: rrF (λ , r ) = g ⋅ M (λ ) + ∑ g (r ) ⋅ M (λ ) ,=(3)где{M (λ )}– ортонормированный базис L , а M (λ ) ортогональна этомубазису. Таким образом, спектральный стимул F (λ ) от каждой точки объектаявляется элементом линейного подмногообразия размерности n пространстваспектральных функций. Эта размерность и называется рангом данного объекта.Ранг объекта зависит и от типа его поверхности, и от условий его освещения инаблюдения.Сенсор преобразует поступающий сигнал в каждой точке(x, y )своейсветочувствительной матрицы из спектрального стимула F (λ ) в т.н.
цветовойrвектор-стимул c (x, y ):∞rrrc (x, y ) = ∫ F (λ , r (x, y ))⋅ χ (λ )dλ ,(4)rгде χ (λ ) – вектор спектральных чувствительностей сенсора (трёхмерный вслучае RGB-камеры или, в определённых условиях, глаза человека). Такимобразом, сенсор проецирует вектор-стимул из пространства функций вконечномерное ЦП, сохраняя линейные свойства распределения для случаеврангов меньших размерности ЦП. Из (4) также следует, что на формированиеrизображения не влияют спектральные особенности стимула F (λ , r ) в техrобластях спектра, где все компоненты вектора χ (λ ) близки к нулю. Такимобразом, все требования линейной теории, сформулированные выше, должнывыполняться только в видимой для сенсора части спектра.Для изображений, удовлетворяющих линейной модели, классфункцийr rцветового распределения c (r ) представления (1) можно записать в явном виде: (cr ⋅ cr ) = δ . Тем самым получено определениеr rr rrrr rr rrc (r ) = ∑ c (r )⋅ ω (r ) = ∑ (g ⋅ c + g (r )⋅ c + g (r )⋅ c )⋅ ω (r ) ,=где=(5)формы цветногоизображения трёхмерной статичной сцены при сложных условиях освещения.Форма (5) является конусом в пространстве изображений, а задача цветовойобъектной сегментации заключается в построении проекции на этот конус.На рис.