Диссертация (1091367), страница 9
Текст из файла (страница 9)
В результате этого получится изображениев градациях серого, которое не зависит от освещения. Следовательно, этоизображение, которое отображает только свойства отражения. Так как тени в56основном получаются за счет удаления некоторых данных об освещении, тона таком изображении тени будут отсутствовать.Можно также использовать инвариантное изображение в оттенкахсерого для определения, какие цвета в оригинальном изображении RGBявляются неотъемлемой частью сцены, а какие – просто артефакты тени из-заосвещения.
Формируя градиент цветовых каналовизображения, можновыполнить пороговую обработку с помощью анализа различия между краямив оригинальном и инвариантном изображениях [76]. Используя после этогопроизводную и интегрирование, можно получить результат, которыйявляется3х-полоснымцветнымизображением,содержащимвсеоригинальную важную информацию об изображении, кроме того, что тенибудут удалены.Для целей компьютерного зрения изображение, включающее в себязатенение, не всегда требуется. Оно может приводить к неработоспособностиопределенные алгоритмы. Изображение цветности без затенения не подходитдля человеческого понимания из-за своего «нереального» вида, но отличноподходит для машинного зрения (см. например, [81] для примененияалгоритма слежения, устойчивого к тени).В этом разделе будет описан алгоритм определения инвариантногоизображенияснеизвестныхисточников,которыевозникаютотнекалиброванных камер.
Алгоритм принимает на вход цветное изображениеот неизвестного источника, которое включает тени, а на выходе даетинвариантное изображение цветности, в котором тени отсутствуют.Чтобы увидеть, как это делается, напомним, как можно найтиинвариантное изображение для калиброванной камеры. Для этого нужнопостроить 2D график логарифмов цветности при изменении освещения инайти направление, в котором будут получаться прямые линии – этонаправление назовем «инвариантным направлением», а затем будем строитьпроекции в этом направлении. Основная идеяалгоритма, описанного вразделе, сводится к тому, что имея одно изображение сцены, проецирование57в правильном направлении приведет к уменьшению энтропии в выходномизображении в градациях серого. Интуитивно значение этого выраженияпонятно, если думать о наборе цветов при изменении освещения.
Приизменении освещения, для каждого цветового пятна, пиксели выстраиваютсяпримерно в прямую линию в 2D пространстве log-цветности. Еслиспроецировать все эти пиксели на линию, перпендикулярную к множествупрямых, то в конечном итоге получим 1D набор точек, как показано нарис. 2.9а.В наборе реальных изображений цветовых пятен можно было быожидать множество вершин, где каждая хорошо отделялась бы от других исоответствовала бы одному цветовому пятну. С другой стороны, еслипроецирование шло в другом направлении, как показано на рис. 2.9б, товместопикселей,расположенныхвострыхпиках,получилосьбы«размазанное» распределение пикселей по указанной 1D проекции.
С точкизрения гистограммы, в первую очередь, в которой угадывается правильноенаправление, а затем проецирования, видно распределение с набором острыхпиков, что приводит к низкой энтропии. Во втором случае вместо этоговидно широкую гистограмму, что приводит к более высокой энтропии.Таким образом, идея заключается в том, чтобы восстановитьправильное направление, с помощью оценки энтропии изображения вградациях серого, которое является результатом проекции и определенияправильного "инвариантного направления", которое минимизирует энтропиюрезультирующегоизображения.Изменениевносится в изображение самими тенями.58освещенияавтоматическиа)б)Рис.
2.9. Нахождение наилучшего направления с минимальной энтропией:а) правильный поиск; б) неправильный поиск592.5.1. Введение в теориюРассмотрим широко распространѐнную узкополосную телевизионнуюкамеру с 3 каналами: красным, зеленым и синим. Если представитьнесколькоцветныхповерхностейЛамберта,освещенныхсветом,подчиняющихся закону Планка, то тогда логарифм отношения R/G и B/Gбудет соответствовать точке на двумерном графике. Так как цветностьудаляет тени для коэффициентов отражения Ламберта при ортогональнойпроекции, то каждый пиксель и его окрестность отображаются примерно водну и ту же точку. Рисунок 2.10б показывает логарифмы отношения цветовдля 24-х цветной таблицы Макбета для проверки цветов (рис.
2.10а)Для узкополосных камер [79] и для света, подчиняющевося законуПланка, если температура источника света T изменяется, то точки наlog-графике смещаются по относительно прямой линии, независимо отинтенсивности и направления освещения. На самом деле, датчики камеры несовсем узкополосные, поэтому и log-цветности линия только приблизительнопрямая. Если предположить, что изменение освещения на самом делелинейно, проецирование цветов, перпендикулярных к этому "инвариантномунаправлению", связанному с изменением освещения, позволяет получить 1Dизображение в оттенках серого, инвариантное к освещению.а)60б)в)Рис.
2.10. а) таблица Макбета для проверки цветов; б) представление в логарифмическойцветности 24 цветов; в) средние значения для 6 цветов при 10 различных источниках света,подчиняющихся закону Планка61Следует отметить, что инвариантное направление отличается длякаждой камеры. Оно может быть определено из калибровки (графиков,подобных рис. 2.10в). В работе будет описан метод восстановленияправильного направления из одного изображения и без калибровки.Давайте проясним, как это линейное поведение с результатамиизменения освещения является следствием предположений выполнениязакона Планка для освещения, ламбертовости поверхности и узкополосностикамеры.Рассмотрим канал R изображения в кодировке RGB для источникасвета со спектральной мощностью E(λ), освещающего поверхность сотражающей функцией S(λ).
Если для всех трех каналов чувствительностькамеры можно обозначить как Q (λ), то получим:Rk E(λ)S(λ)Qk (λ)dλ, k R, G, B .Если функция Qk ( ) – дельта функция Дирака Qk qk ( k ) , тогдауравнение 1 можно переписать:Rk E (k ) S (k )qk .(2.2)Теперь предположим, что освещение может быть описано закономПланка, тогда в приближении Вина [101]:E ( , T ) IС1 5eС2T,где С1 и С 2 – константы, температура T – характеризует цвет освещения, а I –общую световую освещенность.В этом приближении (2.2) можно переписать:Rk IС1 5eС2TS (k )qk .Для простоты обозначим k = 1,2,3.Введем коэффициенты c62(2.3)ck Rk / R p ,(2.4)где – один из каналов, а k = 1,2 индексы остальных цветов.
Если возьмем = 1 (т. е. будем делить на Red (красный) канал), то получим коэффициентыc1 G / R b и c2 B / R . Из уравнения (2.3) можно заметить, что формированиецветности эффективно удаляет информацию об интенсивности и затенении.Если взять log от (2.4), где sk С1k5 S (k )qk и ek С2 / k , то получим: sk sp k log ck log Уравнение(2.5) (ek e p ). Tпредставляет(2.5)собойпрямуюлинию,параметризованную Т.
Обратите внимание, что вектор направления (ek e p )не зависит от поверхности, хотя линия для конкретной поверхности имеетсмещение, которое зависит от sk .Инвариантноеизображениеможетбытьсформированопутемпроецирования log цветности, k , k = 1,2 в направлении e , ортогональнойвектору e (ek e p ) .
Результат этой проекции – скаляр, который затем будетзакодирован в оттенках серого значения.Полезность этого инвариантного изображения заключается в том, что,так как тени получаются в значительной степени от освещения и имеетдругую интенсивность и цвет (температура T) от освещения, падающего нанезатенѐнные части сцены, тени эффективно удаляются с помощью этойпроекции.
Эта проекция несет исключительно служебные функции.Очевидно,чтоесликалиброватькамерупутемопределенияинвариантного направления, то можно заранее знать, что проецирование внаправлении e производит инвариантное изображение. Чтобы сделать это,находим направление средних значений вычитающихся p для целевыхцветовых пятен с минимальным разбросом дисперсии [81].
Тем не менее,еслиестьодноизображение,63тонеимеетсявозможности для калибровки. Однако, если есть изображение с неизвестногоисточника, то хотелось бы быть в состоянии удалить с него тени. Вследующем разделе будет показано, что автоматическое определениеинвариантного направления действительно возможно2.5.2. Калибровка изображения методом минимизации энтропииРассмотрим, как этот метод можно применить к обработке реальныхизображений.Среднее геометрическое инвариантного изображенияИз уравнения (2.3) можно убрать параметры σ и I делением на цветлюбого канала.
Какой канал лучше выбрать? Если поделить на R канал, томожно оказаться в затруднении, т. к. его чаще всего меньше, чем остальных,как, например, на фотографиях травы. Лучший подход к решению проблемы– использование среднего геометрического3R G B [75]. Тогда сохраняетсяпрямолинейность графика в пространстве log, но не в пользу одногоконкретного канала.Таким образом, перепишем выражения (2.10, 2.11) для цветности:3ck Rk / 3 Ri Rk / RM .(2.6)iИ log-версия [75]: sk ek eM, k 1..3 ,T sM k log ck log sk С1k5 S k qk ,sM (2.7)33sj,i 1ek С2k,64eM С233 ,jj 1и на данный момент имеются все три (таким образом, не являющихсянезависимыми) компоненты цветности.Среднее геометрическое 2D пространства цветностиСледует использовать 2D пространство цветности, соответствующеецветовому пространству ρ.
Отметим, что в log-пространстве, ρ ортогональноu 1/ 3 (1,1,1)T . То есть ρ лежит в плоскости, ортогональной u, как показано нарис. 2.11, u 0 . Для описания 2D пространства рассмотрим проекцию Puна плоскость.Рис. 2.11. Среднегеометрический делитель означает, что любое ρ ортогонально u.Базис в плоскости {χ1, χ2}Pu имеет два не нулевых собственных значения, таким образом:Pu I uu T U T U ,где U – ортогональная матрица 2x3. U вращает вектор ρ в системе координатна плоскости:65 U ,(2.8)где χ – матрица 2x1.Прямая в системе координат ρ остается прямой и в системе координатχ.В плоскости {χ1 , χ 2 } опять вернемся к ситуации, похожей на ситуацию срис. 2.9: нужно найти правильное направление θ, которое при проецированиина плоскость, даст минимум энтропии предельного распределения вдоль 1Dпроекции линии, ортогональной направлению света.