Диссертация (Цифровая обработка телевизионных изображений для обнаружения препятствий на подстилающей поверхности в условиях фотометрических искажений), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Цифровая обработка телевизионных изображений для обнаружения препятствий на подстилающей поверхности в условиях фотометрических искажений". PDF-файл из архива "Цифровая обработка телевизионных изображений для обнаружения препятствий на подстилающей поверхности в условиях фотометрических искажений", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Изображение I вградациях серого вдоль этой линии можно записать как:I χ1 cos θ χ 2 cos θ .Энтропия будет определяться: pi ( I )log( pi ( I )) .i(2.9)Основная идеяТаким образом, основная идея метода:1.Формируем 2D представление log-цветности изображения.2.Для θ от 1 до 180:1.Рассчитываем изображение в градациях серого I: проекция в1D направление.2.Считаем энтропию.3.Направление с минимальной энтропией – правильноенаправление для удаления тени.3.Полный перебор θ производится только при старте системы.4.На каждом последующем изображении анализируется небольшаяокрестность угла θ, который был определен на предыдущемизображении.663-х векторное представлениеПосле нахождения θ, можно вернуться назад к 3-х векторномупредставлению точек проекции линии через оператор 2 2 P .
Сформируемспроецированный 2-х мерный вектор χ θ через χ θ Pθ χ , а потом вернемся .назад к оценке (отмечено тильдой) 3D вектора ρ и c через ρ U T χ θ , c exp(ρ)Для отображения перейдем от служебного изображения, отвечающего заотражение, к изображению, содержащего освещение. Добавим столько e,чтобы средняя яркость 1% пикселей имела 2D цветность исходногоизображения χ θ χ θ χ extraligth .2.5.3. Алгоритм восстановления служебного изображенияШаги алгоритмаРассмотрим цветное изображение на рис. 2.12а: человек освещен сзадисильным светом.
Кроме того, освещение создает область, в которой естьотличныеотнуляRGBсоставляющиепиксели.Таккаккамеракалиброванная, то неизвестно даст ли метод минимума энтропии правильныйответ. Чтобы найти минимум энтропии снова проанализируем проекцию I от00 до 1800 через log-цветности χ согласно уравнениям (2.6), (2.7) и (2.8). Длякаждого угла спроецируем log-цветности и определим энтропию (2.9).
Тем неменее, характер данных реальных изображений имеет свои проблемы. Наизображении есть шумы, а мы имеем дело с отношениями, и это можетповлиять на результат. Начнем с того, что применим фильтр Гаусса кцветовым каналам исходного цветного изображения. Но даже после этогоможно ожидать, что некоторые показатели могут быть большими.
Такимобразом, остается вопрос, что следует использовать в качестве диапазона ичисла колонок на гистограмме изображения в градациях серого I.Далееможноопределитьдиапазонзначенийинвариантногоизображения в градациях серого для каждого угла. График этого диапазонадля каждого угла изображен на рис. 2.12б. Пунктирной линией отображаетсялиния для 5-процентилей, сплошная – для 95 перцентилей. Видно, что67полный спектр содержит много выбросов.
Поэтому имеет смысл исключитьэти выбросы из рассмотрения.Таким образом, используем только средние значения (средние 90%данных) для построения гистограммы. Для формирования соответствующейширины столбца на гистограмме, используем правило Скотта [94]h 3.5 N 1/3 ,где N – размер данных инвариантного изображения для конкретного угла, h –ширина столбца гистограммы. Обратим внимание, что этот размер различендля каждого угла, так как исключена разница в выбросах для каждойпроекции.а)68б)Рис. 2.12. а) входное изображение; б) Диапазон проектируемых данных изменяется суглом. Диапазон: сплошные линии для 5 перцентилей, пунктирные линии для 95перцентилейПосле того как оценено с геометрического среднего цветности (2.6),можно перейти к более известной L1 цветности, определяемой:r r , g , b R, G, BRG B,r g b 1.Это наиболее знакомое представление цвета, независимое от величины.Чтобы получить L1 цветность r из с, нужно:3r c / ck .k 169(2.10)Так как r[0,1] , то инвариантное изображение в r лучше, чем I.Изображение в градациях серого I для примера показано на рис.
2.13б, аизображение в L1 цветности для r, определенной через (2.10), показано нарис. 2.13в.Для восстановления изображения использовался метод, описанный в[76]. Он состоит из 2х частей: нахождения маски тени и восстановленияисходного изображения. Первый шаг выполняется путем сравненияисходного изображения с инвариантным изображением с помощью методикиMean-Shift [72]. Ищем пиксели, которые имеют значения выше, чем порогдля любого канала в оригинальном изображении, и ниже другого порога винвариантном изображении, в котором уже нет тени. Эти пикселипомечаются как пиксели края тени, затем утолщаем полученное изображениес помощью морфологических операций.
На втором этапе, для каждого каналаlog-цветности, увеличиваем градиент на границах по всей теневой маске,используяитерационноерасширениемаскиизаменунеизвестныхпроизводных величин на среднее известных. Затем формируем вторуюпроизводную, переводя изображение в пространство Фурье и деля наоператора Лапласа, и возвращаемся к пространству х, у. Граничные условияНеймана оставляют неизвестную аддитивную постоянную в каждойвосстановленной точке, поэтому восстанавливаем теневую область до техпор, пока цвета на краях не будут совпадать с исходным изображением.2.6. Навигация в помещенииВ работе основное внимание уделено алгоритму обнаруженияпрепятствий.
Но хочется сказать несколько слов о том, как определялось своеместоположение и местоположение конечной цели.70а)б)в)71г)Рис. 2.13. а) Зависимость энтропии проектируемого изображения от угла; б) инвариантноеизображение в градациях серого I; в) инвариантное L1 цветное изображение r;г) восстановленное RGB изображение2.6.1.
Использование цветовых маяковПример работы системы позиционирования по цифровым маякамприведен на рис. 2.14, где объект позиционирования O может определитьсвоѐ местоположение на основе заранее заданных цифровых маяков A, B и C.Координаты(X, Y, Z)B (x2, y2, z2)A (x1, y1, z1)С (x3, y3, z3)OРис. 2.14. Обобщенная схема позиционированияСуществует большое количество систем, позволяющих организоватьнавигацию внутри помещения:721.Метод радиоотпечатков сигналов точек доступа Wi-Fi.2.Позиционирование по Bluetooth-маякам [77, 84].3.Инфракрасное позиционирование.4.Ультразвуковое позиционирование.5.Решения на основе радиочастотных меток (так называемых RFID-меток).Технологии 1) и 2) по решению задачи позиционирования в помещенииимеютбольшуюпогрешностьиз-затого,чтосильноподверженыпереотражениям радиосигналов и наводкам от различных радиопомех отвнешних источников [2, 25, 42, 46].
Подходы 3) и 4) имеют высокуюточность позиционирования, но сильно подвержены помехам. Вдобавок, прифункционировании системы в больших закрытых пространствах: складскиетерминалы, торговые центры, аэропорты и др. – нужно большое числомаяков. Это обусловлено их малой дальностью действия, что может повлечьза собой большие экономические затраты. Кроме того, такие маяки, как и вподходах 1) и 2), нуждаются в постоянном электропитании.
Подобныйфактор может быть тоже экономически невыгодным в зависимости отнеобходимого времени работы системы.Проведенный анализ показал, что наиболее надежной технологией длянавигации в помещении является использование систем прикладноготелевидения.Для ориентации в пространстве использовались цветовые маяки. Онипредставляют собой комбинацию из трех различных цветных областей,расположенных близко друг к другу на одной линии (рис.
2.15). В качествецветных областей можно использовать различные предметы, это могут бытьи наклейки разных цветов, нанесенные на одну поверхность. Маяк так жеможет быть изготовлен с использованием одной наклейки.73Рис. 2.15. Пример цветового маякаПоказанное на рис. 2.15 число цветных областей используется вупрощенной версии для проверки работоспособности разрабатываемыхалгоритмов и оптимизации их работы.Стоит сказать, что масштаб системы определяется числом цветовыхобластей. Если считать, что каждый цветовой маяк уникален и имеетизначально заданные координаты, то логично, чтобы он был уникальными ис точки зрения цветовой кодировки.
Легко подсчитать, что количествовозможных уникальных маяков равно числу перестановок цветных областей:N k !.При разработке на маяки были наложены следующие жесткиеограничения, определяющие работоспособность алгоритма [9, 33]:все три цвета на маяке должны быть визуально хорошоразличимы;центры цветных областей должны располагаться на одной прямойи должны быть равноудалены друг от друга;поверхность маяков должна быть матовой, чтобы избежать бликов.Также вертикальное расположение маяков является предпочтительным,так как расстояние между цветными областями не будет меняться приперемещении автономной платформы по горизонтали.Работу алгоритма распознавания по цвету можно описать с помощьюследующих шагов:74Каждый кадр потокового видео сначала проходит фильтрацию длясглаживания дефектов изображения и устранения «шумов».
Для этогоиспользуется фильтр Гаусса с маской 5×5. Данный метод фильтрациидостаточно быстр и эффективен в борьбе с «помехами» на изображении.Изображение конвертируется из цветовой модели RGB (красный,зеленый, синий) в модель HSV (оттенок, насыщенность, яркость). Этосделано с целью облегчить дальнейшую обработку изображения, так как вHSV легче работать с цветами.Для каждого из каналов HSV применяется гладкая непрерывнаяфункция: длянасыщенности и яркости – логистический сигмоид сварьируемыми параметрами кривизны k и смещения Δ [73]:f ( x) 255,1 exp(k ( x m ))а для оттенка – гауссов колокол с варьируемой дисперсией D:f ( x ) 255 exp( ( x m) 22D),где m – это значение соответственно насыщенности, яркости или оттенка,полученное на этапе обучения алгоритма.
В качестве выходного значенияфункции получаем три изображения в градациях серого со значениямипикселей от 0 до 255.Использование плавно изменяющихся функций вместо «пороговых»оправдывается повышением стабильности и устойчивости работы алгоритма[6].Расчѐт экспонент на каждом кадре является весьма затратнойоперацией и может сильно тормозить работу алгоритма.