Диссертация (Автоматическая сшивка радиолокационных изображений земной поверхности при неизвестных элементах внешнего ориентирования), страница 9
Описание файла
Файл "Диссертация" внутри архива находится в папке "Автоматическая сшивка радиолокационных изображений земной поверхности при неизвестных элементах внешнего ориентирования". PDF-файл из архива "Автоматическая сшивка радиолокационных изображений земной поверхности при неизвестных элементах внешнего ориентирования", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 9 страницы из PDF
В этой связи невозможно построение алгоритма, для которого будетсправедлив первый критерий оптимальности (22) в виде равенства.Отсутствие информации об элементах внешнего ориентирования игеографической привязке обрабатываемых РЛИ земной поверхности затрудняетвыбор СК искомой единой радиолокационной карты так, чтобы ее плоскость былапараллельна плоскости земной поверхности для точного выполнения второгокритерия оптимальности (23).В этой связи в дальнейшем будем искать квазиоптимальный автоматическийалгоритм сшивки РЛИ земной поверхности, минимизируя функционалы первого ивторого критериев оптимальности.2.3.2 Автоматический поиск опорных точек на перекрывающихся РЛИВ подразделе 1.4 рассмотрены различные алгоритмы автоматическогопоиска опорных точек интереса, среди которых выделены алгоритмы выявления иописания точек интереса SIFT и SURF с последующим сравнением ихдескрипторов с помощью алгоритма поиска ближайшего соседа.55Рассмотрим два РЛИ земной поверхности I1 и I2 с одинаковой разрешающейспособностью, на которые попал один и тот же участок местности, наблюдаемыйпод разными углами в азимутальной плоскости.
Изображение I1 будем считатьисходным, а I2 – изображением с повернутой относительно I1 семантикой.Алгоритм SURF значительно быстрее и значительно менее требователен кдоступному объему ОЗУ ЭВМ в сравнении с SIFT, однако обладает уязвимостью кповоротусемантикиуменьшениюизображения,количестванайденныхкотораяприводитопорныхточекксущественному(рисунок1.6)приприближении угла поворота семантики к значениям:πnα П= π +, n∈ℤ .4 2(26)При малом перекрытии двух РЛИ данная уязвимость может привести к егонеобнаружению при вышеописанных углах поворота, что недопустимо.Анализ работы алгоритма SURF (подраздел 1.4.1) показывает, что искомаяошибка может появляться на этапах поиска точек интереса и вычисления ихориентации.Действительно, авторы алгоритма SURF в [68] показывают снижениеколичества повторно найденных точек интереса на I2 по отношению I1 взависимости от угла поворота семантики изображения на этапе поиска точекинтереса (рисунок 2.4).
Величина, равная отношению количества повторнонайденных точек интереса в области перекрытия на РЛИ I2 к числу точек интересав области перекрытия на РЛИ I1, встречается в литературе под названиемповторяемостьточекинтереса. Показанноена рисунке2.4 снижениеповторяемости точек интереса несомненно вносит вклад в наблюдаемуюуязвимость, однако не объясняет ее столь резкого спада при приближении углаповорота семантики к значениям (26).56Рисунок 2.4 – Снижение повторяемости точек интереса при повороте семантикиизображенияНа этапе определения ориентации точки интереса вычисление двумерноговейвлет-преобразования Хаара (рисунок 1.4) жестко привязано к СК изображения,поэтому области семантики, попавшие под вейвлет-преобразование в одной и тойже точке местности на РЛИ I1 и I2, совпадают не полностью.
На рисунке 2.5, асерым отмечены области семантики, попавшие в зону вейвлет-преобразованияХаара на обоих изображениях, при угле поворота в π/4, в то время как чернымизображены примеси – области, попавшие в зону преобразования на одномизображении, но не попавшие на другом. В силу наличия примесей значениевейвлет-преобразования для одной и той же точки местности на двухрассматриваемых изображениях будут отличаться, что может привести кошибочному вычислению ориентации точки интереса и, как следствие, еедескриптора. Действительно, зависимость площади примесей от угла поворотасемантики, показанная на рисунке 2.5, б, обратна зависимости количестванайденных совпадений среди точек интереса от угла поворота семантики(рисунок 1.6).57а)б)Рисунок 2.5 – Примеси областей, не попавших в зону вейвлет-преобразованияХаара, при угле поворота семантики изображения 450 (а, обозначены черным) изависимость доли примесей от угла поворота семантики изображения (б)Для ослабления наблюдаемой уязвимости необходимо уменьшить площадьпримесей при всевозможных углах поворота семантики в процессе вычислениядвумерного вейвлет-преобразования.
В случае с применяемыми двумернымивейвлетами Хаара, зона преобразования представляет собой квадрат состороной 4s (параметр s, характеризующий масштаб, был введен в рамкахописания работы алгоритма SURF в подразделе 1.4.1).Идеальной формой в данном случае является круг, так как круглая зонапреобразования совсем не содержит описанных примесей при любом углеповорота. Однако, применять «круглый вейвлет Хаара» нецелесообразно, так как спомощью интегральных изображений, оптимизацию под которые делают авторыалгоритма SURF, вычислять круглые области затратно по времени. Хранение жевместе с интегральными изображениями исходных позволило бы ненамного58ускорить процесс, но в два раза увеличило бы необходимый для работы алгоритмаобъем оперативной памяти, что также неприемлемо.Значительную роль при выборе формы искомого вейвлета также играет фактдискретизации изображения.
РЛИ с высоким разрешением обладают высокойдетальностью, что приводит к тому, что большинство точек интересаобнаруживаются на масштабе s = 2, сторона двумерного вейвлета Хаара при этомимеет длину 8 пикселей (рисунок 1.4).Принимая во внимание вышесказанное, было решено использоватьсоставные вейвлеты Хаара в виде, приведенном на рисунке 2.6 [79].а)б)в)г)Рисунок 2.6 – Составные вейвлеты для горизонтального (а) и вертикального (в)двумерных вейвлет-преобразований и примеси в них при угле поворота семантики450 (б и г, соответственно)Зонапреобразованияпредлагаемогодвумерноговейвлетапозволяетохватить всю область, запланированную авторами алгоритма SURF для вейвлетпреобразования, при любом значении угла поворота семантики. Явныйпрямоугольный характер зоны преобразования позволяет применять интегральныеизображения для вычисления вейвлет-преобразования с новым вейвлетом, что недолжно сильно сказаться на суммарном времени работы алгоритма.
Вертикальныйи горизонтальный вейвлеты покрывают разные области изображения, не дублируя«примеси» на вытянутых крайних «отростках» вейвлета, но дублируя области,гарантировано попадающие в зону преобразования при любом угле поворота59семантики. На рисунке 2.7 показано, что новый вейвлет позволяет значительноуменьшить долю примесей.Рисунок 2.7 – Зависимость доли примесей от угла поворота семантикиизображения при использовании двумерного вейвлета Хаара (обозначена точками)и предлагаемого двумерного вейвлета (обозначена треугольниками)Алгоритм SURF изначально проектировался для обработки оптическихизображений, а именно фотографий. Различные размеры по вертикали игоризонтали элементов разрешения у фотографий встречаются только присильных проективных искажениях, поэтому пирамида изображений алгоритмаSURF содержит только копии исходного изображения, уменьшенные одинаковокак по вертикали, так и по горизонтали.60Для РЛИ земной поверхности подобная картина встречается гораздо чаще.В этой связи целесообразно добавление в пирамиду изображений копий исходногоизображения, уменьшенных в различное число раз по вертикали и горизонтали(например, сжатое в 2 раза по вертикали, но в 4 раза по горизонтали).
Данныйподход увеличит время обработки изображения, однако даст бóльшее количествоопорных точек в описанном случае.Длясопоставлениядескрипторовточекинтересанаразличныхизображениях целесообразно применять алгоритм поиска ближайшего соседа спомощью k-мерного дерева, подробно описанный в подразделе 1.4.3 [80].2.3.3 Количественная характеристика насыщенности семантики РЛИИскомая характеристика качества РЛИ должна абсолютно и количественнооценивать насыщенность семантики изображения, а также быть устойчивой кшуму, в то время как ее вычисление на современных ЭВМ не должно заниматьмного времени.Для построения алгоритма вычисления искомой характеристики будемотталкиваться от подхода, рассмотренного в [62], который основывается напроцедуре поиска точек интереса на изображениях в рамках решения задачисопоставления изображений.
Наличие таких точек интереса будем воспринимать,как показатель насыщенности семантики изображения — чем больше точекинтереса, тем насыщеннее изображение.Как и в используемом нами модернизированном алгоритме SURF, длянахождения точек интереса, в соответствии с данным подходом, на пирамидахизображений I(x,y) с различной степенью размытости (σ) фильтром Гауссанеобходимо найти локальные максимумы детерминанта матрицы Гессе (4).Применение схожего подхода позволяет дать более корректную оценкунасыщенности семантики изображений с точки зрения разрабатываемогоалгоритма сшивки, что приведет к установке наиболее корректных требований ко61входным РЛИ на основе искомой характеристики. Благодаря использованиюфильтра Гаусса, данный подход устойчив к шуму на изображении, в частности, кспекл-шуму на РЛИ земной поверхности.Для быстрого вычисления первых производных изображения применяютоператоры Превитта [69]:‖‖ ‖‖−1 0 1111M x = −1 0 1 , M y = 000 .−1 0 1−1 −1 −1(27)Вычисление первой производной происходит путем свертки окрестностикаждой точки изображения с масками (27).
Вычисление второй производнойизображения, как требуется в (4) и (5), достигается повторением процедуры. Двухопераций свертки можно избежать, рассчитав композитные матрицы на основематриц (27). Кроме того, для анализа большей окрестности каждой точкиизображения увеличим размер данных матриц.
Полученные матрицы для расчетавторых производных размерностью 9x9 показаны на рисунке 2.8.Рисунок 2.8 – Композитные матрицы для поиска вторых производных dydy (а) иdxdy (б). Серые элементы равны 0. Поиск второй производной dxdx производитсяс помощью транспонированной матрицы dydy62Полученныематрицыподходятдляиспользованияинтегральныхизображений, что значительно ускорит вычисление второй производной.Для выделения более значимых точек следующим этапом выполнимпороговую фильтрацию полученных локальных максимумов, отсеивая значенияменьше T. Точки интереса с большим значением максимума в [62] считаютсяболее существенными.Искомый показатель насыщенности семантики изображения S (от лат.satietatem — насыщенность) вычисляется путем подсчета оставшихся послевышеописаннойфильтрацииточекинтереса.Такимобразом,показательнасыщенности семантики S зависит от следующих факторов:– собственно, насыщенность семантики изображения;– величина порога T;– количество уменьшенных копий в каждой пирамиде изображения Np;– величины параметра фильтра Гаусса σ в различных пирамидах изображения;– площадь изображения (чем больше площадь при том же характересемантики, тем больше точек интереса).Примем в дальнейшем, что при сравнении насыщенности семантики двухизображений их характеристики S были вычислены при одинаковых значениях Т,Np и величинах σ в пирамидах изображений.Зависимость S от площади обрабатываемого изображения не позволяетполноценно сравнивать насыщенность семантики двух изображений различногоразмера.