Диссертация (1149687), страница 3
Текст из файла (страница 3)
Список литературы содержит 88 наименований.13Глава 1. Оценка положения объектов при помощи камерыВ этой главе рассматривается историческое развитие методов трехмерной реконструкции по фотографиям и видео, вводятся основные определения имодели, описываются используемые в указанных задачах алгоритмы компьютерного зрения.1.1Трехмерная реконструкция при помощи фото и видео камерЗадача понимания структуры трехмерного мира по фотографиям возникла практически вместе с появлением первых из них и с течением времени развилась в отдельную область науки - фотограмметрию. Ее развитие обычно разделяют на четыре этапа:–мензульная фотограмметрия,–аналоговая фотограмметрия,–аналитическая фотограмметрия,–цифровая фотограмметрия.Первыми ее задачами были задачи из области картографии.
Фотосъемка предоставляла удобный способ фиксировать удаленные объекты и измерятьрасстояния до них, после чего наносить их на карты. В середине 19го века былиразработаны первые фототеодолиты, представляющие собой теоделит (устройство для определения горизонтальных и вертикательных углов) и совмещеннуюс ним фотокамеру [62]. Это устройство позволяло определять расстояния дообъектов при помощи их фотографирования из нескольких точек с известнымикоординатами. Используя показания теодолита и известные расстояния междуточками съемки, фотографии из них совмещались в одной плоскости, после чего14графическими методами на основе правил стереозрения наблюдаемые объектынаносились на карту .Также в это же время начались первые эксперименты с аэрофотосъемкой, которая аналогично использовалась для создания карт местности [31].
Вто время она осуществлялась при помощи воздушных шаров, что существенно ограничивало возможности по фотографированию больших площадей. Ноуже в начале 20го века с осуществлением первых успешных полетов на самолете, аэрофотосъемка приобрела большую популярность и стала повсеместноиспользоваться для целей картографии. Для точного определения расстоянийпо снимкам в ней стали использовать стереоскопию [72], т.е. использование двухи более камер для последующей трехмерной реконструкции. Были созданы первые устройства, использующие эти снимки и позволяющие практически автоматически строить по ним карты местности [39] (стереокомпаратор К. Пульфриха).С появлением компьютера в середине 20го века стала развиваться областьаналитической фотограмметрии.
Были разработы строгие методы наименьшихквадратов для решения задач оценки координат точек по фотоснимкам [25],калибровки камеры и оптических искажений [33; 39]. Начали появлятся методыодновременной подстройки положений камер и координат наблюдаемых объектов на основе алгоритмов уравнивания связок [34]. С более широким распространением компьютеров связано появление области цифровой фотограмметрии. В конце 20го века стали появляться программные системы для обработкифото снимков, позволяющие производить все фотограмметрические задачи накомпьютере. Также повышающаяся разрешающая способность фотоаппаратомпозволила существенно повысить точность оценок.С увеличением доступности компьютеров и цифровой фототехники связано распространение методов оценки координат объектов по изображениям вдругие прикладные области.
В первую очередь сейчас они используются в роботехнике, где камеры стали одним из основных источников данных для нави-15гации роботов. Современные методы восстановления структуры наблюдаемойсцены [2; 42; 60] позволяют на основе изображений, получаемых с видеокамеры с достаточной частотой, строить плотные карты статичного окружения [73].Методы уравнивания связок развились в системы, позволяющие по тысячамразрозненных фотографий из интернета строить трехмерные картины различных популярных объектов (фотографии которых сделаны обычными пользователями) [79].
Кроме подходов, основанных на алгоритмах уравнивания связок,существуют методы фильтрации, которые задают модель наблюдения камеройв виде динамической системы и дальше используют различные фильтры типафильтра Калмана [22; 23; 57; 58] для итеративного обновления оценок параметров этой модели, которые включают в себя положения камеры и окружающихее объектов [82]. Также существуют подходы к трехмерной реконструкции нетолько статичной сцены, но и движущихся объектов.
Основным направлением в этой задаче является использование нескольких синхронизированных камер (в простейшем случае двух [70]). Данные камеры должны быть жестко закреплены, и их взаимные расположения должны быть заранее известны. Знаяположения камер и координаты проекций некоторой точки на плоскости всехкамер, трехмерное положение этой точки можно реконструировать методамианалитической фотограмметрии [77]. Такие системы применяются в различныхприложения для автопромышленности, трехмерного сканирования и т.п.Также для решения задачи с движущимся объектом существуют решения для некоторых специфичных случаев, позволяющих оценивать координатыобъекта с использованием лишь одной камеры. Так, зная что все интересующиеобъекты движутся в некоторой плоскости и зная положение этой плоскости относительно камеры, можно использовать методы проективной геометрии дляоценки координат объекта [83].
Кроме этого существуют алгоритмы для оценки?положения объекта в случае, когда он движется с постоянной скоростью [ ]. Такие алгоритмы могут найти приложения в задачах наружного наблюдения, гдезачастую наблюдение ведется за некоторой плоскостью, или в задачах наблюде-16ния за автопотоком, где можно сделать предположение о постоянной скоростидвижущихся автомобилей.1.2Проективная модель наблюдения камеройОбычно в задачах оценки координат объекта при помощи камеры в качестве модели наблюдения используют “стеноп модель” [53] c камерой, у которойобъектив представляется как маленькое отверстие в некотором светонепроницаемом ящике с светочувствительным элементом внутри. В этой схеме получаемоеизображение полностью определяется положением отверстия, расстоянием отсветочувствительного элемента до отверстия и его ориентацией.
Плоскость, вкоторой находится светочувствительный элемент называют плоскостью камеры, отверстие оптическим центром камеры, а расстояние от элемента до отверстия фокусным расстоянием камеры. Обозначим завектор координат оптического центра, заа за ∈ R3×3 = ( (1) , (2) , (3) )величину фокусного расстояние,матрицу поворота, задающую ориентацию плоскости камеры.Матрица поворота и координаты оптического центра задают преобразованиеиз некоторой фиксированной глобальной системы координат в локальную систему координат камеры. Также здесь и далее будем использовать следующиеобозначения:ных чисел,·— операция транспонирования,R— пространство веществен-— символ математического ожидания.Для простоты будем считать, что наблюдаемым объектом в нашей моделиявляется некоторая точка. При наблюдении этой точки при помощи камеры, ееизображение будет также представлять собой некоторую точку, которую мы будем называть проекцией объекта на плоскость камеры. Также введем понятиеобласти видимости камеры, ей мы будем называть область в пространстве, длякоторой проекции объектов, находящихся в ней, попадают в область плоскости17Рисунок 1.1 — Модель камеры.камеры, ограниченной физическими размерами светочувствительного элемента.
Опишем теперь математически каким образом связаны трехмерные координаты объекта с координатами его проекции в плоскости камеры.Пусть = ( (1) , (2) , (3) )это вектор координат положения объекта.Для того чтобы найти проекцию точкисти из точкина плоскость камеры, нужно прове-луч, проходящий через оптический центр . Искомой проекциейбудет та точка, в которой этот луч пересечет плоскость камеры. На рис.
1.1 схематично изображен весь процесс для случая с единичной матрицей поворота.Для нахождения координат проекции на плоскость камеры = ((1) , (2) )мож-но воспользоваться простыми свойствами подобных треугольников. Рассмотрев18подобные треугольникии′ ′ ,получаем(2) = Аналогично выводим(1)(1) = (3) . (2). (3)Если матрица поворота не единичная, тосоответствующие уравнения имеют видгде вектор(1)11 (1) + 12 (2) + 13 (3) + (1)=,31 (1) + 32 (2) + 33 (3) + (3)(2)21 (1) + 22 (2) + 23 (3) + (2)=,31 (1) + 32 (2) + 33 (3) + (3)((1) , (2) , (3) ) = −−1 ( (1) , (2) , (3) ) .Камеры, используемые на практике, редко полностью удовлетворяютпредставленной модели из-за использования линз.
Линзы могут вносить заметные и существенные оптические искажения, которые обычно называют дисторсией. Особенно заметны эти искажения на изображениях, полученных с использованием широугольных объективов. Изображения с дисторсией в оригинальном виде неприемлемы для любых задач трехмерной реконструкции, поэтомупредварительно дисторсию убирают при помощи разного рода методов калибровки камеры. Разделяют несколько типов дисторсии по характеру их влиянияна изображение [87]:–дисторсия по типу “бочка” уменьшает изображение по мере увеличениярасстояния от оптического центра (положительная дисторсия),–дисторсия по типу “подушка” увеличивает изображение по мере увеличения расстояния от оптического центра (отрицательная дисторсия).Для корректировки искажения используют различные модели дисторсии, которые чаще всего представляют собой нелинейный модели корректировки координат проекций.