Диссертация (1149687), страница 4
Текст из файла (страница 4)
Достаточно популярной является представленная в [33] модель,19по которой корректировку проводят по правилу:(1)2(2)2242(1)(1) (2)24 = (1) (1+1 +2 +...)+(2 ( +2 )+21 )(1+3 +4 +. . .),242(2)(1) (2)24 = (2) (1+1 +2 +...)+(2 ( +2 )+21 )(1+3 +4 +. . .),(1)(2)( , )где(1)(2)( , )—координатыпроекции— искаженные координаты,без оптических√︁(1)(2) = ( )2 + ( )2 .искажений,аКоэффициенты1 , 2 , .
. . , 1 , 2 , . . . называют коэффициентами дисторсии, их количество регулирует точность получаемой модели. Вместе с фокусным расстоянием эти коэффициенты называют внутренними параметрами камеры. Положение центракамеры и матрицу поворота называют внешними параметрами камеры. Внутренние параметры считаются фиксированными на все время процесса наблюдения, и их обычно вычисляют заранее при помощи процесса калибровки. Длякалибровки можно воспользоваться объектом с заранее известной трехмернойструктурой, например, шахматной доской (pис.
3.12). Используя методы автоматического детектирования точек шахматной доски [40] и известные размерыклеток, можно подобрать внутренние параметры, минимизируя ошибку перепроектирования(1)(1)(2)(2)( − ˆ )2 + ( − ˆ )2 ,где(1)(2)( , )доски, а(1)— координаты проекции, возвращаемые детектором шахматной(2)(ˆ , ˆ )— их оценка, получаемая с помощью текущих значенийвнутренних параметров. Такого рода подход к калибровке описан в [88].Внешние параметры камеры можно также вычислить при помощи объектов с известной геометрией в сцене, но такой подход будет малопрактичным. Поэтому чаще используют методы, которые одновременно с оценкой внешних параметров камеры оценивают положение видимых статических объектов.
Стандартная схема подхода такого рода описана в [60]. В дальнейшем при формулировке алгоритмов будем предполагать, что все внутренние и внешние парамет-20ры камеры известны. При этом для упрощения будем считать, что матрица поворота камеры, ее фокусное расстояние и коэффициенты дисторсии единичные.Это не умаляет общности, т. к. предварительно можно исправить все оптические искажения, используя рассмотренную выше модель, поделить координатынаблюдаемых проекций на фокусное расстояние, а из матрицы поворота получить проективное преобразование для координат проекций, приводящее их кслучаю с единичной матрицей поворота [35; 53].
Методы калибровки и вычисления положений камеры будут подробно описаны в третьей главе при описанииразработанного в рамках исследования программного комплекса.1.3Методы трехмерной реконструкцииДля восстановление трехмерной структуры наблюдаемого окружения существует несколько подходов. Самыми простыми из них являются методы, основанные на использовании одиночных фотографий, которые позволяют определять расстояния и формы объектов, исходя из некоторых предположений оих трехмерной структуре [41].Так, к примеру, зная что все наблюдаемые объекты находятся в плоскости,можно построить проективное преобразование из этой плоскости в плоскостькамеры, после чего пользоваться им для целей отображения точек на изображении в точки реальной плоскости [45].
Это проективное преобразование обычностроится, исходя из знания некоторого набора соответствий между точками реальной плоскости и плоскости изображения. Если к тому же известен наборпараллельных прямых в наблюдаемой сцене и набор их изображений в плоскости камеры, можно измерять вертикальные размеры объектов в плоскости припомощи методов точек на бесконечности [36; 37]. По известному набору точек стрехмерными координатами и набору их проекций, можно восстановить поло-21жение съемки в который был сделан снимок, после чего использовать эти данные для оценки расстояний до других объектов.
Кроме трехмерной реконструкции методы, использующие одиночные фотографии, могут применяться для более наглядного отображения наблюдаемых объектов. Уже упомянутые методыпроективного преобразования плоскости изображения в реальную плоскость,часто используются в рекламных целях при трансляции спортивных мероприятий, когда плоское изображение рекламы отображается на изображении матчатаким образом, что кажется, что оно находятся прямо на поле.
Аналогичныеметоды используются во множестве приложений дополненной реальности [26].Но все же, подходы, основанные на алгоритмах стереозрения, наиболее часто используются для решения задач трехмерной реконструкции на практике.Для того чтобы их успешно использовать, необходимо знать координаты проекций наблюдаемого объекта, полученные съемкой с как минимум двух ракурсов.В качестве изображений объекта можно использовать как кадры видеопотока камеры, которая совершает движение, так и обычные фотографии. Такженеобходимо достаточно точно знать взаимное расположение ракурсов съемки иих калибровочных параметров. В дальнейшем описании существующих методов стерео реконструкции мы будем называть различные ракурсы, в которыхпроизводилась съемка, камерами.
Под камерой в этом случае мы понимаем нефизический фотоаппарат или видеокамеру, а набор внешних и внутренних параметров, которых характеризует данный ракурс. Таким образом мы можем неразделять в описании методов случаи, когда используется движущаяся видеокамера, стереокамера или просто фотографии, полученные с разных точек вразное время.Практически все методы реконструкции записываются в так называемойоднородной системе координат с целью упрощения нотации и вывода. Однородными координатами для точки ∈ R2представителей класса эквивалентности вние:(дляR3вывод аналогичен) называютR3 , заданного следующим соотноше-22(1)(2)(3)(1)(2)(3)(0 , 0 , 0 ) ∼ (1 , 1 , 1 ) ⇔(1)(2)(3)(1)(2)(3)⇔ ∃ ̸= 0 : (0 , 0 , 0 ) = (1 , 1 , 1 ).При наличии однородных координатее координаты вR2( (1) , (2) , (3) )точки = ((1) , (2) )можно получить при помощи уравнений:(1) =(2) (1), (3) (2)= (3) .Обратное преобразование неоднозначно, и его можно выбрать к примеру так: (1) = (1) , (2) = (2) , (3) = 1.Посмотрев на эти уравнения, можно заметить их схожесть с уравнениями проекции объекта в проективной модели камеры.
Последние можно переписать воднородных координатах, получив в результате линейную модель. Рассмотримматрицу ∈ R3×4 = ( * |),где⎛это⎞ 0 0⎜⎟⎜⎟ = ⎜ 0 0 ⎟.⎝⎠0 0 123С ее помощью уравнения проекции объекта из предыдущего раздела можнозаписать в однородных координатах в следующем виде: = * ,где- это однородные координаты проекциидинаты точки.,а- это однородные коор-Стоит заметить, что эти уравнения верны с точностью доумножения на константу, вследствии характера построения однородных координат.Рассмотрим теперь две камеры, которые задаются матрицамиПусть нам известны проекции точкиобозначены как0и10и1 .на их плоскости, и пусть эти проекциисоответственно.
Уравнения для них выглядят как:0 = 0 * ,1 = 1 * .Каждое из этих уравнений верно с точностью до умножения на константу, чтоне дает применить стандартные методы решения линейных уравнений к решению задачи вычисления координати1 .при известных координатах проекций0Для решения этой проблемы перепишем уравнения в виде:0 × 0 * = 01 × 1 * = 0.Эта система представляет собой однородную систему из четырех линейныхуравнений с тремя неизвестными.
К ее решению можно подойти двумя способами, можно в однородных координатахв качестве последней координатыпоставить единицу и применить стандартный метод наименьших квадратов, либо же взять собственный вектор, соответствующий наименьшему собственному24числу сингулярного разложения матрицы системы [38], в качестве решения.Второй метод обычно предпочитают первому, т.к. первый плохо работает дляточек близких к бесконечности (т.е. сильно удаленных от места съемки).
Описанный подход легко расширяется на случаи трех и более камер простым добавлением уравнений и является базовым методом стереозрения. Можно такжезаметить, что последняя система линейна не только относительноносительно матриц0и,но и от-1 , поэтому при известном наборе соответствий междупроекциями и трехмерными точками, матрицы камер можно восстановить аналогичными линейными методами.
В случае же когда трехмерные координатыточек неизвестны, но известны соответствия проекций между изображениямис разных камер, можно воспользоваться методами эпиполярной геометрии дляоценки их взаимного расположения. Они строятся по схеме аналогичной выводуметода триангуляции, описанного выше.Одной из проблем линейных методов реконструкции является их слабаяустойчивость к помехам в проекциях точек [53]. Поэтому чаще всего помимоних используют различные нелинейные методы, использующие уравнения проектирования напрямую без перехода к однородным координатам. Все они рассматривают некоторую функцию ошибки невязки наблюдаемых проекций и ихпредсказаний на основе текущих параметров модели. Часто используется квадратичная невязка.
В случае единичной матрицы камеры, она будет выглядетькак:(︂)︂(︂)︂(1) 2(2) 2(1) − (3) + (2) − (3) .Дальше эта невязка используется вместе с каким либо алгоритмом оптимизации [20] для нахождения более точной оценки координат.При достаточномчисле наблюдаемых точек и проекций методы оптимизации могут примененыи к уточнению положений камер, при этом чаще всего эти задачи решают одновременно. Точность всех этих методов напрямую зависит от точности лока-25лизации проекций объектов, а также от корректности их соответствий междуразными кадрами [15].Предположим, что имеются некоторые приближения положений камер инаблюдаемых точек. Пусть— количество камер,дая камера представлена матрицами параметровкак ∈ R 3 .— количество точек.