Автореферат (1149686), страница 2
Текст из файла (страница 2)
Использование рандомизацииположения камеры позволяет построить алгоритмы оценивания положенияобъекта, которые успешно работают в условиях практически произвольногоего движения, в то время как существующие методы сильно ограничены всвоей применимости и могут работать лишь в узких случаях, например, таких, как движение объекта в плоскости или с постоянной скоростью. Крометого предлагаемые алгоритмы способны производить состоятельные оценкипри почти произвольных помехах в координатах проекций наблюдаемого объекта, что также отличает их от существующих решений, рассматривающихпо большей части лишь случай случайных центрированных помех. В диссертации сформулированы два теоретических утверждения, демонстрирующихсостоятельность разработанных алгоритмов.Теоретическая и практическая значимость работы заключаетсяв исследовании и обосновании свойств оценок предложенных рандомизированных алгоритмов, определяющих положение движущегося объекта на основе изображений, получаемых с одной камеры, разработке общего подхода киспользованию рандомизации положения камеры для целей трехмерной реконструкции наблюдаемой сцены и разработке архитектуры программногокомплекса, осуществляющего отслеживание и определение положения объектов.Предложенные методы и разработанное программное обеспечение будут полезны при решении множества практических задач, в которых необходимо в реальном времени определять положение объектов окружающегомира.
Они позволяют решать данную задачу, используя лишь одну камеру6и не накладывают значительных ограничений на возможный характер движения наблюдаемых объектов. Такие свойства позволят использовать их вболее широком спектре прикладных задач по сравнению с существующимирешениями, которые зачастую используют дополнительные дорогостоящиесенсоры или же предназначены лишь для узкого класса случаев (например,движение в плоскости или с постоянной скоростью).Положения, выносимые на защиту:1. Разработан подход к решению задачи оценки положения движущегося объекта на основе изображений, получаемых с одной видеокамеры, использующий рандомизацию положения камеры и позволяющий решать поставленную задачу без существеннных ограничений на характер движения объекта.2.
Разработаны алгоритмы оценивания положения движущегося объекта на основе случайных движений видеокамеры. Установлена теоретическая сходимость оценок, доставляемых разработанными алгоритмами, к некоторому ограниченному множеству, которое при“малом” дрейфе объекта может быть достаточно малым за счетподбора параметров алгоритма. Продемонстрирована их работа припомощи моделирования и тестирования в реальных условиях.3. Разработан программный комплекс, использующий методы компьютерного зрения и полученные алгоритмы оценивания, позволяющий осуществлять отслеживание движущегося объекта на основеслучайных движений видеокамеры.Апробация результатов.Материалы диссертации докладывалисьна семинарах кафедры системного программирования СПбГУ, на российских и международных конференциях по программированию, информатикеи теории управления: международной конференции 14th International StudentOlympiad on Automatic Control (Baltic Olympiad) (Россия, Санкт-Петербург,2011), научной конференции по проблемам информатики СПИСОК-2013(Россия, Санкт-Петербург, 2013), международной конференции 53rd AnnualConference on Decision and Control (CDC) (USA, Los Angeles, 2014).Личный вклад автора.Результаты, представленные в диссертаци-онной работе, получены соискателем либо самостоятельно, либо при его непосредственном участии.7Содержание работыДиссертация состоит из введения, трех глав, заключения, двух приложений и списка литературы.
Полный объём диссертации составляет 93 страницы с 22 рисунками и 1 таблицей. Список литературы содержит 88 наименований.Вовведенииобосновывается актуальность диссертационной работыи кратко представлены ее результаты.Впервой главе“Оценка положения объектов при помощи камеры”рассматривается историческое развитие методов трехмерной реконструкциипо фотографиям и видео изображениям, вводятся основные определения имодели, описываются используемые в указанных задачах алгоритмы компьютерного зрения.В п. 1.1. представлена краткая история развития методов оценки положения объектов на основе использования фото- и видео- камер. Широкое распространение камер и их доступность позволила использовать методытрехмерной реконструкции в областях роботехники, портативных устройств,приложениях дополненной реальности и пр.В п.
1.2 описывается проективная модель наблюдения камеры. В диссертации рассматриваеся “стеноп” камера, которая задается вектором коор- = ( (1) , (2) , (3) ) , величиной фокусного рас3×3поворота ∈ R, задающей ориентацию плоскостидинат оптического центрастояния,матрицейкамеры. Матрица поворота и координаты оптического центра задают преобразование из некоторой фиксированной глобальной системы координат влокальную систему координат камеры. В качестве объекта наблюдения в диссертации рассматривается точка с координатами = ( (1) , (2) , (3) ) .
Коор-динаты ее проекции на плоскость камеры получаются, исходя из уравнений:(1)(2)(3)(1)(1)(2)(3)(2)21 +22 +23 +11 +12 +13 +(2)=,(1) = (1) + (2) + (3) +(3) , 31 (1) +32 (2) +33 (3) +(3)313233((1) , (2) , (3) ) = −−1 ( (1) , (2) , (3) ) .где векторВ п. 1.3 описываются существующие методы трехмерной реконструкции. Для их формулировки рассматриваются однородные координаты, ко- ∈ R2 как класс эквивалентности в R3 . Задав ∈ R3×4 = ( * |), где это матрица внутрен-торые вводятся для точкидля камеры матрицуних параметров камеры, уравнения проектирования можно привести к виду: = * , где - это однородные координаты проекции , а 8- это однород-ные координаты точки.Теперь при наличии двух камер с матрицами0и1 и известных проекций точки на их плоскости 0 и 1 можно рассмотретьсистему уравнений 0 × 0 * = 0, 1 × 1 * = 0, для решения которойможно приравнять 4 = 1 или же найти решение при помощи сингулярногоразложения матрицы системы.В п.
1.4 коротко представлены существующие алгоритмы компьютерного зрения, использующиеся в задаче оценки положения объекта. Для локализации объектов на кадрах широко распространено применение методовпоиска “уголков”, основанных на выделении локальных минимум и максимумов градиента изображения. В задачах реконструкции по фотографиямприменяются более сложные методы такие как SIFT и SURF , которые кроме выделения особых точек, также вычисляют дескрипторы для каждой изних.
В задачах реконструкции по видео для сопоставления используются более простые алгоритмы, учитывающие лишь координаты проекций.Вовторой главе “Рандомизированные алгоритмы оценки координатдвижущегося объекта” представлены алгоритмы оценки положения движущегося объекта с использованием рандомизации, даются их формулировкии доказывается сходимость оценок к некоторому множеству, которое можетбыть достаточно малым при соответствующем выборе параметров алгоритма.В п. 2.1.1 рассматриваются проблемы, возникающие при решении задачи оценки положения движущегося объекта при помощи одной камеры.В диссертации приводятся примеры, когда камера и объект движутся сонаправленно, а также с одной скоростью, в которых невозможно решить задачуоценки положения традиционными методами.В п. 2.1.2 демонстрируется на простом примере, каким образом рандомизация положения камеры может быть использована для построения ал- = 1, 2, . .
.— дискретное время. В качестве наблюдаемого объекта в момент времени (1)(2)(3) рассматривается точка с вектором координат = ( , , ) . Коор(1) (2) динаты ее “зашумленной” проекции на плоскость камеры = ( , ) при(2)(2)(1)(1)(1) (2)(2)(1) −= (3) −(3) + , гдеэтом удовлетворяют уравнениям: = (3)(3) + , горитма оценивания положения движущегося объекта. Пусть − −(1) (2) = ( , ) — вектор неизвестных помех. Рассматривается случай, когда(1)(1)положение камеры задано как = (∆ , 0, 0) , где ∆ — известное случайное (рандомизированное) пробное возмущение по оси9 с нулевым математи-(1) 212 = ∆ческим ожиданием и дисперсией, независимое от положения точ- и вектора помех .
Уравнения для проекций в таком случае принимают(1)(1)(2)(1)(1)(2)(2) −Δвид = (3) + , = (3) + . Домножив первое выражение дляки(1) на величину(1)∆ , получаем(1)=(1)(1) Δ(3)(1)− Δ(1)Δ(3)(1)(1)+ ∆ .Учиты- и помехи[︀ (1) (1) ]︀(1) , для математического ожидания последовательно выводим ∆ =[︀ (1) Δ(1)(1) (1)(1) (1)(1)(1) (1) ]︀(1)ΔΔ (3)− Δ (3)+ ∆ = −12 1(3) , так как (3)= (3) · ∆ = 0вая центрированность∆(1) (1) ∆и независимость от положения точки(1) (1)(1)(1)и ∆= · ∆ = 0.
Из этого уравнения видно, что, усредняя(1) (1) ∆ с течением времени, можно получить величину, равную усредненной1обратной глубине наблюдаемой точки Γ = (3) , домноженной на некоторуюизвестную константу. По обратной глубине искомые координаты объекта получаются по простым формулам на основе уравнений проектирования.В п. 2.2 предлагается рандомизированный асимптотический наблюдатель для обратной глубины движущегося объекта. Рассматривается сферическая модель камеры, в которой в каждый момент времени камера, задается положением центра проектированияв некоторой фиксированной , который задает ее ориентацию.