Диссертация (Цифровая обработка телевизионных изображений для обнаружения препятствий на подстилающей поверхности в условиях фотометрических искажений), страница 6
Описание файла
Файл "Диссертация" внутри архива находится в папке "Цифровая обработка телевизионных изображений для обнаружения препятствий на подстилающей поверхности в условиях фотометрических искажений". PDF-файл из архива "Цифровая обработка телевизионных изображений для обнаружения препятствий на подстилающей поверхности в условиях фотометрических искажений", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 6 страницы из PDF
Предположим, системанашла 250 из 300 релевантных изображений и 100 каких-то иныхизображений, не интересующих пользователя. Точность этой операциипоиска (классификации) составляет 250/350 = 71,4%, а полнота выборки250/300 = 83,3%. Если бы система вернула все изображения БД, то могла быдостичь 100% полноты выборки, но при этом еѐ точность бы чрезвычайноупала.
Но с другой стороны, можно получить высокую точность, еслитщательно настроить классификацию на низкий коэффициент ложныхсрабатываний, но полнота выборки при этом может оказаться низкой.1.4. Формирование изображения на матрице телевизионнойкамеры1.4.1. Модель камеры-обскураВ модели камеры-обскура объектив камеры, представленный ееоптическимцентром,соответствуетточке,расположенноймеждутрехмерной сценой и двумерной плоскостью изображения, и оптическойосью, перпендикулярной к плоскости, определяемой линзой и проходящейчерез оптический центр (рис.
1.7).Точка пересечения между плоскостью изображения с оптической осьюназывается принципиальной точкой в литературе компьютерного зрения [73].Расстояние между оптическим центром и главной точкой называетсяпринципиальным расстоянием и обозначается b. Для реальных объективовпринципиальное расстояние b всегда больше, чем фокусное расстояние fлинзы, а величина b соразмерна с f, если расстояние до объекта z намногобольше, чем b.32Рис. 1.7. Физическая и нормированная системы координат изображения1.4.2. Внутренние параметры телекамерыВ этой работе будут использоваться обозначения, аналогичныеобозначениям Крейга [54] для точек, систем и матриц преобразованиякоординат.
Соответственно, точка p в системе координат камеры CобозначаетсяCp.НачалосистемыкоординатСсоответствуетпринципиальной точке. Аналогично, преобразование точки в мировойсистеме координат W в систему координат камеры С обозначается спомощью преобразованияCWT , где нижний индекс определяет исходнуюсистему координат и верхний индекс систему координат, в которую точкапреобразуется. Преобразование WCT соответствует произвольному повороту ипараллельному переносу.
В этих обозначениях, преобразование задается какCp WCT W p . Точка сценыCp ( x, y, z )T , определенная в системе координаткамеры C, проецируется на плоскости изображения в точке I p , определеннойв системе координат изображения I, таким образом, что точка сцены p ,оптический центр, и точка на изображении I p соединены прямой линией втрехмерном пространстве (рис. 1.7). Очевидно, что все точки сцены,расположенные на этой прямой, попадут в одну и туже точку в плоскостиизображения, таким образом, исходная информация о глубина z теряется.33Элементарные геометрические построения дают для точкиIp (uˆ , vˆ )всистеме координат изображения:uˆ x,zvˆ y,z1pˆ ( Idz(1.1) P0) ,1где pˆ (uˆ, vˆ,1)T — вектор однородных координат проекции p̂ точки Р нанормированную плоскость изображения.В общем случае физическая и нормированная чувствительные областикамеры не совпадают (рис.
1.7). Так физическая плоскость находится нарасстоянии f 1 от отверстия (для упрощения будем предполагать, чтокамера сфокусирована на бесконечности, следовательно расстояние ототверстия до плоскости изображения будет равно фокусному расстоянию), акоординаты (u, v) точки изображения р выражаются в пикселях (а не, скажем,в сантиметрах). Более того, пиксели обычно считаются прямоугольными, ане квадратными, поэтому у камеры появляется два дополнительныхпараметра для масштабирования k и l, таким образом:u kfx,z(1.2)yv lf .zДля лучшего понимая надо знать, что в каких единицах измеряется: f— это расстояние, измеряющееся, например, в метрах, а размерность пикселя—1 1-1 , где размерность k и l [px × м ].
Параметры f, k, l не являютсяk lнезависимыми, их можно представить множителями kf , lf ,выражены в [px]. px – это единица измерения пикселей.34которыеНачало системы координат телевизионной камеры в общем случаенаходится в углу C чувствительной области (для случая, изображенного нарис. 1.7, C находится в левом нижнем углу, но иногда это может быть илевый верхний угол, в том случае если координаты изображения — индексыстолбцов и строк пикселя), а не в ее центре. Центр светочувствительнойматрицы обычно не совпадает с главной точкой С0.
Так добавляется еще двапараметра u0 и v0, определяющие положение (в единицах измерения px)точки С0 в системе координат чувствительной области, а система (1.2)преобразуется к виду:u x u0 ,z(1.3)yv v0 .zНаконец, вследствие некоторой производственной ошибки системакоординат камеры может быть наклонной, так что угол θ между двумя осямиизображения не будет равен 90° (но, конечно, очень близок к этомузначению). В этом случае можно показать, что уравнение (1.3) приводится квиду:u xy cot u0 ,zzvy v0 .sin z(1.4)Уравнения (1.1) и (1.4) позволяют записать правило перехода отсистемы координат физического изображения к нормированной системекоординат как плоское аффинное преобразование, т.
е.p Kpˆ ,u p v ,1 35K 00 cot sin 0u0 v0 .1 Объединив полученные результаты, получим выражение:p1MP ,z(1.5)M K 0 .На этот раз через Р = (х, у, z, 1)T обозначен однородный векторкоординат точки Р в системе координат камеры. Другими словами,однородныекоординатыможноиспользоватьдляпредставленияотображения перспективной проекции матрицей М размером 3 × 4 .Отметим, что для механизма фиксации кадра и данных камеры наклони физический размер пикселя постоянны и, в принципе, их можно измеритьпри изготовлении (эта информация может оказаться и недоступной, если,например, скорость оцифровки механизма фиксации кадра неизвестна).
Вобъективах с переменным фокусным расстоянием меняться может какфокусное расстояние, так и положение центра изображения, если оптическаяось не строго перпендикулярна к плоскости изображения. Изменение фокусакамеры тоже влияет на увеличение, так как при этом меняется расстояние отчувствительной области до линзы, но далее будем считать, что камерасфокусирована на бесконечность.1.4.3.
Оценка расстояния до объекта при использованиимонокулярной системыРассмотрим случай, когда система отсчета камеры С отличается отреальной системы отсчета W. Запишем, что C P WC R T 1 OCOW Wp ,1 1 сделаем замену в уравнении (1.5) и получим:36p1MP ,z(1.6)M K R t,где t C OW — вектор трансляции, R WC R — это матрица вращения. ЧерезP ( W x, W y, W z ,1)T обозначен однородный вектор координат точки Р в системекоординат W.Выше приведен общий вид уравнения перспективной проекции.
Егоможно использовать для определения положения оптического центра Окамеры в реальной системе координат. Для однородного координатноговектора О справедливо МО = 0. Интуитивно это достаточно очевидно, таккак оптический центр — это единственная точка, в которой изображениеоднозначно не определено. В частности, если M A b , b — вектор впространстве R3, а A — несингулярная матрица 3 × 3, то неоднородныйвектор координат точки О — это просто — A - 1 b.Надо понимать, что глубина z в уравнении (1.6) не зависит от M и P,так как если через m1T , m2T и m3T обозначить три строки матрицы M, то изуравнения (1.6) следует, что z m3 P . Иногда бывает удобно переписатьуравнение (1.6) в другом виде:um1 P,m3 Pvm2 P.m3 PПроекционную матрицу можно записать в явном виде как функциюшести внешних параметров (три угла, определяющие R, и три координатывектора t) и ее пяти внутренних ( , , u0 , v0 , ): r1T cot r2T u0 r3T TM r2 v0 r3Tsin r3T37 t x cot t y u0t z ,t y v0t zsin tzгде t x , t y и t z — координаты вектора t, аr1T , r T2 , r T3соответствуют тремстрокам матрицы R.
Если записать матрицу R как произведение трехэлементарных поворотов, то векторы (r = 1,2,3) можно, конечно же, явновыразить через три соответствующих угла.Если матрица M записана в указанной канонической форме, топараметрzвуравнении(1.6)единственноправильноможноинтерпретировать как глубину точки P.1.5. Краткие выводыРассмотрены существующие системы обнаружения препятствий впомещении.
Проведенный анализ литературы показывает, что использованиерадиоканала для задач обнаружения препятствий в помещении затруднен всвязи с наличием помех и переотражений сигнала. Использованиеультразвуковыхдатчиковнепозволяетразличитьразличныетипыподстилающих поверхностей, а для составления карты пространствапотребуется система из таких датчиков.Проведенное исследование литературы показало, что для обнаруженияпрепятствий в условиях помещения наилучшим вариантом являетсяиспользование канала в видимом диапазоне электромагнитного спектра.Такие сигналы используются в телевизионных измерительных системах.Рассмотреныособенностиалгоритмовприкладноготелевидения,отличающие их от вещательных телевизионных систем.
В итоге, предложеноиспользование методов прикладного телевидения и систем техническогозрения для решения поставленной задачи. В качестве основного признака,отличающего препятствие от подстилающей поверхности, выбрана цветоваясоставляющая, так как именно с ее использованием можно обнаружитьмелкие и плоские препятствия.Рассмотрен механизм формирования изображения в телекамере сучетом использования оптической системы и возможные искажения,38возникающие из-за погрешностей сборки. Так же рассмотрены базовыезадачи распознавания образов.В связи с этим, в работе предложена система прикладного телевиденияна основе цифровой обработки изображения для решения задач обнаруженияпрепятствий перед автономной мобильной роботизированной платформой.Предлагаемый метод отличается от изложенных выше тем, что используетнакопление цветовой информации, таким образом, позволяя МРП работать вусловиях фотометрических искажений.Приемником оптического сигнала от препятствий может служитьобычная цветная телевизионная камера [23].39ГЛАВА 2.
АЛГОРИТМ ОБНАРУЖЕНЯ ПРЕПЯТСВИЙ НАОСНОВЕ АНАЛИЗА ИЗОБРАЖЕНИЯ С ТЕЛЕВИЗИОННОЙ КАМЕРЫ2.1. Вводные замечанияВ предыдущей главе проведенпоказавший,чтоприкладныеанализ существующих систем,телевизионныесистемымогутбытьиспользованы для определения препятствий перед объектом, с котороговедетсянаблюдение.Таккактелевизионнаякамерапредоставляетинформацию о цвете, то такая система должна ориентироваться поспециальной маркировке препятствий. В упрощенном варианте и в тестовомокружении, можно придумать специальные маяки, которыми помечались быпрепятствия, но тогда будет невозможна работа в реальных условиях, гдетакая информация не предоставляется.