Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 86
Текст из файла (страница 86)
Обратимся теперь к тригонометрической задаче определения точки пересечения двух проектирующих лучей. В идеальном случае существуют два числа, скажем а н Ь, такие, что ап,=й+Ьп,. После нахождения таких чисел можно было бы просто положить т= =Е,+оп,. Однако мы можем принять на веру, что на практике два проектирующих луча не пересекутся нз-за различных ошибок. Разумное средство в этом случае заключается в том, чтобы поместить точку ч на полпути между двумя проектнрующими лучами в месте нх наибольшего сближения. Переходя к формулам, мы полагаем чав~+ (а+Ь0ад + ы (33) Ю.б.
Стереопопиеесиое еосприптие 427 где ае и Ь,— значения а и Ь„минимизирующие величину ,/(а, Ь)=Пап,— (Л+Ьп,)))е, (34) Отметим как особый случай, что если проектирующне лучи действительно пересекаются, то минимальное значение е' (а, Ь) равно нулю, аеп,=А+Ь,п, и ч=-п,п,+), С помощью элементарных вычислений можно легко проверить, что величина е (а, Ь) минимизируется при и, й — (и, ие) (и, й) 1 — (ис'ие)е (и, «,) (и, А) — (и, й) (35) 1 — (ис ие)е Остается задать вектор 1, (положение центра первого объектива) и два единичных вектора п, и и, в направлении проектирующнх лучей. Эти величины можно определить, вспомнив наше обсуждение обратного перспективного преобразования. Положение обьектива произвольной камеры задается выражением (25).
Вектор, направленный вдоль проектнрующего луча, определяется с помощью разности чр — Ь., где глобальные координаты точки ч изображения заданы формулой (24). Следовательно, в формулах (33) и (35) мы полагаем (36) "Р; — "~ ' где, конечно, индекс с обозначает точки изображения и объектива двух камер. Итоги всего сказанного сводятся к тому, что положение точки ч объекта, соответствующей двум заданным точкам чр и чр, изображения, определяется выражением (33), где а. и Ь, задаются формулами (35), Два единичных вектора и, и и, могут быть получены путем подстановки формул (24) и (25) в выражение (36).
Уравнение (33), которое мы можем назвать уравнением стереоскопии или триангуляционным уравнением, обычно используется просто для того, чтобы установить положение точки объекта, соответствующей определенной паре точек изображения. Однако оно может быть также использовано для более глубокого проникновения в природу процесса съемки изображения. Чтобы проиллюстри« ровать это, используем формулу (33) для исследования вопроса о том, как влияет квантование изображения на точность триангуляции. Вообразим эксперимент, в котором два иэображения одной точки ч объекта получены двумя различными камерами.
Пусть каждое изображение квантованно, так что истинные точкй изображения заменены центральными точками элементов сетки, в которые они попали. Если точка объекта, соответствующая кваитованным точкам изображения, определена с помощью формулы (33), результирующий вектор будет в общем случае отличаться от первоначальной точ. 4с йр Хс Рнс. 10.7. Чертеж к энспернменту со стереосистемой. ~з ~Я $ га ° ь ь о -Д~ ы ь -60 н -МЮ Ртиошеиис дальности к 5еллчоие дозы Рнс. 10.8. Результат эксперимента со стереосистемой.
вй.7. Бибяиовросрические и исторические сведения 429 ки и объекта. Возможной мерой этой разности является величина ошибки по дальности, выраженная в процентах, причем дальность определяется как расстояние от точки объекта до середины базовой линии. Интуитивно ясно, что процент ошибки по дальности будет обычно увеличиваться при возрастании истинной дальности, потому что с увеличением истинной дальности проектирующие лучи становятся почти параллельнымн, и небольшие ошибки, как правило, будут иметь серьезные последствия.
В соответствии с этим рассмотрим эксперимент, в котором точка обьекта отодвигается дальше и дальше от камер; для простоты мы всегда можем удерживать точку объекта на оптической оси первой камеры, гарантируя тем самым, что ошибка квантования будет иметь место только на втором изображении. Вид сверху на такую схему показан на рис. 10.7, При реальной постановке этого эксперимента плоскость изображения была произвольно квантована с помощью сетки, размер ячейки которой равнялся ~(200; результат эксперимента изображен на рис.
10.8. Любопытный зубчатый вид кривой ошибки легко объясняется с помощью рис. 10.7. Когда точка ч объекта удаляется вдоль проектнрующего луча первой камеры, ее образ передвигается слева направо по второй плоскости изображения. Квантованный образ поэтому сначала находится справа, а затем слева от истинного образа, что делает проектирующие лучи сначала чересчур параллельными, а затем чересчур сходящимися. В результате вычисленное положение точки объекта сначала находится слишком далеко (область положительной ошибки), а затем слишком близко (область отрицательной ошибки). И наконец, по мере удаления точки объекта точка изображения входит в следующую ячейку квантования, и процесс повторяется, но со значительно ббльшим размахом колебаний, так как проектирующие лучи становятся еще более параллельными.
Ш.У. БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ СВЕДЕНИЯ Нашей целью в настоящей главе было представление перспективных преобразований в форме, приемлемой для использования в анализе сцен. Эта тема, собственно говоря, является частью проективной геометрии, т. е, предмета, корни которого уходит по крайней мере к 1639 г., ко времени Дезарга, и который систематически разрабатывали в Х1Х в. такие знаменитые геометры, как Понселе, Мебиус, Плюккер, Штейнер н фон Штаудт. Несмотря на то что существует большое число современных введений в проективиую геометрию, например монографии, написанные Коксетером (1961) и Грауштейном (1963), их точка зрения совершенно отличается от нашей и материал.
несколько разбросан для читателя, интересующегося анализом сцен. Фотограмметристы подобным же образом имеют собственный интерес к перспективным преобразованиям, но Гз. 10. Перевеквгмеиме преобразования центральные проблемы, стоящие перед ними, вынуждают их использовать методы, не представляющие для иас в настоящее время интереса. Читателям, интересующимся широким кругом вопросов фотограмметрии, рекомендуется монументальный труд «Руководство по фотограмметрии» '); Гош (1968) обсуждает математические вопросы стереофотограмметрии.
Исключив из своего внимания обширную литературу по проективной геометрии и фотограмметрии, мы можем предложить лишь небольшой список литературы, трактующий вопросы перспективных преобразований с точки зрения анализа сцен. Робертс (1965) ввел эти преобразования в область распознавания образов в своей классической работе по автоматическому восприятию трехмерных сцен; в наших разработках мы в основном следовали его концепциям.
В неопубликованном докладе Харта (!969) о стереоскопических расчетах обсуждается чувствительность процесса триангуляции к ошибкам, вызванным поворотом, наклоном и квантованием. Собел (1970) имел дело с задачей калибровки камеры. Причиной интереса к перспективным преобразованиям и к связанным с этим вопросом темам является также желание воспроизводить трехмерные объекты на связанных с вычислительными машинами дисплеях. Эйгуя и Кунс (1968) предлагают перечень примеров использования перспективных преобразований при работе с дисплеем. Уорнок (1968), Лоутрел (1970) и Букнайт (1970) предлагают алгоритмы для решения так называемой «задачи удаления невидимых линий», связанной с воспроизведением на дисплее трехмерных объектов.
В течение многих лет психологи изучают процесс восприятия человеком изображений трехмерных сцен. Несмотря на то что эти исследования часто не приводят непосредственно к созданию методов автоматического анализа изображений, они дают интересный вспомогательный материал. Мы предлагаем три особенно хорошо написанные книги по этим вопросам. Грегори (1970) представляет доказательства важности информации о глубине для зрительного восприятия человека и иллюстрирует свою точку зрения трехмерными изображениями. Пиренн (1970) проводит сугубо нематематическое обсуждение перспективного преобразования и использует много фотографических отпечатков, полученных с помощью камеры с точечным объективом, для иллюстрации его свойств. И наконец, Юлеш (1971) описывает много замечательных явлений, раскрытых с помощью стереограмм набора случайных точек, которые наглядно иллюстрируют процессы восприятия, происходящие при работе более глубоких центров головного мозга.
з) Манна! о( Рьо(оигапгпге(гу, 3-е издание (в 2 томаз). изданное Американским обпзеством фотограмметрии, Вашииггои, )эбб. (Не указаны ни автор, ии редактор.) Задачи 431 СПИСОК ЛИТЕРАТУРЫ Букнайт (Воайпййй( Нии. 3.) А ргосеи)пге !ог йепегайоп о! (Ьгееайшепз!опа! Ьаййопед сопзрн1ег йгарЛйсз ргезеп1айопз, Сотт. АСМ, 13, 527 — 536 (ЗерзешЬег 1970). Гош (Яю«Ь 5. К.) ТЛеогу о( з(егеорЬа1оягапипезгу, ОЫо Яа(е ()п!чегзйу, Оерагйпеп! о( Сиеодеяс Зс!енсе, Со!пшЬпз, ОЫо, !968. Грзуштейн (Оган«за!и %. С.) 1п1го«1пс1юп 1о Н!6Лег Сюоше1гу, Масшййап, Ыечи Уогй, !963.
Грегори (Сгейогу )(. !.) ТЬе !п1ейййеп! Еуе, МсОгачи-НИ1, !«)ечи Уогй, 1970.(Русский перевод: Грегори Р., Разумный глаз, «Мир», М., !972.) Коисегер (Сохе1ег Н. 5. М.) ТЬе Ееа! Рго!есИче Р!зпе, СашЬпбйе ()п!чегя1у Ргезз, СашЬг№де, 1961. Лоутрел (1.оц1ге! Р. Р.) А зо!п1иоп 1о 1Ье Ыддеп-Ипе ргоЫеш 1ог сошрп(ег-бгазчп ро1уЬедга, 1ЕЕЕ Тгипз.
Соту., С-19, 205 — 2!3 (Магсй 1970). Пнренн (Р!гение М. Н,) Орйсз, Ра(п! !пй а ад РЛо(абгар Ьу, СашЬг(и(не ()п(чегзй! у Ргезз, )з)ечи Уогй, 1970. Робертс (КоЬегЫ.. О.) МасЫпе регсер(юп а( (Лгее-д!шепа!опа! зо!ибз, ип Орйса! апд Е1ес(го-Ор1!са1 )п!оппа11оп Ргосезз!пй, рр. 159 — !97, Л Т.
Т!рре11, е1 а1., еий., М1Т Ргея, СлпзЬ«142е, МашасЬпзейз, 1965. (Русский перевод в сб. «Интегральные робо. ты», «Мир», М., !973, стр. !62 — 208,) Сабел (ЗоЬе! 1гччп) Сашега людей апд гпасЫпе регсерйоп, Яап!оги! Агййис!а! !п1ей!пенсе Ргозес1, Меню А!М-!21, Сопзрп1ег 3сиепсе Оераг(пмп(, Яап1огб ()п!чегзйу (Мау 1970). Уорнок (Н«агпасй 3.