Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 90
Текст из файла (страница 90)
Если имеется несколько точек объекта, их проектнрующие лучи образуют параллельную связку линий; на этой параллельности н основан описываемый ниже метод. Заметим, кстати, что, если расстояние от центра объектива до множества точек объекта велико по сравнению с расстоянием между парами точек объекта, проектирующие лучи будут приблизительно параллельны. Следовательно, метод представляет практический интерес, поскольку камеры часто помещают относительно далеко от объектов, чтобы избежать сильных перспективных искажений.
(Например, фотографы-портретисты обычно помещают свои камеры по крайней мере на расстоянии 2,5 м от снимаемого лица, чтобы на получающихся изображениях не увеличивались размеры носа.) Геометрический чертеж ортогональной аппроксимации показан на рис.
11.10. Мы воспроизвели две плоскости изображений и, и п„объект в виде отрезка РС( и два изображения этого отрезка Р О, и РД„лежащие на соответствующих плоскостях изображений. Центры объективов двух камер не показаны, и можно считать, что они находятся' в бесконечности на пересечении соответствующих пар 11.а. Аллракслмаяил ортоеональним лроентироаанием 447 проектирующих лучей. Важную роль в данном методе играет ХЯ— линия пересечения двух плоскостей изображения.
В частности, мы утверждаем, что составляющие отрезков РЯ, РД, и РД, в направлении ХЛ имеют все одну и ту же длину. Если это утверждение справедливо, длина составляющих соответственных отрезков изображения в направлении ХЯ является проективным инвариантом; эти составляющие равны на двух г изображениях одного и того же отрезка. Набросаем схему доказательства выдвинутого выше утверждения, хотя оно и так ре довольно очевидно. Доказательство основано на двух свойствах ортогонального проектирования: во-первых, е ортогональное проектирование является линейным преобразованием и, во-вторых, к ортогональная проекция лю- 2 бого отрезка, параллельного плоскости изображения, имеет ту же длину, что и сам отрезок.
Чтобы использовать свойство линейности, представим себе, что отрезок Ргс рис. 11.10, исследование ортогональной является суммой двух состав- аввроисимаиии. ляющих, одна из которых совпадает по направлению с ХЛ. Вследствие линейности ортогональная проекция суммы (скажем, на первую плоскость изображения) равна сумме ортогональных проекций. Следовательно, отрезок РД, представляет собой сумму двух векторов, один из которых есть проекция составляющей отрезка РЯ в направлении ХЛ. Но, согласно второму свойству, составляющая РЯ в направлении ХЛ не изменяется по длине при ортогональном проектировании; поэтому длины составляющих в направлении ХУ для отрезка-изображения и отрезка-объекта одинаковы.
Поскольку все сказанное справедливо и для второй плоскости изображения, может быть построено полное доказательство. Когда дело доходит до практического применения этого квазипроективного признака, мы обнаруживаем, что применимы доводы, весьма похожие на те, которые использовались в предыдущем разделе. Как и раньше, если относительные положения двух камер известны, легко рассчитать проекции всех отрезков изображения на ХЛ; но, конечно, если относительные положения камер известны, имеются и лучшие пути решения задачи второго ракурса. Когда Гл. П.
Прввкитивиив иивириинвиы относительные положения камер неизвестны, мы, как и пренсце, для решения задачи второго ракурса можем использовать поисковые методы. Рис. 11.11 подсказывает, как можно сформулировать задачу цонска. На этом рисунке мы показали плоскости изображений рис. 11.10, развернутые относительно линии ХУ так, что оба изображения оказываются в одной плоскости.
Поскольку составляющие в направлении ХЯ для изображений обоих отрезков равны, отрезки Р,Р, н ЦДз параллельны. Таким образом, если у нас есть дм картинки одного и того же объекта, их можно поместить на плоскость в такой относительной ориентации, чтобы линии, соединяющие соответственные точки изображений, были параллельны. Дру- Рнс. 11.11, Плоскости изображений рнс. 11.10, развернутые относительно при. ыой Хг.' гой вариант основан на том, что должны быть, очевидно, некоторые предпочтительные направления на каждой плоскости изображения, такие„что составляющие соответственных отрезков изображения, измеренные но этим направлениям, оказываются равными.
В лю. бом случае простое рассуждение показывает, что здесь задача,по. иска двумерная, причем обе координаты поискового пространства представляют собой углы поворотов. Тогда на практике можно было бы отыскивать такую относительную ориентацию изображений, при которой критерий параллельности наиболее близок к выполиеншо (или, в другом варианте, такие предпочтительные направления„ при которых наиболее близок к выполнению критерий равенства составляющих).
В любом случае необходимо иметь по крайней мере три точки изображения, чтобы избежать вырожденных решений. Наконец, здесь осталась бы еще проблема решения, выполняется ли критерий настолько хорошо, чтобы можно было сделать решительнмй вывод, что зто частное необходимое условие «одинаковости» двух изображений удовлетворено.
Таким образом, как и в предыдущем разделе, задача второго ракурса превращена в задачу поиска, за которой следует процесс принятия решения. 11.6. Восстановление объекта 449 Перечислив так подробно черты сходства между этим методом и описанным ранее, было бы правильно указать некоторые их важные различия. В предыдущем случае поиск выполнялся в четырехмерном поисковом пространстве. Более того, пространство поиска было ие ограничено, посколькуфизически мы отыскивали точки прокола, которые могли находиться в любом месте каждой из бесконечных плоскостей изображения.
С другой стороны, настоящий метод связан с поиском во всего лишь двумерном ограниченном поисковом пространстве — осраниченном, поскольку физически мы отыскиваем ориентации, которые могут находиться только между О и 360'. Поэтому настоящий метод обладает тем преимуществом, что связанная с ним задача поиска существенно легче. Однако наряду с этим вычислительным преимуществом имеется и недостаток, Некоторое небольшое размышление приводит к выводу, что настоящий метод использует только одномерную информацию об объекте, а именно метод зависит исключительно от взятых по направлению Хд составляющих расстояний между парами точек объекта.
Следовательно, хотя метод и в самом деле приводит к необходимому условию того, что два изображения показывают один н тот же объект, это условие слабее, чем то, которое может быть получено более сложным в вычислительном отношении методом. 11.8. ВОССТАНОВЛЕНИЕ ОБЪЕКТА Мы несколько раз упоминали о том, что задача второго ракурса имеет прямое решение, когда относительные положения двух камер заранее известны. Решение связано с вычислениями, необходимыми для оценки стереоскопического триангуляционного уравнения. Возвращаясь обратно к предыдущей главе, мы видим из формул (34) и (35), что величина 1(а„де) представляет собой минимальное расстояние между лучами, проходящими через пару соответственных точек изображений. Таким образом, очевидное решение задачи второго ракурса (когда известны относительные положения камер) заключается в том, чтобы вычислить минимальное расстояние между членами каждой пары соответственных лучей и затем проверить, равны ли все эти расстояния нулю.
Если это так, т. е. если лучи, проведенные через соответственные точки изображений, пересекаются, тогда необходимое условие того, что два изображения показывают один и тот же объект, будет выполнено. Более того, этот метод восстанавливает н сам трехмерный объект, если предположить, что действительно один и тот же объект показан на обеих картинках. Ясно, что объект определяется пересечениями соответственных лучей ').
з) На практнке, конечно, ыы не ножен ожндать, что соответственные лучи пересекутся, даже если обе картинки показывают один н тот же объект. Вслед- Гв, 11. Провктивнмв ияварионшы 450 Предыдущий метод вполне очевидным образом может быть обобщен на случай неизвестных положений камер. Основная идея заключается в том, чтобы выполнить поиск по всем возможным позициям камер и найти такую пару положений, при которой наблюдаются пересечения. соответственных проектирующнх лучей. Если можно будет найти такие положения камер, необходимые условия того, что оба изображения показывают один и тот же объект, будут выполнены.
Более того, если предположить, что оба изображения действительно показывают один и тот же объект, решение восстанавливает как сам трехмерный объект, так и относительные позиции камер. Рассмотрим немного более подробно, как можно решить задачу поиска. Во-первых, очевидно, что важны только относительные положения двух камер; можно ничего не говорить об их абсолютных положениях.
В этом случае мы можем с тем же успехом предположить, что позиция первой камеры фиксирована в некоторой глобальной системе координат; для удобства мы примем, что первая камера находится в начале координат и ее углы наклона и поворота равны нулю. Положение второй камеры относительно первой определяется тремя параметрами переноса и тремя параметрами вращения. Для простоты примем, что камеры никогда не поворачиваются вокруг своих собственных оптических осей, н поэтому справедливы общие формулы, использовавшиеся в предыдущей главе.
При таком предположении позиция второй камеры определяется тремя параметрами поворота и только двумя углами. Далее, мы уже отмечали, что формулы (34) и (35) предыдущей главы дают минимальное расстояние между лучами, проходящими через пару соответственных точек изображений. Однако единичные векторы п, и и„ взятые в направлении проектирующих лучей, являются функциями как положений камер, так н координат точек изображений.
Следовательно, для каждой пары соответственных точек изображений и для всех возможных (относительных) положений камер мы можем в принципе рассчитать, насколько близки к пересечению соответственные лучи. В принципе мы можем затем выполнить поиск в пространстве всех (относительных) положений камер, чтобы найти позиции, в которых соответственные лучи наиболее близки к пересечению. Если две картинки на самом деле показывают один и тот же объект, то существуют относительные положения камер, в которых соответственные лучи пересекаются, а именно это как раз те позиции, которые камеры занимали в момент съемки иэображения.