Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 98
Текст из файла (страница 98)
12.15, г показан результат такого применения; больше нет узлов, соединенных по крайней мере двумя дугами, и поэтому процесс заканчивается. Окончательная группировка областей определяется узлами последнего графа. В данном случае области 1, 2 и 3 обьединены в один объект, области 4, 5 и 6 образуют другой объект н, наконец, область 7 — фон — образует третий объект. Таким образом, в этом примере процесс перво- Гл.
12. Соапаеление и абрабопиеа описаний начального обнаружения связей н последующего слияния узлов дает удовлетворительный результат. Читатель может также убедиться, что та же самая процедура дает удовлетворительные результаты для сцен рнс. 12. 13, а, б н, действительно, для многих других более сложных сцен. Хотя метод, представленный выше, работает удовлетворительно на многих сценах, оказывается также, что его не очень трудно обмануть. В сцене рис.
12.16,а вершины А н В вносят достаточно связей, чтобы вызвать обьеднненне всех областей, включая фон, в один объект. Мы можем пожелать ввести новые эвристические правила илн изменить некоторые из первоначальных правил, чтобы бороться с недостатками такого рода. Одна простая модификация, достаточная для данного случая, состоит в том, чтобызаменнть правило 1 следующим эвристическим правилом: 1'. Вершина типа У свидетельствует о том, что трн области, сходящиеся в У, должны быть объединены, если только одна из них не является 4оном, и в етом слу«ае никакие области не должны объединяться.
Читатель может убедиться, что это правило (которое неявно предполагает, что мы заранее знаем, какие области представляют фон) приводит к удовлетворительным результатам для сцены рис. 12, 16, а. Мы не должны, однако, ожидать, что эта единственная модификация даст нам непогрешимый набор правил. Доводы, которые привели нас к правилу Г, оказываются несостоятельными на рнс.
12.16, б; здесь вершины А н В создают достаточно связей, чтобы вызвать объединение всех областей, кроме фона, в один объект. Закончим это обсуждение несколькими заключительными замечаниями. Мы видели, что трудная с виду задача разделения изображений многогранников на отдельные тела может на самом деле частично решаться посредством замечательно простого набора методов.
В пределах некоторого класса изображений многогранников эти методы оказываются совершенно общими. Онн не требуют, чтобы многогранники были степени 3, были выпуклыми илн находились в общем положении; и онн, конечно, не требуют никакой информации об отдельных объектах сцены. С другой стороны, методы, представленные здесь, несовершенны; даже несколько более развитые формы этих методов оказываются несостоятельными на некоторых сценах. К сожалению, не так легко охарактеризовать класс сцен, для которого определенный член этого семейства методов дает правильные результаты.
Может быть, наиболее полезный общий вывод состоит в том, что, как показывает опыт, методы этого семейства часто работают очень хорошо на обширном множестве весьма сложных картинок, но могут отказывать на некоторых простых сценах, 12.4. Анализ многогранников 12.4.3. МОНОКУЛЯРНОЕ ОПРЕДЕЛЕНИЕ ТРЕХМЕРНОЙ СТРУКТУРЫ Важной задачей в анализе сцен является задача определения по картинке (или по картинкам) трехмерной структуры видимой части объекта.
В предыдущем обсуждении стереоскопического восприятия мы показали, как можно решить эту проблему, используя стереопару изображений; сейчас нас интересует решение, для которого требуется только одна картинка. Конечно, если мы совершенно ничего не знаем об интересующем нас объекте, то вполне понятно, что его трехмерную структуру нельзя определить по одной картинке '). В последующем изложении принятое допущение будет состоять в том, что интересующий нас объект есть многогранник. Наша первая цель сводится к и тому, чтобы разработать общий б и метод определения трехмерной 7 структуры по информации, по- з ставляемой единственной картинкой, и по «небольшому числу» дополнительных фактов.
Затем мы усовершеиствуем этот метод, приняв дополнительное ограничение, что многогранные 2 объекты имеют степень 3. Для начала обратимся вновь Рис. 12.17. МногогРанник. к некоторым основным свойствам перспективных преобразований. Для конкретности мы свяжем эти свойства с простым многогранником, показанным на рис. 12.17. Каждая точка этой сцены, и в особенности каждое изображение вершины, определяет положение луча в пространстве.
Каждая вершина реального трехмерного тела должна лежать на луче, который исходит из центра объектива камеры, проходит через образ вершины и продолжается в пространстве; точное положение вершины фиксировано, если мы знаем ее расстояние от центра объектива. Таким образом, если дана картинка (монокулярная), задача определения трехмерной структуры многогранника эквивалентна задаче определения расстояний от центра объектива до каждой из его семи вершин. Должно быть ясно, что картинка вместе с тем дополнительным фактом, что показанный объект есть многогранник, не дает достаточно информации для решения этой задачи.
Предположим, однако, что мы также знаем положение в трехмерном пространстве »1 Хотя одной картинки недостаточно, можно довольствоваться единственной позицией камеры. Если камеру можно точно сфокусировать иа некоторую часть объекта, расстояние ог камеры до части объекта моисет быть определено по данным, полученным при фокусировке. По поводу исследования такого метода мы отсылаем читателя к литературе, приведенной в конце этой главы.
Гл. 12, Соеталлеиие и обработка оииеаиий вершин 1, 2, 3 и 7. Поскольку три точки задают положение плоскости, мы можем использовать трехмерные координаты вершин 1, 2 и 7, чтобы определить положение в пространстве плоскости А. Заметим теперь, что вершина 6 лежит на плоскости А; следовательно, ее положение фиксировано на пересечении соответствующего ей луча с этой плоскостью. Подобным же образом положение в пространстве вершины 4.можно определить, зная положения вершин 2, 3 и 7. В этой ситуации известны положения в пространстве вершин 4, 6 и 7, поэтому плоскость С фиксирована, и можно найти положение вершины 5. То есть в этом примере и для данной картинки достаточно иметь информацию о том, что показанный на картинне объект есть многогранник, и знать положение в пространстве вершин 1, 2, 3 и 7, чтобы определить положение в пространстве остальных вершин и, следовательно, трехмерную структуру видимой части многогранника.
В связи с предыдущим примером естественно задать вопрос, достаточно ли в общем случае четырех любых еизвестных» вершин для определения трехмерной структуры. Ответ на этот вопрос отрицательный: если четыре точки не являются независимыми, т. е. если любые три из них лежат на одном ребре или если все они лежат на одной грани, то, как легко показать, этих точек недостаточно. Предположим, однако, что мы знаем четыре независимые точки многогранника, но допустим, что невозможно сцепить их вместе, как в предыдущем случае, Например, для,рис.
12.17 мы можем знать пары противоположных вершин, таких, как 1, 2, 4 и 5; будет ли их достаточно, чтобы определить структуру? Для этого примера ответ положителен. Обозначив символом д неизвестное расстояние от объектива до вершины 7, можно задать вершину 6 через е1 и затем задать вершину 5 через д; но положение вершины 5 уже известно, поэтому можно найти величину д и определить положение всех вершин. Описанный выше метод приводит к наблюдению, что некоторые характерные точки тела лежат более чем в одной плоскости. Поэтому метод можнп формализовать, выразив это наблюдение в аналитической форме.
Мы будем для простоты составлять все уравнения в системе координат, начало которой совпадает с центром объектива. Заметим прежде всего, что уравнение любой плоскости многогранника имеет вид х ч=!, где х — трехмерный вектор точки, лежащей на плоскости, а ч— нормальный относительно плоскости трехмерный вектор, длина которого обратна расстоянию от начала координат до плоскости. Пусть Р— произвольная точка, лежащая на плоскости; ее образ, скажем Р', задает луч в пространстве. Поскольку мы поместили начало координат, в центр объектива, любая точка на луче имеет вид ап, 12.4. Анаваэ мнгаограннаков 489 где и — единичный трехмерный вектор, направленный по лучу, и а — расстояние от точки до начала координат. Тогда условие того, что точка Р лежит на луче, заданном ее образом, и одновременно на плоскости, определяемой вектором ч, может быть записано в виде аи ч=1, или и у — — — =Ь.
1 а Применим этот простой анализ к сцене рис, 12,17. Мы будем индексировать переменные буквами или' цифрами, чтобы указать плоскость или точку, к которой онн относятся. Поскольку вершины 1, 2, б и 7 находятся на плоскости А, мы напишем и, чд —— -Ь„ и, чд -Ь„ и, чд — Ь„ иг'уд =Ьг.