Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 321
Текст из файла (страница 321)
В [454] и [626] приведено исчерпывающее описание геометрии множественных представлений. В области компьютеризированных систем зрения наиболее важными основополагающими работами по логическому выводу формы на основании текстуры бьши [60] и [1461]. Они были посвящены описанию плоских поверхностей, а лля криволинейных поверхностей результаты исчерпывающего анализа приведены в [518] и [973].
В сообществе специалистов в области компьютерных систем зрения проблема логического вывода формы из данных о затенении была впервые исследована Ьертольдом Хорном [676]. В [678] представлен исчерпывающий обзор основных статей в этой области. В указанном научном направлении было принято принимать целый ряд упрощающих допущений, из которых наиболее важным было игнорирование влияния взаимного освещения. Важность проблемы взаимного освещения была впервые осознана в сообществе специалистов по компьютерной графике, которые стремились точно разрабатывать модели трассировки лучей и диффузного отражения, чтобы учесть наличие взаимного освещения.
С критикой основных теоретических и эмпирических подходов в этой области можно ознакомиться в [484]. В области логического вывода информации о форме по данным о контурах самый первый, решающий вклад был сделан Хаффменом [702] и Клоувсом [271], после чего Маккуорт [966] и Сугихара [! 473] провели до конца анализ методов, применимых к многогранным объектам. Малик [971] разработал схему разметки для кусочно-гладких криволинейных объектов.
В [801] показано, что задача разметки линий для трехгранных сцен является ]х[Р-полной. Для правильной трактовки визуальных эффектов, возникающих в проекциях гладких криволинейных объектов, требуется совместное использование дифференциальной геометрии и теории особенностей. Наилучшим исследованием на эту тему является книга Кендеринка ооЫ оларе [814]. Оригинальной работой по распознаванию трехмерных объектов явились тезисы Робертса [1294], опубликованные в Массачусетсском технологическим институте (Маззас1иззегз !па![гиге оГ Тес[ш1о81ез — М1Т).
Эту работу многие считают первыми тезисами докторской диссертации по машинному зрению; в ней впервые представлено несколько ключевых идей, в том числе касающихся обнаружения краев и согласования на основе моделей. Метод обнаружения краев Капни был представлен в [218]. Идея выравнивания, также впервые выдвинутая Робертсом, снова вышла на передний план в 1980-х годах после опубликования работ [711] и ]950]. Значительное повышение эффективности методов оценки позы путем выравнивания было достигнуто Олсоном [1156]. Еще одним важным направлением исследований в области распознавания 1184 Часть Ч!1.
Общение, восприятие и осуществление действий трехмерных объектов явился подход, основанный на идее описания форм в терминах объемных примитивов на основе 'гк обобщенных цилиндров, который был предложен Томом Бинфордом [128) и нашел особенно широкое распространение. Исследования в области машинного зрения, посвященные распознаванию объектов, в основном сосредоточивались на проблемах, возникающих в результате получения проекции трехмерных объектов в виде двухмерных изображений, а в сообществе специалистов по распознаванию образов существовала другая традиция, в которой эта задача рассматривалась как относящаяся к области классификации образов.
Этих специалистов в основным интересовали примеры, относящиеся к таким проблемным областям, как оптическое распознавание символов и распознавание рукописных почтовых кодов, в которых основные усилия были направлены на изучение характеристик типичных вариаций искомого класса объектов и отделение этих объектов от объектов других классов. Сравнение таких подходов приведено в [904). К другим работам по распознаванию объектов относятся исследования по распознаванию лиц (1422] и (1543). В [98) описан подход на основе контекста формы. В [395) впервые показаны результаты разработки автомобиля с визуальным управлением для автоматического вождения по автомагистралям на высоких скоростях; в (1224] показаны результаты достижения аналогичной производительности с использованием подхода на основе нейронной сети.
Наилучшее и самое полное описание человеческого зрения можно найти в книге Стивена Палмера У(з(ол 5с[епсе: Рршгот го РЬепотело!о8у (1167]; а книги Дзвида Хабела Еуе, Вгат апг! У(з(оп [700] и Ирвина Рока Регсерг(оп (1300] представляют собой краткие введения, в основном посвященные соответственно нейрофизиологии и восприятию. В настоящее время наиболее всесторонним учебником для специалистов по машинному зрению является книга Дзвида Форсита (1)ахЫ Гогзугп) и Джин Понсе (!еап Ропсе) Сотригег У(згоп: А Моцегл Арргоасд.
Значительно более краткие описания можно найти в [1111] и [1513]. Интерес представляют также два изданных немного раньше, но все еше значимых учебника, в каждом из которых рассматривается ряд специальных тем: ЯоЬо! Ум!оп (677) и 7Ьгее-Р!петляла! Сотригег У(з(оп [453]. Важную роль в объединении усилий специалистов по машинному зрению и специалистов по более традиционным областям биологического зрения (психофизике и нейробиологии) в свое время сыграла книга Дзвида Марра У!з(ол [986]. Двумя основными журналами по машинному зрению являются 7ЕЕЕ Тгалзасг(от ол Рацсгп Апа(ут аль Масйгле 7лге!(!8елсе и 7пгегпагрэпа! уоигпа! о7' Сотригег Ум(оп.
К числу конференций по машинному зрению относятся 7ССУ (1пгегпагюпа1 СопГегепсе оп Сотрцгег Чьз(оп), СУРЯ (Согпригег Ч1абоп апг[ Рацегп Весо8п(г)оп) и ЕССУ (Евгореап Соп(егепсе оп Сотригег Ч)з(оп). УПРАЖНЕНИЯ 24.!. В тени дерева с плотной, густой кроной можно обнаружить множество пятен света. На удивление, все эти пятна кажутся круглыми. С чем зто связано? Ведь в конечном итоге просветы между листъями, через которые проникают лучи солнца, вряд ли имеют круглую форму.
1185 Глава 24. Восприятие 24.2. Нанесите разметку на контурный рисунок, приведенный на рис. 24.23, приняв предположение, что все наружные края размечены как закрывающие н что все вершины являются трехгранными. Выполните эту задачу с помощью алгоритма перебора с возвратами, который проверяет вершины в последовательности л, и, с и и, выбирая на каждом этапе вариант, совместимый с размеченными ранее соединениями и краями.
После этого попробуйте применить последовательность вершин и, гз, л и ~. А Рис. 24.23. Рисунок, подяенсащий разметке, в котором все вершины явяяются трехгранными 24.3. Рассмотрим цилиндр бесконечной длины с радиусом к, ось которого направлена вдоль оси у. Цилиндр имеет ламбертову поверхность и рассматривается с помощью видеокамеры, направленной вдоль положительной оси а. Что вы можете рассчитывать увидеть на этом изображении, если цилиндр освещается точечным источником света, находящимся на бесконечно большом расстоянии со стороны положительной полуоси х? Объясните ваш ответ, нарисовав контуры равной яркости на спроектированном изображении.
Являются ли контуры равной яркости расположенными через равномерные интервалы? 24.4. Края на изображении могут соответствовать самым разнообразным визуальным эффектам, возникающим в сцене. Рассмотрите обложку данной книги и примите предположение, что это — картина реальной трехмерной сцены. Определите на этом изображении десять краев с различной яркостью и для каждого нз них укажите, соответствует ли оно сосредоточенной неоднородности: а) по глубине; б) по нормали к поверхности; в) по отражательной способности; г) по освещенности.
1186 а) в) 24.5. 24.6. 24.7. 24.8. 24.9. Часть ЪЧ1. Общение, восприятие и осуществление действий Покажите, что операция свертки с заданной функцией б является коммутативной по отношению к операции дифференцирования; иными словами, покажитс, что (Гвд) ' =Г*(д) '. Рассматривается вопрос о возможности применения некоторой стереоскопической системы для составления карты местности. Она состоит из двух видеокамер ССП, в каждой из которых имеется 512х512 пикселов на квадратном датчике плошадью 10х10 см. Применяемые линзы имеют фокусное расстояние 16 см, где фокус зафиксирован в бесконечности. Для соответствующих точек с координатами (и,, ь„) на левом изображении и (и,, ь,) на правом изображении верно, что т,= ~„поскольку оси х двух плоскостей изображения параллельны эпиполярным линиям. Оптические оси этих двух видеокамер являются параллельными.
Ьазисная линия между камерами равна 1 м. а) Если наименьшая дальность, которая должна быть измерена, равняется ! 6 м, то каково наибольшее рассогласование (в пикселах), которое может при этом возникнуть? б) Какова разрешающая способность по дальности на расстоянии 16 м, которая обусловлена наличием интервала между пикселами? в) Какая дальность соответствует рассогласованию в один пиксел? Предположим, что нужно применить алгоритм выравнивания в промышленной установке, в которой по ремню конвейера движутся плоские детали и фотографируются видеокамерой, находящейся вертикально нал ремнем конвейера.