Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 55
Текст из файла (страница 55)
Сатр., С-19, 9!?— 923 (Ос(оЬег 1970). Хартнган (Наг(!цап Л. А.) йергеьеп(а!!оп о$ япп1агИу вв!Нсез Ьу 1геез, Л. Атее!сан 3(аг!зйса! Азнс., 62, 1140 — 1158 (ОесевЬег 1967). Хесселблад (Наые!Ыаб 'сс'.) ЕзИгааВоп о$ рагвспе1егз (ог а пцх1ше о$ попив! сИз!пЬц1(опз, Тесйпоте!псз, 8, 431 — 444 (Ацйпз( 1966).
Хилборн, Лейниотис (НИ!Ьогп С. О., Лг., 1.а!п!оИз О. О.) ОрИва! цпьпрегизеб 1евгп!пи вцй)са1ееогу дерепбеп! Ьуро1Ьезез ра$1егп гесодпйюп, 1ЕЕЕ Тгапя 1н)о. Тйеогу, 1Т-14, 468 — 470 (Мау 1968). Холл, Теппинг, Болл (Най О. Л., Терр!пд В., Вай О. Н.) ТЬеогеИса! апб еврее!пзеп1а! с1цз(ег!па снагас(ег!з$!сз 1ог пвИ(чапа$е гапбогп апд ь1гцс1цгед ба(а, сп АррИса$юпь о1 с!цз(ег апа1уз(з $о Вцгеац о1 1Ье Сепзцз ба!а, Ипа! Керог1, Соп1гас1 Ссо-9312, 5К1 Рго!ес1 7600, 5$ап1огб КеьеагсЬ 1пз11!ц!е, Меп!о Раей, СаИ.
(1970). 277 Задача Кэрэлик, Дингатейн (Нага!(сй й. М., Ббпь(е(п 1.) Лп !1егаИче с!иаеппе ргоседиге, 7ЕЕЕ Тгалюсаоль ол Зуь., Маа, алд Суд„ 5МС-1, 275 — 289 (!и )у 1971), Кэрэлик, Келли (НагаИсй )?. М., Кебу С. 1.) Рабегп гесоап61оп мИЬ веаьигепмп1 ьрасе апб ьраИа! с1иь1ег!пй !ог ппгуар!е !тайеь, Ргос. !ЕЕЕ, 67, 654 — 665 (Арг!1 1969). Цьнь (Яайп С. Т.) СгарЬИЬеогеИса! гае!Ьодь (ог бе(есИпе апб деьспЬ!плесь!аИ с1иь!егз, !ЕЕЕ Тгалк Сотр., С-20, 68 — 86 (3апиагу !971).
!Иепард (5Лерагд )?. Ы.) ТЬе апа!уйь о( ргох!пиИеь; гпи16йгаепьюпа! ьсаИпй вч!Ь ап ипКпоччп йь1апсе (ипсбоп„рьусйоамгг!)га, 27, 125 — !39, 219 — 246 (1962). ендрюс, Атрубнн, Ху (Апдгеччь Р. Я., А!гнЬ1п А. й, Ни К. С.) ТЬе!БМ 1975 ОрИса! Раее йеадег. Раг1 3: Яесодп!Поп !ой!с бете!арсаев!, !ВМ 7оигла(, 12, 334 — 371 (5ер1егпЬег 1968). Якович (Уайочгйг 5. 3.) (!пьирегтаед !еагп!п2 апб !Ье !беп!гИсаИоп о1 ИпИе пнк1игез, !ЕЕЕ Тишь. !п)о.
Тйсогу, 1Т-!6, 330 — 338 (Мау 1970). Якович, Спреджинс (Уайон41г 5. Л., 5рга9)пь Л. 1?.) Оп 1Ье !беп61!аЬ!61у о( ИпИе т!г(игеь, А ли, Майн 3!а!., 39, 209 — 214 (РеЬ- гиагу 1968). Янг, Коралуппи (гоипд Т. т'., Сога1ирр! С.) 51осЬаь(!с еь1!тагюп о( а пнх1иге о1 поггаа) беня(у Раис(!опз ийпй ап !п(огтаИоп сг(1ег!оп, !ЕЕЕ Тгалз. !л)а. Тйеогу, 1Т-16, 258 — 263 (Мау 1970).
Задача 1. Предположим, что х может принимать значения О, 1, ..., т и что Р(х18) смесь 'с биномиальных распределений Предполагая, что априорные вероятности известны, объясните, почему зта смесь неидентнфицируема, если т(с. Как изменится ответ, если априорные вероятности тоже неизвестны? 2. Пусть х — двоичный вектор и Р(х!Е) — смесь нз с многомерных распределений Бернулли: ч Р(х! Е)= ~Ч~ РР(х! ыг, ОДР(ю!), г=! где Р(х)ын Ег)=Ц Е !(1 — Е!!) !. г! а) Покажите, что д 1ой Р (х ! тн Ег) хг — Ег! дб! Ег (1-0,) Гл. б.
Обучение без учишеля и грулпиреехо б) Используя общее уравнение оценки по максимуму правдоподобия, покд жите, что оценка по максимуму правдоподобия 8! для 0; должна удовлетворят! л ч' „Р(вг!х,, 8дх„ 8 — '=! ! л ~я~' Р(вг) х», 0!) »=! 3. Рассмотрим одномерную нормальную смесь Напишите программу для ЭВМ, которая использует общее уравнение максимального правдоподобия нз и. 6.4.3 двя итерационной оценки неизвестных средних, дисперсий и априорных вероятностей.
Используя эчу программу, найдите оценки цо максимуму правдоподабкя этих параметров для дэнных нз табл. 6.1. (Олмееп р,= — 2,404, )чэ= 1,491, о,=0,577, оэ= 1,338, Р (в,)=-0,268, Р (вэ)=0,732.) 4. Пусть р(х!О) — нормальная плотность смеси из с компонент с р(х(вп О) л!'(Ргоч!0). Используя результаты равд. 6.3, покажите, что оценка по максимуму правдоподобия для о! должна удовлетворять соотношению — Р(вг(х», 8Д((х» — ри 1(э оэ л Р(вг(х», 0Д »=! где р; н Р (в! ( хв 0!) заданы уравнениями (15) и (17) соответственно.
б. Вывод уравнений для оценки по максимуму правдоподобия параметров плотности смеси был сделан при предположении, что параметры в каждой алатности компонент функционально независимы. Вместо этого предположим, чта р(к!а)= Я р(х(вр а) Р(в)), 1=! где а — параметр, который появляегся в некоторых плотностях компонент. Пусть 1 — логарифмическая функция правдоподобия для и выборок. Покажите, что л е 01 и тч д!одр(х»(вю и) ~.-г г. Р ди где р (х» !геу,а) Р (в)) Р (в;(х»,в)лл р(х»(а) 6.
Пусть р(х|вп 0!)-У(Р!ь Е), где Х вЂ” общая матрица коваривций для с плотностей компонент. Пусть о — рд-й элемент Х, оре — рд-й элемент Х -э, хр(й) — р-й элемент х» и рр( — р.й элемент Рр Задачи 2?9 а) Покажите, что д!ойр(ха(ын 6!) / брс'! д гк =(, ! — -Г~ (арс — (хр (й) — рр (!')) (хн (й) — рч (8)! б) Используя этот результат и результат задачи 5, покажите, что оценка по максимуму правдоподобия для Х должна удовлетворять л с 2 = — Ъ хахэ — ~~~~~ Р(кн) р,~с! и а=! г=! где Р (ы!) и )с! — оценки по максимуму правдоподобия, данные уравнениями (!4) н (15) в тексте.
?. Покажите, что оценка по максимуму правдоподобия для априорной веро. ятности может быть равна нулю, рассмотрев следующий особый случай. Пусть р(х!е) У(0, 1) и р(х)ыз)-дг(0,(!/2)), чак что Р(ыг) — единственный ненз. вестный параметр плотности смеси ,(.) = Р(ю!) е-!г?ч! *+(' — Р(ы!)).-.* г' 2л Покажите, что оценка по максимальному правдоподобию Р(ы,) для Р(ыг) равна 3 нулю, если имеется одна выборка х! и хг()о62.
Каково значение Р(ы,), если х!ч))ой 2 ? 8. Рассмотрим одномерную нормальную плотность смеси с р(х(р рс)=~~„н~ = "Р ~ ( — ) 1 1= 1 в иоторой у всех компонент одна и та же известная дисперсия аз. Предположим, что средние настолько отдалены друг ат друга по сравнению с а, что для всех х всеми, кроме одного, членами этой суммы можно пренебречь. Используя эври. стические соображения, покажите, что значение (1 п!ах 1 — !айР(х„..., х„! Р„..., Рс)) ' л должно быть равно приблизительно с ! 1 Р(ы.) 1опР(ы ) — — 1оййпае, 1=! когда число л независимых выборок велиио. Сравните его со значением, показан- ным на рнс.
6.1. 9. Пусть 8, и 6з — неизвестные параметры для плотностей компонент р (х! ыг, 8,) и р(х)ыз, 8э) соответственно. Презположим, что 8, и 6э первоначальна статистиче- ски независимы, так что р(8н 8з)=рд(8!)рз(8з). Покажите, что. после того как была получена одна выборка х! из плотности смеси, р(8,, бэ)х!) не может быть представлена в виде р (6, ! «!) р, (8, ! х!), если др(х!ыг, 8;) ! Часть И АНАЛИЗ СЦЕН Глава 7 ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИИ И ИХ ПЕРВОНАЧАЛЬНЫЕ УПРОЩЕНИЯ тгк ВВЕДЕНИЕ Цель, которую мы преследуем во второй части этой книги, заключается в том, чтобы изложить основы автоматического анализа сцен. Нас будут интересовать методы упрощения и описания изображений при помощи ЭВМ, позволяющие давать ответ на вопросы нли выполнять команды такого рода: «Изображен ли на картинке стулу», «Назови все объекты на картинке», «Изображают ли две картинки один и тот же объект?» или в более общем случае: «Опиши сцену».
Чтобы читатель почувствовал всю широту данной проблемы, перечислим некоторые из многих применений анализа' сцен. В первых работах р центре внимания было опознавание знаков, имеющее важное практическое значение н по сей день. Опознавание знаков представляет собой скорее задачу классификации, чем составления описания, поэтому здесь вполне применим математический аппарат, который обсуждался в'ч. 1.
В этом случае, как и вообще в задачах классификации, назначение методов анализа сцен, которые мы будем рассматривать ниже, заключается в выделении множества признаков для классификатора изображений. Интерес к совсем иной области проблем. связан с теми исследованиями специалистов по физике элементарных частиц, в ходе которых получают большое число снимков взаимодействия частиц в пузырьковых и искровых камерах. Задача этих исследований обычно заключается в том, чтобы обнаруживать определенные события путем анализа треков на фотографиях. Третий важный круг задач связан с биомедицинскнми исследованиями.
Большое число препаратов, изучаемых визуально под микроскопом, которые просматриваются в ходе как клинических, так н чисто научных исследований, послужило естественной причиной разработки методов автоматического анализа. И наконец, как последний пример: существуют роботы-манипуля- 7.2. Предста«»ение информации торы и роботы-тележки, возможности и гибкость которых значительно возрастают, если онн снабжены сенсорными системами, и особенно зрением.
Следует отметить, что само по себе название проблемной области еще ничего не говорит о трудностях, с которыми приходится сталкиваться при решении связанных с этой областью задач анализа сцен. Возьмем в качестве примера опознавание знаков, которое в некоторых отношениях является сравнительно простой областью задач. Трудность задачи опознавания знаков зависит от многих причин: выполнены ли знаки рукой человека или машиной; если машиной, то сколько образцов типографсдого шрифта использовалось— один или несколько; если рукой человека, то одним человеком или несколькими н т. д.
и т. п. Следовательно, в анализесцен речь идет не только о большом разнообразии проблемных областей, но и о значительном многообразии задач в пределах одной области. Конечно, было бы наивно предполагать, что единая методика или небольшой набор технических приемов были бы применимы ко всем задачам из такого широкого спектра проблем. На самом деле из-за такого многообразия трудно охарактеризовать анализ сцен в целом: можно лишь отметить, что, по существу, этот процесс является процессом упрощения. Главная проблема заключается в том, чтобы преобразовать изображение, представленное, возможно, десятками тысяч битов информации, в «описанне» или «классификацию», представленную лишь несколькимн десятками битов. Поэтому нас будут интересовать методы упрощения изображений — подавления несущественных деталей, описания форм и размеров объектов на изображении, объединения отдельных частей изображения в осмыслечные образования — и вообще методы уменыпения сложности данных.
7.2. ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ Предположим, что у нас имеется обыкновенный фотографический диапозитив и мы хотим проанализировать его с помощью цифровой вычислительной машины. Одной из первых задач является, очевидно, выбор способа представления изображения, пригодного для машины. Существует много вариантов такого выбора, но мы можем упорядочить их, обратив внимание на то, что черно-белое изображение можно рассматривать как вещественную функцию двух переменных. Для определенности предположим, что изображение лежит в плоскости, снабженной координатными осями х и у.
Определим функцию интенсивностям ') у(х, у) как величину, пропорциональную интенсивности света, падающего на изображение в точке (х, у) '), '). Интенсивность ») В оригинале рг«1пге 1ппс1юп.— Прим. ред. з) Не следует смешявать применяемое здесь обозначение у(яе у) с разделяющнмн функциями, описанными в ч. 1. ') Подразумевается изображение прн проектнрованнн слайда.— Прим. ред. Гл.