Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 56
Текст из файла (страница 56)
7. Предетаалеиие иееараееений изображения в некоторой точке называется также уровнем полутонов или яркосепью. Во всяком случае, с математической точки зрения изображение определяется путем задания его функции интенсивности. Теперь, поскольку мы условились рассматривать изображения как функции, очевидно, что любые средства для представления функции в цифровой вычислительной машине могут быть использованы и для представления изображения. Некоторые методы можно отвергнуть сразу же как неподходящие для решаемой задачи. Много- члены, например, обычно задают в памяти машины набором их коэффициентов, но немногие интересующие нас функции интенсивности представляют собой просто многочлены невысокой степени.
И вообще, поскольку функция интенсивности, представляющая интерес, редко имеет простую аналитическую форму, ее задают обычно путем измерения ее значений в достаточно большом числе дискретных точек в плоскости (Х, у') и запоминания величин этих отсчетов. Этот процесс называется взятием отсчетов или квантованием. Для того чтобы задать алгоритм квантования, мы должны сначала установитчь где нужно брать отсчеты. Самым простым решением является разбиение плоскости изображения с помощью сетки на квадратные клетки и взятие отсчета функции интенсивности в центре каждой клетки. Далее, функция интенсивности, вообще говоря, может принимать любые значения между некоторым минимумом (черное) и максимумом (белое), в то время как в цифровой вычислительной машине можно задавать только конечное число значений.
Поэтому мы должны также разбить диапазон амплитуд функции интенсивности на ограниченное число градаций. Сделав это, мы зададим некоторый алгоритм представления исходной функции интенсивности массивом целых чисел, где каждый элемент массива приблизительно определяет уровень полутонов соответствующей клетки изображения. Рассмотрим несколько более подробно проблему разбиения цолутоновой шкалы на ряд дискретных градаций. Простейший способ выполнить эту задачу состоит в разбиении диапазона изменения интенсивностей изображения от черного к белому на одинаковые интервалы. Если мы выберем этот вариант, мы должны только определить число градаций, или, другими словами, степень подробности разбиения.
К сожалению, по этому вопросу не существует теоретического обоснования, и поэтому обычно приходится идти на некоторый компромисс между желанием точно задать изображение и необходимостью сохранять объем данных для вычислений в разумных пределах.
Не обязательно, однако, выбирать ступени квантования одинаковыми. Пусть, например, у нас есть основания полагать, что большинство деталей в изображении приходится на темные области. Тогда, если число градаций не должно превосходить некоторого заданного значения, имело бы смысл, конечно, 7.а. Представление информации квантовать неравномерно. Мы бы тогда разбили «темные» области полутоновой шкалы на сравннтельно мелкие ступенн, а «светлые» области — на сравнительно крупные.
Если же у нас нет специальных предварительных знаний об изображении, можно руководствоваться сведениями об устройстве зрнтельной системы человека, реакция которой на освещенность приблизительно. описывается логарифмнческой характеристикой. Другими словами, логарнфмнческне ') изменения физической ннтенснвностн зрительного стимула воспринимаются человеком как «в равной степени заметные на глаз» изменения. Этот феномен (который, по-внднмому, имеет место н для слухового н тактильного стимулов) подсказывает, что следует взять сначала логарифм от функции ннтенснвностн н квантовать затем равномерно величину 1од у(х, у). Перейдем теперь к вопросу о шаге сетки отсчетов. Эта проблема аналогична проблеме квантования полутоновой шкалы, но здесь мы располагаем некоторым теоретическим руководством в виде нзвестной теоремы отсчетов Шеннона ').
Для обсуждения этой теоремы требуются некоторые сведения о двумерных преобразованиях Фурье, поэтому мы отложим этот вопрос до следующей главы. Можно лищь отметить, что плоскость изображения может быть разбита не только с помощью сетки нз квадратных элементов. В такой сетке два элемента, имеющие общий угол, не всегда имеют общую сторону. Эта особенность прн осуществлении ряда операций по обработке изображения, которые будут рассматриваться позднее, вызывает определенные неудобства. Для устранения этих неудобств иногда предлагают разбивать плоскость изображения на шестнугольники, но во многих случаях достигнутое преимущество не оправдывает связанных с таким вариантом дополнительных усложнений. В дальнейшем всюду, где это удобно, мы будем полагать, что нзображенне может быть представлено обычной матрнцей, вещественные элементы которой определяют (прнблнженно) значения функции ннтенснвностн в соответствующей области плоскости изображения.
В тех случаях, когда нет опасности различного толкования, мы будем обозначать элемент 1-й строки /-го столбца этой матрицы через й((, !) н тогда будем говорить од как о диснретпнойе функции инпгенсивности. Неквантованная функция интенсивности у(х, у) будет называться аналоговой функцией интенсивности.
Для удобства мы условимся также, что малые н большие значения квантованной функции интенсивности изображают соответственно темные н светлые уровни этой величины. В качестве примера, иллюстрирующего изложенное выше, рассмотрим рнс. 7.1 н 7.2. На рнс. 7.1 показана трехмерная сцена, содержащая объекты простой геометрнческой формы. Изображение В Видимо, оговорка; по смыслу — «»кспоненциальные».— Прим.
пере«. '! См. примечание на стр. 323.— Прим. перев. Гл. 7. Представление изображении было взято прямо с обычного телевизионного монитора, но для наших непосредственных целей безразлично, имеем ли мы дело с телевизионными изображениями, фотографическими диапозитивами нли любыми другими видами изображений.
На рис. 7.2 показан квантованный вариант изображения рис. 7.!. Мы использовали квадратную сетку отсчетов со 120 элементами по каждой стороне и проквантовалн полутоновую шкалу на 1б равномерно расположенных уровней. Само по себе квантованное изображение представляет собой, конечно, некоторую матрицу, но мы вывели на экран этот массив чисел в виде «картинки», т. е. как совокупность дискретных точек. Рис.?.1. Изображение на телевизионном мониторе.
Рис. 7.2. Дискретное изображе. ние. Каждая точка в изображенном массиве имеет один из 16 полутоновых уровней, н номер этого уровня определяется соответствующим числом в матрице. Можно было бы заметить здесь, что задний край клина едва отличим в квантованном изображении от стены позади этого клина, Действительно, между этими областями существует разность интенсивности в один уровень квантования.
К сожалению, на середине пола и стены имеется много перепадов интенсивности в один уровень квантования, вызванных тенями на исходном изображении. Следовательно, в упрощенном изображении окружающего мира разность в один полутоновый уровень квантования может считаться «незначительнойж Мы не будем подробноостанавливаться сейчас на этом вопросе, но можем сказать заранее, что задача определения, какие полутоновые перепады «значительные», является важной проблемой, которая, по-видимому, в общем случае не допускает быстрых и легких решений, 287 7.8. Проотринотвенное дифференцировиние 7.8. пвостмнстввннов диеэвввнцировднив Как мы отметили ранее, процесс анализа сцены является по существу процессом упрощения — сложный объект (нсходное изображение) превращается в более простой с помощью нескольких последовательных операций.
Естественным этапом этой последовательности является превращение исходного изображения в контурный рису. нок. Мы надеемся, что такой шаг сояранил бы существенные детали исходного изображения, сократив в то же время объем вычислений при последующих операциях. Для перехода к контурным изображениям существуют также психологические мотивы. Эксперименты показали, что внимание человека концентрируется в основном на границах между более или менее однородными областями. Мы признаем, конечно, что упрощение изображения до контурного рисунка связано с некоторым риском.
Контурное изображение обычно содержит меньше информации, чем исходное, и нет гарантии, что потерянная информация является несущественной. Пока, однако, мы примем, что преобразование изображения в контурный рисунок является при некоторых обстоятельствах полезным, и сосредоточим наше внимание на способах осуществления этой операции. Контурное изображение может быть получено из исходного путем выделения областей, содержащих резкие переходы от темного к светлому, и подавления областей с примерно однородной интенсивностью.
Другими словами, контуры есть края, а края — это по определению переходы между двумя существенно различными интенсивностями. На языке функций интенсивности край — это область плоскости (Х, )'), где велик градиент функции д(х, у). Для получения контурного рисунка, таким образом, требуется оценка величины модуля градиента функции. Эту величину можно вычислить, если известны производные этой функции по каким-либо двум ортогональным направлениям. Следовательно, нужно только выбрать два ортогональных направления и способ приближенного вычисления (одномерной) производной, чтобы иметь все необходимые составляющие алгоритма получения контурных рисунков.