Глава 6 (Учебник в электронном виде), страница 15
Описание файла
Файл "Глава 6" внутри архива находится в папке "Учебник". Документ из архива "Учебник в электронном виде", который расположен в категории "". Всё это находится в предмете "информационные устройства и системы" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "информационные устройства и системы" в общих файлах.
Онлайн просмотр документа "Глава 6"
Текст 15 страницы из документа "Глава 6"
Иерархия информационных процессов при описании изображения может быть грубо представлена в виде трех уровней:
-
представление характеристик двухмерного изображения (типа изменений значений яркости и локальных геометрических свойств);
-
представление характеристик видимых поверхностей (ориентации, отражающей способности, расстояния) в системе координат наблюдателя;
-
представление трехмерной структуры (в сочетании с какими-либо свойствами поверхности) в системе координат объекта.
Наибольшего успеха удалось достичь в исследовании первого уровня описания. Физиологи обнаружили визуальные каналы, обладающие избирательностью по ориентации и пространственной частоте. На основании этих результатов была предложена операторная модель, в которой каждая точка поля зрения содержит четыре настраиваемых на пространственный размер фильтра (маски), предназначенных для анализа изображения. Размер маски, соответствующей каналу, растет линейно с увеличением эксцентриситета (углового расстояния от центральной ямки). В порядке увеличения размера маски каналы называются N, S, T и U. Канал S обладает наибольшей чувствительностью как по отношению к тонической (амплитудной), так и фазной стимуляции, канал U - наименьшей. Размеры рецептивных полей составляют: 3,1’ (для канала N - это примерно 9 колбочек центральной ямки), 6,2’ (канал S), 11,7’ (канал T), 21’(канал U).
А лгоритмическую основу каналов образуют 2G-фильтры (рис. 6.42). Оператор 2G аппроксимирует полосовой фильтр шириной 1,25 октавы, соответствующей половине энергии спектра. Обозначено: 2 - оператор Лапласа (2 = 2/x2 + 2/y2), а символ G обозначает распределение Гаусса:
2G фильтр обладает двумя существенными свойствами. Во-первых, он реализует дифференциальный оператор, вычисляющий первую и вторую пространственную производную изображения, что позволяет четко выделять границы. (Именно в контуре изображения содержится большая часть информации об объекте; по оценкам физиологов - до 90%). Во-вторых, он допускает настройку на разных масштабных уровнях, что позволяет обнаруживать границы на размытых участках на больших фрагментах изображения и обнаруживать малые элементы изображения на его хорошо сфокусированных участках. Физиологическая реализация 2G-фильтра основана на взаимодействии возбуждающих и тормозящих функций, реализуемых центральной и периферической областями рецептивных полей.
Алгоритмическое обеспечение СТЗ можно условно представить в виде двух групп алгоритмов, выполняющих функции:
-
обработки изображений;
-
анализа визуальных образов.
Если СТЗ содержит алгоритмы исключительно первой группы, то, согласно приведенной ранее классификации, ее можно отнести к СТЗ нижнего и среднего уровня.
Сущность обработки изображений заключается в приведении исходного изображения сцены к виду, достаточного для его распознавания. Сюда относятся многочисленные процедуры формирования и улучшения изображения (включающие компенсацию оптических помех и сглаживание), бинаризация, получение контурного представления изображения, выделение элементов сцены и определение их признаков. Конечной целью обработки изображений в СТЗ является подготовка объектов сцены к распознаванию, т.е. отнесению их к некоторым заранее заданным классам. Несмотря на многообразие представленных процедур, обработка изображений в СТЗ разбивается на три основные этапа:
-
ввод и предварительная обработка изображения;
-
сегментация;
-
описание.
В свою очередь, этап предварительной обработки изображений принято разделять на две базовых процедуры: формирование изображения и его кодирование (сжатие). При этом кодирование, в зависимости от вида сцены, может проводиться как до, так и после сегментации. В частности, для сцен, содержащих несколько объектов, сегментация предшествует кодированию. Для удобства представим базовые процедуры обработки изображений в виде табл. 6.17.
Таблица 6.17. Этапы обработки изображений
Обработка изображений | ||
1 | Ввод изображения (восприятие) | |
2 | Предварительная обработка: | Формирование Кодирование |
3 | Сегментация | |
4 | Описание |
6.6.1. Предварительная обработка изображений
Все методы предварительной обработки изображений можно подразделить на пространственные и частотные.
П ространственные методы обработки являются процедурами, оперирующими непосредственно с пикселями изображения. В общем виде, функции предварительной обработки в пространственной области записываются в виде выражения:
где F (x, y) и G (x, y) - соответственно изображение на входе и выходе преобразователя, H – оператор (функция преобразования). В качестве характеристики изображения используется яркость L(x, y).
Частотные методы обработки связаны с переводом изображения в комплексную плоскость с помощью преобразования Фурье.
Первый этап предварительной обработки представляет собой формирование изображения. Формированием изображения называется процедура непосредственного получения изображения в виде массива дискретных элементов - пикселей, образующих матрицу или контур и расположенного в памяти видеопроцессора. Пример изображения некоторого (тестового) объекта G(x, y) представлен на рис. 6.43.
На этапе формирования изображения в СТЗ производится его фильтрация, т.е. аппаратная или программная компенсация оптических помех и сглаживание дискретного изображения, а также выделение контуров - краев и линий. (Как уже отмечалось во введении, до 90% всей информации об изображении содержится в его контуре).
Основные этапы формирования изображений приведены в табл. 6.18.
Таблица 6.18. Этапы формирования изображений
Формирование изображений | ||
1 | Выбор порога яркости (улучшение) | |
2 | Фильтрация | Компенсация помех Сглаживание |
3 | Выделение контуров | |
4 | Бинаризация |
Преобразование цифрового изображения L(m, n) на этапе выделения контуров значительно уменьшает объем визуальной информации - обычно передаются только координаты и яркость элементов, относящихся к границам перепадов яркости. Величина этого перепада задается относительно некоторого значения яркости, называемого порогом.
Р ассмотрим некоторые особенности выбора порога яркости. Качество изображения в СТЗ сильно зависит от освещенности рабочей сцены. Если она занижена, то увеличивается количество помех на изображении (вплоть до потери объекта), при очень сильной освещенности происходит засветка изображения (и опять же потеря объекта). В современных СТЗ предусмотрены средства автоматической адаптации при изменении освещения, получившие название систем автоматической регулировки освещения. Использование этих средств позволяет компенсировать некоторые помехи, в частности, блики и тени.
Наиболее известный способ улучшения изображения предполагает программную (покадровую) регулировку яркости и контрастности вводимого изображения. Для каждого кадра строится гистограмма распределения яркости изображения L(x, y) (рис. 6.44), и вычисляются ее параметры: математическое ожидание (среднее значение) и дисперсия. На рисунке обозначено n - количество пикселей L(x, y) - яркость.
Каждая точка гистограммы определяет, какое количество пикселей на изображении имеет данное значение яркости. При этом среднее значение гистограммы определяет общую яркость изображения, а дисперсия (размах гистограммы) - его контрастность. Иногда вместо гистограммы распределения яркости используется функция плотности вероятности P(Ln) нормированного значения яркости Ln [0,1] (рис. 6.45).
Обычно перед началом работы производится настройка уровня освещенности по гистограмме изображения. Данная процедура является рекуррентной. Вычисленные параметры гистограммы распределения яркости текущего кадра сравниваются с оптимальными - определенными заранее экспериментальным путем; после чего соответствующим образом изменяются значения регистров фреймграббера. Затем считывается следующий кадр, снова строится гистограмма, вычисляются ее параметры и т.д. Так продолжается до тех пор, пока отклонение текущего среднего значения и дисперсии от оптимума не становится меньше некоторой заранее заданной величины (например,10 %). В этом случае, настройка заканчивается, и управление передается основной части программы.
Коррекция гистограммы дает общее улучшение качества на всем поле изображения. Для улучшения изображения малых участков указанный подход применяют к некоторой окрестности изображения. Тогда, для каждого пикселя строится гистограмма точек данной окрестности, которая используется для отображения яркости пикселя, расположенного в центре выбранной окрестности. Далее центр перемещается на соседний пиксель, и вся процедура повторяется снова.
Процедура бинаризации, т.е. преобразования полутонового изображения в бинарное, может проводиться непосредственно после гистограммного улучшения с помощью гистограммы полутонов. Так, если в изображении представлены светлые объекты на темном фоне гистограмма будет двухмодальной - яркости пикселей объектов и фона образуют две области. Бинаризованное изображение тестового объекта приведено на рис. 6.46. Для отделения объекта от фона выбирается пороговое значение яркости Lпор, которое разделяет эти области. Л юбая точка изображения с яркостью L(x, y) > Lпор принадлежит объекту, а в противном случае - фону. Выходное бинаризованное изображение D(x, y) содержит лишь две градации яркости: 0 или 1, причем:
Таким образом, на изображении D(x, y) пиксели со значением 1 принадлежат объектам, а пиксели со значением 0 - фону.
Фильтрация изображения является, пожалуй, наиболее длительной и сложной стадией предобработки. На данный момент, в мире существует огромное количество различных способов фильтрации и у каждого есть свои достоинства и свои недостатки. В общем случае, фильтрация решает следующие основные задачи:
-
«сглаживание» или подавление высокочастотной помехи (типа «снег»);
-
повышение контрастности;
-
выделение контура.
Как известно, на начальных этапах преобразования на изображение действуют аппаратурные помехи, искажающие функцию распределения интенсивности света L(x, y). (Сюда относятся искажения, вносимые оптикой, дискретизацией по полю из-за отдельного расположения ячеек светочувствительной поверхности и неоднородностью их фотоэлектрических характеристик и т.д.). Фильтрация помех - сглаживание чаще всего проводится после получения цифрового изображения, и смысл ее заключается в усреднении (по определенному правилу) значения функции L(m, n) внутри небольшого анализируемого фрагмента (программного окна), сканирующего изображение.
О бычно спектр визуальных помех содержит более высокие пространственные частоты, чем спектр изображения. Для их устранения используется фильтр нижних частот, подавляющий высокие частоты (при этом ухудшается резкость изображения).