Сравнительный анализ морфологических методов интерпретации изображений (1104888), страница 2
Текст из файла (страница 2)
Для всех рассмотренных алгоритмов найдена зависимость между уровнем шума, добавляемого в обучающую выборку, и уровнем шума, который ожидается у предъявляемых на распознавание данных.6Научная и практическая значимость работы. Проведенный сравнительныйанализ качества работы алгоритмов распознавания изображений реальных сценметодами ламбертовой и монохромной морфологий показал, что учет свойстваламбертовости исследуемого объекта при построении формы его изображения позволяет сделать алгоритм распознавания ламбертовых изображений, нечувствительным к характеру освещения объекта при условии, что освещение объекта однородно.
Изучение влияния состава обучающей выборки на качество распознавания объектов в шуме вышеуказанными параметрическими алгоритмами позволяетсделать вывод: при распознавании данных в шуме необходимо включение в состав обучающей выборки данных в шуме.Апробация работы. Основные результаты диссертации докладывались на: Международной конференции студентов и аспирантов по фундаментальным наукам"Ломоносов-2002", г. Москва; на семинарах в ВЦ РАН; на Всероссийских конференциях ММРО'99, ММРО'2000.Публикации. По теме диссертации опубликовано 5 работ.Структура и объем диссертации.
Диссертация состоит из введения, трех главосновного текста и заключения. Работа изложена на 134 страницах, содержит 78рисунков и список литературы из 98 наименования.СОДЕРЖАНИЕ РАБОТЫВведение содержит обоснование актуальности рассмотренных в диссертациипроблем. Здесь же определяются цель исследования, научная новизна и практическое значение.В первой главе производится обзор двух методов анализа изображений:морфологического метода интерпретации монохромных изображений6 и морфологического метода интерпретации ламбертовых изображений7. Методы называются "морфологическими" потому, что они дают возможность высказываться о7форме изображенных объектов. Эти методы предназначены для решения широкого класса задач, связанных с компьютерным анализом формы изображенных объектов и не зависят от условий регистрации изображений объектов.
Это следующие задачи:1. Распознавание изображений объектов в шуме по признакам их формы.2. Идентификация объектов по их изображениям, полученным при различных неконтролируемых условиях регистрации.3. Выделение отличий по форме изображений объектов, представленныхна различных изображениях, которые получены при неизвестных условиях регистрации.4. Выделение изображений неизвестных объектов на изображениях с известным фоном (эти изображения получены при неизвестных условияхрегистрации).5. Совмещение изображений, полученных при разных (неизвестных) условиях регистрации.и т.д.
Следует заметить, что методы предназначены для решения только таких задач, в которых вся доступная информация об объекте заключена в его изображении или изображениях, т.е. мы имеем возможность разглядывать объект, но неосязать его.В главе изложена теория морфологического анализа монохромных изображений. Дается определение формы изображения объекта, которая определяется каккласс его изображений, полученных при различных условиях6Пытьев Ю.П. Морфологический анализ изображений.
// Докл. АН СССР, 1983, т. 196, № 5, с. 1062-1064.7Yu.P.Pyt'ev, A.Yu.Pyt'ev. Effective Dimensionality and Data Compression. // Pattern Recognition And Image Analysis,1997, vol. 7, no. 4, pp. 393-406.регистрации. Показывается, что в простейшем случае форма изображения объектаопределяется как разбиение поля зрения на области, обладающие одинаковой илипочти одинаковой яркостью8.
Также в первой главе дается определение ламбертовости объекта: объект называется ламбертовым, если яркость в каждой его точке8не зависит от направления наблюдения при любом характере освещения. Даетсяопределение формы изображения ламбертового объекта как множества, котороепредставляет собой выпуклый замкнутый конус в трехмерном подпространствеевклидова пространства. Определяются эффективная размерность для множества"чистых" изображений и множества изображений в шуме. Показывается, что ответить на вопрос являются ли предъявленные изображения изображениями ламбертового объекта, можно решив задачу поиска минимальной размерности линейного подпространства, содержащего все предъявленные изображения объекта:если искомая размерность не превосходит 3, то предъявленное множество изображений есть множество изображений ламбертова объекта.
Но поскольку изображения всегда получаются с некоторой ошибкой, то решение задачи определения фактической размерности предъявленного множества изображений нетривиально. В главе показано, что в этом случае математически задача сводится к задаче проверки гипотезы о том, что полученные изображения являются изображениями ламбертового объекта, а именно, можно ли считать, что полученные изображения с точностью до ошибки лежат в трехмерном линейном подпространстве, и решен вопрос о нахождении этого подпространства9.Во второй главе дан обзор некоторых существующих подходов к решениюзадач распознавания. Данные подходы связаны с определением решающегоправила из некоторого параметрического класса.
Вектор параметров подбирается8Yu.P.Pyt'ev. Morphological Image Analysis. // Pattern Recognition And Image Analysis, 1993, vol. 3, no. 61, pp. 19-28.9Yu.P.Pyt'ev, A.Yu.Pyt'ev. Effective Dimensionality and Data Compression. // Pattern Recognition And Image Analysis,1997, vol. 7, no. 4, pp. 393-406.таким, чтобы критерий качества распознавания принимал экстремальное значение.
В зависимости от выбранного класса решающих правил и критерия качествараспознавания на данный момент существует большое разнообразие классов алгоритмов. В этой главе рассматриваются только два класса параметрических алгоритмов: алгоритм построения решающих правил с использованием аппарата ал9гебры логики для булевых признаков (алгоритм "Кора") и алгоритмы построениярешающих правил для разнотипных (номинальных, дискретных, порядковых, непрерывных, булевых) признаков (алгоритмы "TEMP", "R-метод" и "CORAL").Алгоритм "Кора"10 является наиболее известным алгоритмом распознаваниядля булевых признаков.
Этот алгоритм предназначен для определения логическихзакономерностей в виде конъюнкций значений признаков и основывается на построении информативных фрагментов описаний обучающих объектов – представительных наборов. Представительными наборами обучающих объектов считаются те фрагменты описаний обучающих объектов, которые по данному наборупризнаков достаточно часто встречаются в одном обучающем классе и почти невстречаются в остальных обучающих классах.
Множество представительных наборов для алгоритма "Кора" определяется заданием двух целочисленных параметров. Варьируя эти параметры можно менять множество представительных наборов. Решающее правило задается в виде алгоритмической процедуры: для распознавания объекта используется голосование по конъюнкциям (представительным наборам).Алгоритмы "TEMP", "R-метод" и "CORAL"11 являются алгоритмами распознавания, основанными на обнаружении логических закономерностей в10Вайнцвайг М.Н. Алгоритм обучения распознаванию образов "Кора".
// В кн.: Алгоритмы обучения распознава-нию образов. М., 1973, с. 110-115.11Лбов Г.С. Методы обработки разнотипных экспериментальных данных. // Новосибирск: Наука, 1981.множествах обучающих объектов в случае разнотипных признаков: номинальных,дискретных, порядковых, непрерывных и булевых. Процесс построения логических закономерностей для подобных алгоритмов называется построением логических решающих правил. Для этих трех алгоритмов решающее правило представляется в виде дерева решений. Такая форма представления правил позволяет легко интерпретировать их на языке функциональных свойств объекта.10В третьей главе производится исследование и сравнение всех вышеуказанных параметрических алгоритмов и морфологических алгоритмов в задачах распознавания при ограниченной априорной информации:1. Дается критерий ламбертовости, позволяющий по предъявленным изображениям объекта в шуме сделать заключение о ламбертовости объекта.2. Изучается влияние состава обучающей выборки на качество распознавания объектов в шуме параметрическими алгоритмами и морфологическими алгоритмами.3.
Изучается влияние на качество распознавания параметрическими иморфологическими алгоритмами зависимости между уровнем шума,добавляемого в обучающую выборку, и уровнем шума, который ожидается у предъявляемых для распознавания данных.4. Производится сравнительный анализ качества распознавания параметрических алгоритмов и морфологических алгоритмов.Критерий ламбертовости. Напомним, что объект называется ламбертовым, если яркость в каждой точке не зависит от направления наблюдения при любом характере освещения, т.е. яркость может меняться от точки к точке поверхности, нояркость в каждой точке поверхности не будет зависеть от направления наблюдения. Объекты, поверхность которых способна зеркально отражать падающий нанего свет (например, стекло) не могут быть ламбертовыми объектами.
На поверхности таких объектов всегда будут блики от освещающих их источников, т.е. яркость в каждой точке поверхности таких объектов будет зависеть от направлениянаблюдения.Для вывода критерия ламбертовости рассматривается большое число серийизображений различных объектов. На рис. 1 в качестве примера приведены 3 серии изображений, участвовавших в эксперименте12: ровное поле зрения (рис. 1а) и2 сцены с предметами, один из которых стеклянный (рис. 1b,c).
Для каждой серииизображений проверяется гипотеза о том, что изображения являются изображе11ниями ламбертового объекта, а именно, исследуется эффективная размерностькаждой серии изображений. Исследование эффективной размерности для каждойсерии изображений сводится к решению задачи поиска минимальной размерностилинейного подпространства, содержащего все предъявленные изображения объекта. Для этого производится поиск ортонормированных собственных векторов,образующих ортонормированный базис в пространстве Rm 13, обеспечивающийнаименьшую в среднем квадратичном по всем изображениям полную ошибкуприблежения изображений по сравнению с любым другим ортонормированнымбазисом в Rm .
Тем самым для каждой серии изображений получают набор собственных векторов и соответствующих им собственных значений. Далее для каждойсерии анализируется зависимость собственных значений, отсортированных поубыванию, от порядковых номеров собственных значений, и изображения собственных векторов, также отсортированных по убыванию соответствующих им собственных значений.12В каждом эксперименте по определению эффективной размерности множества изображений участвовало по 12изображений каждой сцены. В целях сохранения компактности представления результатов для экспериментов вафтореферате приведены рисунки только 6 изображений из 12.














