Сравнительный анализ морфологических методов интерпретации изображений (1104888), страница 3
Текст из файла (страница 3)
Это касается и рисунков собственных векторов,получаемых при решении задачи поиска минимальной размерности линейного подпространства. Для всех нижеописанных экспериментов графики зависимости собственных значений от порядковых номеров собственных значений содержат только первые 9 собственных значений из 12.13Изображения представляются как векторыξ i• длиной m в евклидовом пространстве Rm . Здесь m - количествоточек в изображении.12Рис.
1. Изображения реальных сцен, полученные фотокамерой при разном освещении.13Рис. 2. Собственные векторы в задаче нахождения эффективной размерности множества изображений, представленных на рис.1.14Рис. 3. Собственные значения в задаче нахождения эффективной размерности множества изображений, представленных на рис.1a и рис.1c:(a) cобственные значения для рис.1a,(b) cобственные значения для рис.1c.Рис. 4.
Собственные значения в задаче нахождения эффективной размерности множества изображений, представленных на рис.1a и рис.1b:(a) cобственные значения для рис.1a,(b) cобственные значения для рис.1b.На рис. 2 показаны изображения 6 из 12 собственных векторов, получившихся при решении задачи поиска минимальной размерности линейного подпространства для каждой из сцен на рис. 1.
На рис. 3 и рис. 4 показаны соответствующие этим собственным векторам графики зависимости собственных значений,отсортированных по убыванию, от порядковых номеров собственных значений.Анализируя эти графики, можно заметить, что величина отношения первого соб15ственного значения к четвертому составляет величину поряка 10 5 для ровного по-ля зрения и величину порядка 10 4 для нестеклянного предмета (рис.
4). Для сцены со стеклянным предметом величина отношения первого собственного значения к четвертому составляет величину порядка 10 2 (рис. 3). Также, анализируяизображения собственных векторов для каждой из сцен (рис. 2), можно заметить,что на изображениях собственных векторов, начиная с четвертого, для сцен сровным полем зрения и нестеклянным предметом ничего разобрать из деталейсцен нельзя (рис. 2а,b).
Для сцены со стеклянным предметом детали сцены прослеживаются на всех без исключения изображениях собственных векторов (рис.2с). Поскольку ламбертовы объекты всегда лежат в 3х-мерном подпространстве,то первые три собственых значения относятся к изображению, а все остальные кшуму. Если шум белый, то начиная с четвертого собственного вектора не будутпросматриваться детали сцены. Критерием ламбертовости объекта является отсутствие деталей сцены, начиная с изображения четвертого собственного векторасцены.Влияние состава обучающей выборки на качество распознавания.
Дляизучения влияние состава обучающей выборки на качество распознавания объектов в шуме параметрическими алгоритмами и морфологическими алгоритмами вкачестве данных для тестирования алгоритмов использовались черно-белые изображения цифр размером 20х20 пиксел. Изображения зашумлялись следующимобразом. Генератор случайных чисел генерировал целые числа в интервале [0,100]. Просматривался каждый пиксел изображения и анализировалось число, сгенерированное генератором случайных чисел на очередном шаге. Если число попадало в интервал [0, q ] , то пиксел инвертировался. Тем самым, при 0%-ом уровне шума14 (q = 0) получалось чистое изображение, при 50%-ом уровне шума(q = 50) инвертировалось 50% пиксел14Назовем уровнем шума q% целое число q, лежащее в интервале [0, 100].16изображения, а при 100%-ом шуме (q = 100) изображение инвертировалось полностью. Такими изображениями проводилось обучение и такие изображения подавались на распознавание.Для всех вышеуказанных параметрических и морфологических алгоритмовизучался вопрос: какие изображения следует включать в обучающую выборку?Только чистые изображения или чистые изображения и изображения в шуме, илитолько изображения в шуме?Для обучения алгоритмов формировались 10 классов изображений, по одномудля каждой цифры от 0 до 9.
Каждый класс состоял из 11 изображений. Если алгоритмы обучались только чистым изображениям, то на обучение подавались по11 чистых изображений каждого класса. Если алгоритмы обучались и чистымизображениям и изображениям в шуме, то на обучение подавались по 11 изображений каждого класса, в которых шум равномерно возрастал от изображения кизображению, т.е. на обучение подавались изображения со следующими уровнями шума:[0%, q •891234567%, q • %, q • %, q • %, q • %, q • %, q • %, q • %, q • %, q %]101010101010101010И наконец, если алгоритмы обучались только изображениям в шуме, то наобучение подавались по 11 изображений каждого класса с определенным уровнемшума q %, q ∈ [0,50] .На распознавание для каждого алгоритма предъявлялись серии из 10 изображений цифр.
Каждая серия содержала изображения одной из цифр с уровнем шума q %, q ∈ [0,50] . Каждая такая серия из 10 изображений цифр формироваласьзаново 50 раз и 50 раз предъявлялась для распознавания. Процент правильныхрешений (процент распознавания) подсчитывался следующим образом:процент распознавания =количество правильных ответов⋅ 100количество испытанийЗдесь количество испытаний – число тестов на распознавание (в нашем слу17чае оно равно 50).Результатом исследования вышепоставленного вопроса стало следущее: еслипараметрическме алгоритмы "Кора", "R-метод", "TEMP" и "CORAL" используются для распознавания изображений без шума, то необходимость в обученииэтих алгоритмов изображениям в шуме отпадает.
Достаточно их обучить толькочистым изображениям. В противном случае, если эти алгоритмы используютсядля распознавания изображений в шуме, то на обучение необходимо подавать ичистые изображения и изображения в шуме. Этот вывод верен и для алгоритма,основанного на ламбертовой морфологии. Алгоритм, основанный на монохромной морфологии достаточно обучить только чистым изображениям и он будетспособен распознавать как чистые изображения, так и изображения в шуме. Этотак, если шум белый. Если шум имеет другую природу, то и этот алгоритм необходимо обучать чистым изображениям и изображениям в шуме (Как известно монохромная морфология обладает большой помехозащищенностью и если шум белый, то подавление шума происходит автоматически).Влияние состава обучающей выборки и состава распознаваемых данных накачество распознавания.
Качество распознавания всех вышеописанных алго-ритмов разнится в зависимости от состава обучающей выборки и состава распознаваемых данных:1. Алгоритм "Кора":• Если обучать алгоритм только чистым изображениям, то процентправильных ответов будет не ниже 80% до 20%-ого уровня шуматестирующих изображений цифр (рис. 5a).• Если обучать алгоритм чистым изображениям и изображениям сшумом до 32%, то процент правильных ответов будет не ниже80% до 42%-ого уровня шума тестирующих изображений цифр(рис.
6a).• При обучении алгоритма только изображениям с 10% шумомпроцент правильных ответов будет не ниже 80% до 21%-ого18уровня шума тестирующих изображений цифр. Т.е. немногимлучше, чем при обучении алгоритма только чистым изображениям.2. Алгоритм "R-метод":• Если обучать алгоритм только чистым изображениям, то процентправильных ответов будет не ниже 80% до 20%-ого уровня шуматестирующих изображений цифр (рис.
5b).• Если обучать алгоритм чистым изображениям и изображениям сшумом до 32%, то процент правильных ответов будет не ниже80% до 26%-ого уровня шума тестирующих изображений цифр(рис. 6b).• При обучении алгоритма только изображениям с 10% шумомпроцент правильных ответов будет не ниже 80% до 20%-огоуровня шума тестирующих изображений цифр. Т.е. сравнимо срезультатами, получаемыми при обучении только чистым изображениям.3. Алгоритм "TEMP":• Если обучать алгоритм только чистым изображениям, то процентправильных ответов будет не ниже 80% до 20%-ого уровня шуматестирующих изображений цифр (рис.
5c).• Если обучать алгоритм чистым изображениям и изображениям сшумом до 32%, то процент правильных ответов будет не ниже80% до 25%-ого уровня шума тестирующих изображений цифр(рис. 6c).• При обучении алгоритма только изображениям с 10% шумомпроцент правильных ответов будет не ниже 80% до 19%-огоуровня шума тестирующих изображений цифр. Т.е. немногимхуше, чем при обучении алгоритма только чистым изображениям.4. Алгоритм "CORAL":• Если обучать алгоритм только чистым изображениям, то процент19правильных ответов будет не ниже 80% до 20%-ого уровня шуматестирующих изображений цифр (рис.
5d).• Если обучать алгоритм чистым изображениям и изображениям сшумом до 32%, то процент правильных ответов будет не ниже80\% до 23\%-ого уровня шума тестирующих изображений цифр(рис. 6d).• При обучении алгоритма только изображениям с 10% шумомпроцент правильных ответов будет не ниже 80% до 18%-огоуровня шума тестирующих изображений цифр. Т.е. немногимхуже, чем при обучении алгоритма только чистым изображениям.5.
Алгоритм, основанный на ламбертовой морфологии:• Если обучать алгоритм только чистым изображениям, то процентправильных ответов будет не ниже 80% до 26%-ого уровня шуматестирующих изображений цифр (рис. 7a).• Если обучать алгоритм чистым изображениям и изображениям сшумом до 35%, то процент правильных ответов будет не ниже80% до 43%-ого уровня шума тестирующих изображений цифр(рис. 7b).• При обучении алгоритма только изображениям с 10% шумомпроцент правильных ответов будет не ниже 80% до 27%-огоуровня шума тестирующих изображений цифр.
Т.е. немногимлучше, чем при обучении алгоритма только чистым изображениям.6. Алгоритм, основанный на монохромной морфологии:Для распознавания как чистых изображений так и изображений в шумеэтот алгоритм достаточно обучить только чистым изображениям.Процент правильных ответов не ниже 80% наблюдается до 45%-огоуровня шума тестирующих изображений цифр. Когда на яркость20Рис. 5. Результаты распознавания при обучении алгоритмов "Кора", "R-метод", "TEMP" и "CORAL"только чистым изображениям цифр: (a) для алгоритма "Кора", (b) для алгоритма "R-метод, (c) для алгоритма "TEMP", (d) для алгоритма "CORAL".Рис. 6. Результаты распознавания при обучении алгоритмов "Кора", "R-метод", "TEMP" и"CORAL" чистым изображениям цифр и изображениям с уровнем шума до 32%: (a) для алгоритма "Кора", (b) для алгоритма "R-метод, (c) для алгоритма "TEMP", (d) для алгоритма "CORAL".Рис.
7. Результаты распознавания при обучении ламбертовой морфологии: (a) только чистым изображениям, (b) чистым изображениям и изображениям с 35%-ым уровнем шума.изображения цифры накладываются дополнительные ограничения, аименно известно, что яркость символа не может быть меньше яркостифона, процент правильных ответов для алгоритма не ниже 80%21наблюдается до 48%-ого уровня шума тестирующих изображений цифр(рис.















