Главная » Просмотр файлов » Распознавание образов методом декомпозиции форм

Распознавание образов методом декомпозиции форм (1187425)

Файл №1187425 Распознавание образов методом декомпозиции форм (Распознавание образов методом декомпозиции форм)Распознавание образов методом декомпозиции форм (1187425)2020-09-11СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

Министерство образования и науки Российской Федерации

Федеральное государственное автономное образовательное учреждение высшего профессионального образования

«Московский физико-технический институт

(государственный университет)»

Факультет управления и прикладной математики

Кафедра информатики

Распознавание образов методом декомпозиции форм

Выпускная квалификационная работа

(магистерская диссертация)

Направление подготовки:

03.04.01-Прикладная математика и физика (магистратура)

Выполнил:

студент 973 группы Бочаров Дмитрий Сергеевич

Научный руководитель:

к.ф. - м.н. Скороваров Константин Владимирович

Москва 2015

Оглавление

Введение 2

Основные понятия и постановка задачи 4

Алгоритмы декомпозиции 6

ACD (Approximate Convex Decomposition) – приблизительно выпуклая декомпозиция 6

Метод связности 12

Глубинный метод 17

Алгоритм хеширования 21

Выбор алгоритма декомпозиции 24

Особенности реализации 26

Заключение 27

Список литературы 28


Введение

Разработка систем машинного зрения включает в себя сложную задачу – научить машину выделять форму объектов в изображениях, сравнивать объекты по их форме и определять сходные и различные формы. Основной проблемой является то, что механизмы работы человеческого мозга не вполне понятны и не имеют четкой теоретической модели. В повседневной жизни мы на интуитивном уровне определяем понятие формы. Поэтому, казалось бы, такой легкий даже для ребенка вопрос как одногорбый или двугорбый верблюд нарисован на картинке, превращается в сложную задачу для компьютера.

Изображение в компьютерном представлении – это прямоугольная матрица точек, обладающих определенным цветом и яркостью. Поэтому перед создателями систем обработки изображений возникает проблема преобразований формы изображений, при которой «человеческие», интуитивно понятные геометрические способы анализа, сравнения, распознавания и преобразования формы можно было бы применить к изображениям, представляемым в компьютере в виде матриц. Существует два пути решения этой проблемы: «дискретный» и «непрерывный». В «дискретном» способе решения предпринимаются попытки представить человеческие понятия формы, как непрерывного «сплошного» объекта, в виде дискретного растрового изображения. В «непрерывном» же способе строятся непрерывные модели для объектов, выделенных в дискретной матрице изображений, и далее строятся алгоритмы в терминах непрерывных моделей, близких к человеческому восприятию понятия формы. На самом деле эти 2 способа являются крайними, и чаще всего используется их комбинация.

В данной работе предлагается инструмент математической бинарной морфологии. Основной идеей является стратегия "разделяй и властвуй", а именно будет рассматриваться декомпозиция форм. Также как и сегментация изображений в анализе изображений, декомпозиция форм является фундаментальной проблемой в таких областях как компьютерное зрение и визуализация данных. После декомпозиции многие операции, которые сложно применить к изначальному изображению, могут быть применены к декомпозированным частям легко и эффективно. Поэтому декомпозиция очень полезна при анализе форм, построении топологий, детектировании столкновений и в других геометрических методах использующих стратегию "разделяй и властвуй".

Во введении будет представлена постановка задачи и даны основные определения. Далее рассматриваются основные уже существующие алгоритмы декомпозиции и предложен свой новый. Приведено их сравнение и причина выбора ACD (Approximate Convex Decomposition) алгоритма. Далее предлагается метод хеширования простых декомпозированных частей для их быстрого сравнения друг с другом. В конце представлены особенности реализации Web-интерефейса для работы с данными алгоритма и примеры декомпозиции и хеширования.

Основные понятия и постановка задачи

Бинарное изображение — это двухцветная картинка, на которой представлены один или несколько объектов одного цвета на фоне, имеющем другой цвет. Такие изображения представляются в компьютере в виде матрицы точек, каждая из которых может иметь лишь одно из двух значений цвета, условно обозначаемых через 0 или 1. Точки также называются пикселями (pixel — picture's element). He нарушая общности, будем считать бинарное изображение «черно-белым»: точки объекта являются черными (значение цвета равно 1), а точки фона — белыми (значение цвета равно 0).

Теперь дадим понятие формы. Так как мы работаем с двухмерным изображением, то все определения дадим применительно к евклидовой плоскости R2.

Определение 1. Жордановой кривой называется образ окружности при непрерывном инъективном ее отображении в евклидову плоскость. Отображение инъективно, если любые две различные точки прообраза отображаются в две различные точки образа.

Определение 2. Фигурой называется связная замкнутая область на плоскости, ограниченная конечным числом непересекающихся жордановых кривых.

Таким образом, фигура в нашем понимании — это связная часть плоскости, ограниченная одной или несколькими замкнутыми линиями. Под это определение подходят сплошные объекты с конечным числом дыр.

Перейдем к рассмотрению понятия декомпозиции. Однако сложно дать его четкое определение, потому что нашей целью является смоделировать интуитивную декомпозицию формы человеком. Существуют психофизические исследования, результатами которых являются модели человеческого представления формы как нечто составного. К примеру, иерархические модели путем последовательного разбиения формы на всё более мелкие части строят дерево вхождения этих частей.

А льтернативная модель основана на наблюдении за художниками, которые все значимые части представляют в виде эллипсов, в то время как параболические связки этих эллипсов считаются незначительными частями.

Таким образом, не существует единого определения части формы. Поэтому далее при рассмотрении конкретного метода декомпозиции каждый раз будет описываться определение декомпозированных частей свойственного в данном методе.

Второй целью работы была реализация алгоритма хранения формы в реляционной базе данных, на основании которого можно реализовать распознавание образа формы. Реляционные базы данных являются самым распространённым способом хранения информации. Поиск, вставка и изменение информации осуществляются в них с огромной скоростью. Для этого существуют различные механизмы ускорения. Один из самых базовых и эффективных – это индексация.

Просуммировав всё вышесказанное, задачей данной работы является реализация алгоритма хранения формы в реляционной базе данных, путем её декомпозиции.

Алгоритмы декомпозиции

В данном разделе рассмотрены существующие алгоритмы декомпозиции форм, а также предложен свой.

ACD (Approximate Convex Decomposition) – приблизительно выпуклая декомпозиция

Целью данной декомпозиции является разбиение формы на приблизительно выпуклые части. Для начала введем некоторые определения.

Определение 3. Для объекта О размерности n разрез – это пересечение (n - 1) –мерной гиперплоскости с O.

Таким образом, разрез удовлетворяет 2 критериям: 1) он лежит внутри объекта; 2) концы разреза лежат на границе формы.

Введем характеристики разреза и части формы:

  • Стоимость разреза C, Cost(C), – действительное положительное число. Для его определения могут вводиться различные метрики, однако мы рассмотрим простой и интуитивно понятный вариант Евклидовой метрики. Cost(C) – длина разреза.

  • Вогнутость части P, Concavity(P), – действительное положительное число, которое характеризует величину вогнутости части. О её формальном определении будет рассказано ниже.

Используя введенные понятия, можно дать формальное определение декомпозиции: разделить форму O на q частей, используя m разрезов, так чтобы суммарная стоимость m разрезов была минимальна и одновременно вогнутость каждой части не должна быть больше порогового значения ε.

По определению, множество называется выпуклым, если оно содержит отрезок, соединяющий любые две точки, принадлежащие множеству. Это позволяет определить взаимосвязь двух внутренних точек множества.

О пределение 4. Точки p1 и p2 , принадлежащие форме O, называются мьютексными (взаимоисключающими), если O не содержит отрезок соединяющий p1 и p2. Обозначается как p1 p2.

Рис. 2

На рисунке 2 p1 p2 и p1 p4. Очевидно, что после декомпозиции p1 и p2 не могут быть в одной части. Таким образом, мьютексные точки являются ограничением выпуклой декомпозиции. Обычно результатом выпуклой декомпозиции является огромное число частей, с которыми тяжело работать, поэтому будем искать декомпозицию на примерно выпуклые части. Очевидно, что для приблизительно выпуклой декомпозиции p1 p2 и p1 p4 – различны. Определим меру вогнутости для мьютексной пары точек a и b: Concavity(a,b). При этом если форма O содержит отрезок, соединяющий a и b, то Concavity(a,b) = 0. Из это следует, что на рисунке 2: Concavity(p1, p2) > Concavity(p1, p4) > Concavity(p1, p3) = 0.

Определение 5. Для формы O ε-мьютексным множеством, Mε(O), называется множество всех мьютексных пар, чей вес не меньше ε.

Введенное определение позволяет исключить мьютексные пары с малым весом.

Множество всех возможных разрезов формы O назовем кандидатным, C(O). Каждый разрез из C(O) может удовлетворять мьютексной паре из Mε(O). То есть, чтобы выполнить приблизительно выпуклую декомпозицию нам надо выбрать такие разрезы из кандидатного множества C(O), которые удовлетворяют всем мьютексным парам из Mε(O).

Пусть кандидатное множество C(O) = {cut1 … cutn} включает n разрезов, Mε(O) = {mp1 … mpm} – m ε-мьютексных пар. Результат декомпозиции – множество индексов I, означающее, что если , то cuti – решающий разрез. То есть каждому разрезу cuti ставится в соответствие бинарная переменная xi : . Каждому соответствует подмножество мьютексных пар, которым удовлетворяет этот разрез. То есть в Mε(O) можео выделить n подмножеств мьютексных пар для каждого разреза. Для мьютексной пары среди всех разрезов, который ей удовлетворяют, должен быть хотя бы один, индекс которого принадлежит результирующему множеству I. То есть:

(1)

Пусть x = (x1, x2, …xn)T, c = (cost(cut1), cost(cut2), …, cost(cutn))T, A = {aij | I = 1 ... m, j = 1 ... n}, 1 = (1, 1, …, 1)T, тогда задача (2) перепишется в задачу целочисленного линейного программирования:

min cTx Ax1, xi {0, 1}

(2)

Это NP-полная задача, однако мы можем ослабить условие на xi:

min cTx Ax1, 0 ≤ xi ≤ 1

(3)

(3) – задача линейного программирования. Решив её, мы получим приближенное оптимальное решение задачи (2). xi может рассматриваться как вероятность выбора cuti. После решения (3) мы можем последовательно выбирать разрезы, имеющие наибольшую вероятность, пока не удовлетворим все мьютексные пары из Mε(O).

Для формы O, Mε(O) и C(O) – настолько большие, что с ними не имеет смысла работать напрямую. Но многие мьютексные пары избыточны, то есть когда некоторые мьютексные пары удовлетворены, другие также автоматически удовлетворены. Далее будут показано, как избавиться от избыточных мьютексных пар и получить достаточно малое Mε(O), а как уменьшить множество кандидатных разрезов C(O).

Характеристики

Тип файла
Документ
Размер
1,72 Mb
Высшее учебное заведение

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов ВКР

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6367
Авторов
на СтудИзбе
310
Средний доход
с одного платного файла
Обучение Подробнее