Комаров_942 (1231763)
Текст из файла
Министерство транспорта Российской Федерации
Федеральное агентство железнодорожного транспорта
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
«ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ПУТЕЙ СООБЩЕНИЯ»
Кафедра «Высшая математика»
К защите допустить
зав. кафедрой,
д-р физ.-мат. наук, профессор
__________________П.В. Виноградова
_________________ 2015 г.
РАСПОЗНАВАНИЕ ОБРАЗОВ НА ПРИМЕРЕ ИЗОБРАЖЕНИЙ ВУЛКАНОВ
Бакалаврская работа
ВКР 010400.62.942
Студент 942 гр. ____________________ А.А. Комаров
Руководитель
профессор, доктор физ.-мат. наук ____________________ С.И. Смагин
Нормоконтроль ___________________ Е.П. Суляндзига
Хабаровск – 2015
ABSTRACT
In this report it was created a software tool performs recognition of visual images using the principles of Canny edge detector.
Selected method was subjected to analysis and comparison with other methods of the class. There was also made a thorough analysis of the current situation in the development of pattern recognition tools and existing approaches to pattern recognition in general.
РЕФЕРАТ
Выпускная квалификационная работа содержит пояснительную записку на __ листах формата А4, включающую __ рисунков, __ используемых литературных источников.
РАСПОЗНАВАНИЕ ОБРАЗОВ, РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ, МЕТОД КАННИ, ХУ-МОМЕНТЫ, ГИСТОГРАММЫ КОДА ФРИМЕНА
Объектом исследования являются методы распознавания образов на примере изображения вулканов.
Целью бакалаврской работы является исследование задачи распознавание образов и разработка программного обеспечения для выделения изображений вулканов по заданным параметрам видимости.
СОДЕРЖАНИЕ
Введение 8
1 Распознавание образов: идеи, технологии, проблемы и перспективы 9
1.1 Теория распознавания образов 9
1.2 Методики распознавания образов:
преимущества и недостатки 12
1.2.1 Интенсиональные методы 15
1.2.2 Методы, основанные на оценках плотностей
распределения значений признаков 16
1.2.3 Методы, основанные на предположениях
о классе решающих функций 17
1.2.4 Логические методы 18
1.2.5 Лингвистические (структурные) методы 19
1.2.6 Экстенсиональные методы 20
1.2.7 Метод сравнения с прототипом 20
1.2.8 Метод k ближайших соседей 22
1.2.9 Алгоритмы вычисления оценок 23
1.2.10 Коллективы решающих правил 25
1.3 Проблемы и перспективы распознавания образов 33
2 Выбор метода решения проблемы 36
2.1 Выбор класса метода 36
2.2 Ху-моменты 36
2.3 Гистограммы кода Фримена 39
2.4 Расстояния Хайсдорфа 40
2.5 Детектор ребер Канни 42
2.6 Выбор метода 45
3 Разработка программного средства 47
3.1 Параметры запуска 48
3.2 Режим обучения 48
3.3 Режим анализа 49
3.4 Необязательные параметры 50
3.5 Пример работы ПО 54
ЗАКЛЮЧЕНИЕ 57
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58
ВВЕДЕНИЕ
В последние годы распознавание образов находит все большее применение. Распознавание печатного и рукописного текста, речи, различных изображений значительно упрощает взаимодействие человека с компьютером, создает предпосылки для применения различных систем искусственного интеллекта.
Способность восприятия внешнего мира в форме образов позволяет с определенной достоверностью узнавать бесконечное число объектов на основании ознакомления с конечным их числом. А объективный характер основного свойства образов позволяет моделировать процесс их распознавания.
На территории Дальнего Востока более 150 вулканов, многие из которых активны. Для наблюдения за ними используется множество аппаратуры, включая фотокамеры, которые снимают вулкан на протяжении дня и посылают эти снимки специалистам. Объем информации огромен, а видимость вулканов на многих снимках низкая.
Целью дипломной работы является разработка программного средства по распознаванию образов, которое сможет с некоторой точностью выделить изображения, на которых вулкан не перекрыт облаками или другими объектами.
1 Распознавание образов: идеи, технологии, проблемы и перспективы
1.1 Теория распознавания образов
Распознавание образов (объектов, сигналов, ситуаций, явлений или процессов) – едва ли не самая распространенная задача, которую человеку приходится решать практически ежесекундно от первого до последнего дня своего существования. Для решения этой задачи человек использует огромные ресурсы своего мозга, включая одновременно около 10–12 млрд. нейронов. Именно это дает возможность людям мгновенно узнавать друг друга, с большой скоростью читать печатные и рукописные тексты, безошибочно водить автомобиль в сложном потоке уличного движения, осуществлять отбраковку деталей, разгадывать коды, древнюю египетскую клинопись и т.д.
Распознавание представляет собой задачу преобразования входной информации, в качестве которой уместно рассматривать некоторые параметры, признаки распознаваемых образов, в выходную, представляющую собой заключение о том, к какому классу относится распознаваемый образ.
В своей повседневной жизни человек настолько легко справляется с задачами распознавания, что это считается само собой разумеющимся. Между тем, попытки моделирования на компьютере этих высокоинтеллектуальных функций наталкиваются на весьма серьезные трудности [1].
В настоящее время наибольших успехов удалось добиться в распознавании печатных символов. Широкое распространение получили известные программы распознавания текстовой информации – Fine Reader и CuneiForm. Функции обнаружения и распознавания военных объектов противника уже давно закладываются в бортовые компьютеры самолетов, ракет, кораблей и подводных лодок. Немалое значение распознавание образов играет и в задаче создания технического зрения для интеллектуальных роботов.
О
Первый параметр – режим запуска программы. Данный параметр говорит о том, будет ли программа запущена в режиме анализа набора изображений или в режиме обучения на качественных изображениях вулканов.
volcano_qualifier learn – запуск в режиме обучения
volcano_qualifier analyze – запуск в режиме анализа
В зависимости от выбранного режима работы программы (обучение или анализ) дальнейшие параметры могут отличаться.
Успех в решении задачи распознавания образа зависит в значительной мере от того, насколько удачно выбраны признаки Х. Исходный набор характеристик часто бывает очень большим. В то же время приемлемое правило должно быть основано на использовании небольшого числа признаков, наиболее важных для отличения одного образа от другого. Так, в задачах медицинской диагностики важно определить, какие симптомы и их сочетания (синдромы) следует использовать при постановке диагноза данного заболевания. Поэтому проблема выбора информативных признаков - важная составная часть проблемы распознавания образа.
Проблема распознавания образа тесно связана с задачей предварительной классификации, или таксономией.
В основной задаче распознавания образа о построении решающих функций D используются закономерные связи между характеристиками Х и S, обнаруживаемые на обучающей выборке, и некоторые дополнительные априорные предположения, например следующие гипотезы: характеристики Х для реализаций образов представляют собой случайные выборки из генеральных совокупностей с нормальным распределением; реализации одного образа расположены «компактно» (в некотором смысле); признаки в наборе Х независимы и т.д.
В области существенно используются идеи и результаты многих др. научных направлений - математики, кибернетики, психологии и т.д.
Распознавания образа в математической статистике - класс задач, связанных с определением принадлежности данного наблюдения к одной из генеральных совокупностей (с неизвестными распределениями), которые представлены лишь конечными выборками. В качестве данного наблюдения может выступать и совокупность наблюдений (выборка) из одной из представленных генеральных совокупностей. Каждое наблюдение представляет собой число или вектор. Часто указанный класс задач называют также дискриминантным анализом или классификацией.
Предположим, что известны n1 наблюдений из генеральной совокупности A1, n2 наблюдений из генеральной совокупности А2 и т.д., nm наблюдений из генеральной совокупности Am, m ≥ 2. Дана также выборка z = (z1, ..., zn). Задача Р. о. состоит в определении, какой из генеральных совокупностей Aj, j = 1, 2,..., m, принадлежит выборка z. При этом обычно принимается предположение о том, что распределения P (∙) совокупностей Aj принадлежат некоторому семейству {P (Θ, •)} распределений, зависящих от векторного параметра Θ, так что Pj (•) = Р (Θj,∙), где Θj неизвестны.
Если заданы потери Lij, которые несёт наблюдатель, относя выборку 2 к совокупности (образу) Aj, когда она на самом деле принадлежит Ai, то сформулированная задача может рассматриваться и решаться с помощью методов теории статистических игр (стратегией природы здесь является набор (Θ1, ..., Θm, j), где j указывает номер совокупности, к которой относится z). В этом случае возможно отыскание оптимальных «решающих функций», минимизирующих в том или ином смысле потери наблюдателя.
Задачи распознавания образа оказываются весьма трудными и исследованы лишь в отдельных частных случаях. Для общей проблемы при наличии некоторых дополнительных предположений можно указать асимптотически оптимальные правила, дающие потери, приближающиеся к минимальным, когда числа nj, неограниченно возрастают.
Сформулированные задачи представляют собой одну из наиболее естественных математических моделей (формализаций) для задач распознавания образа.
1.2 Методики распознавания образов: преимущества и недостатки
Распознаванием образов называются задачи построения и применения формальных операций над числовыми или символьными отображениями объектов реального или идеального мира, результаты решения которых отражают отношения эквивалентности между этими объектами. Отношения эквивалентности выражают принадлежность оцениваемых объектов к каким-либо классам, рассматриваемым как самостоятельные семантические единицы. При построении алгоритмов распознавания классы эквивалентности могут задаваться исследователем, который пользуется собственными содержательными представлениями или использует внешнюю дополнительную информацию о сходстве и различии объектов в контексте решаемой задачи. Тогда говорят о «распознавании с учителем». В противном случае, т.е. когда автоматизированная система решает задачу классификации без привлечения внешней обучающей информации, говорят об автоматической классификации или «распознавании без учителя». Большинство алгоритмов распознавания образов требует привлечения весьма значительных вычислительных мощностей, которые могут быть обеспечены только высокопроизводительной компьютерной техникой.
Основная типология методов распознавания образов:
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.















