Диссертация (1150572), страница 2
Текст из файла (страница 2)
При получении основных результатов работы использовались методы работы с двумерными изображениями, построения математических моделей сложных систем, компьютерного моделирования, математического анализа, теории графов, теории сложности вычислений, а также программи-9рование на языке высокого уровня.Достоверность и обоснованность полученных результатов опирается на проведенные доказательства, рассуждения и эксперименты.Научная новизна диссертации заключается в том, что разработанные вней алгоритмы классификации изображений биомедицинских препаратов предложены впервые. Использование координат цветовых пространств в качествеисходных данных для классификации с помощью статистических признаковХаралика дает более высокую точность классификации по сравнению с классическим методом. Использование модифицированных алгоритмов построенияагрегатов и стационарного потока на графе позволяет значительно уменьшитьвременную и емкостную сложности вычислений, что позволяет получить сопоставимые с оригинальными алгоритмами результаты до 40 раз быстрее.
Вдиссертации сформулированы и доказаны четыре теоретических утверждения,обосновывающие эффективность разработанных алгоритмов.Теоретическая и практическая значимость работыВ рамках диссертационного исследования разработана алгоритмическаяоснова для комплекса программ анализа и классификации изображений биомедицинских препаратов. Предлагаемые алгоритмы дают большую точностьклассификации и обладают меньшей вычислительной сложностью, что делаетрезультаты диссертации теоретически значимыми.
Практическая значимостьрезультатов диссертации заключается в реализации комплекса программ, позволяющего оценить эффективность разработанных алгоритмов классификациидля каждого конкретного случая исследований.Положения, выносимые на защиту1. Предложен метод использования координат цветовых пространств RGBи HSV в качестве входных данных для алгоритмов анализа изображений с помощью статистических характеристик Харалика второго порядка. Полученныенаборы характеристик для разных цветовых пространств позволяют выбратьнаиболее подходящую пару координата-признак или комбинацию таких пар для10эффективной классификации изображений.2. Разработаны и реализованы алгоритмы эффективного построения агрегатов по модели DLA с помощью априорного анализа коэффициентов выборакак в плоском случае, так и в случае построения агрегатов на произвольной поверхности.
Путем вычисления емкостной размерности и дивергенции Кульбака–Лейблера показано, что полученные с помощью модифицированного алгоритмаагрегаты качественно близки к агрегатам, построенным по классической модели DLA. Дана теоретическая оценка вычислительной сложности предложенныхалгоритмов. Программы для реализации классических алгоритмов запускалисьна компьютере с процессором Intel CoreDuo T2050 и объемом оперативной памяти 1.5GB. Время вычислений одного агрегата из 10000 частиц для плоскогослучая составило 37 мин. 43 сек.; время вычислений 10 агрегатов из 1000 частицна поверхности составило 4 ч. 47 мин. 33 сек. Оптимизированные алгоритмы запускались на той же конфигурации оборудования.
При этом время вычисленийодного агрегата из 10000 частиц для плоского случая составило 1 мин. 8 сек.;время вычислений 10 агрегатов из 1000 частиц на поверхности составило 31мин. 58 сек. В результате продемонстрировано уменьшение времени вычислений приблизительно в 40 раз для плоского случая и в 10 раз при моделированиина поверхности по сравнению с классическими алгоритмами.3. Разработана и реализована модификация алгоритма Шелейховского–Брэгмана построения стационарного потока на графе путем разбиения изображения на подмножества, построения стационарного потока на каждом из подмножеств и объединения стационарных потоков в один общий поток.
Приведенаоценка потери точности вычислений на склеиваемых границах областей; оценено ее влияние на значение взвешенной энтропии, выступающее в качествеклассифицирующего признака. Показана эффективность модифицированногоалгоритма для использования на многоядерных системах. Программа для реализации классического алгоритма запускалась на компьютере с процессоромIntel CoreDuo T2050 и объемом оперативной памяти 1.5GB. Время вычисле-11ний составило 13 мин.
3 сек. Оптимизированный алгоритм запускался на тойже конфигурации оборудования. Время вычислений составило 1 мин. 38 сек.В результате продемонстрировано уменьшение времени вычислений приблизительно в 10 раз.4. Разработан и реализован комплекс программ для исследования и классификации изображений биомедицинских препаратов, который объединяет всебе методы статистического анализа с помощью вычисления характеристикХаралика второго порядка в координатах цветовых пространств RGB и HSV;методы имитационного моделирования структуры изображения путем построения агрегатов с помощью априорного анализа коэффициентов распределениядля модели DLA; методы анализа с помощью построения стационарного потока на связанном с изображением графе.
Реализованный комплекс программможет быть расширен новыми методами и алгоритмами исследования изображений. Все алгоритмы реализованы в виде отдельных библиотек, что позволяетиспользовать отдельные части комплекса и их произвольные комбинации каксоставляющие части для дальнейших исследований.Апробация результатовОсновные результаты диссертационной работы докладывались и обсуждались на следующих научных конференциях и семинарах:1. Конференция “Научные исследования и их практическое применение.Современное состояние и пути развития”, 2012, Одесса;2.
LXVI и LXVII Международные конференции “Герценовские чтения”.Секция “Актуальные информационные системы и технологии моделирования”,2013 - 2014, РПГУ им. Герцена, Санкт-Петербург;3. “Межвузовский конкурс-конференция студентов, аспирантов и молодыхученых Северо-Запада”, 2013, СПбГПУ, Санкт-Петербург;4. Восьмая международная конференция “Актуальные проблемы прикладной математики, информатики и механики”, 2013, ВГУ, Воронеж;5. Семинары “Информатика и компьютерные технологии”, доклады “Алго-12ритм анализа изображений, основанный на построении стационарного потокана графе” и “Разработка и реализация алгоритмов классификации изображенийбиомедицинских препаратов”, 2014–2015, СПИИРАН, Санкт-Петербург;6. 9-th International Conference on Communications, Electromagnetics andMedical Applications (CEMA), 2014, Technical Univercity of Sofia, Sofia, Bulgaria.Структура и объем работыДиссертационная работа состоит из введения, четырех глав, заключения,библиографического списка и одного приложения.
Работа изложена на 107 страницах машинописного текста, содержит 17 рисунков, 27 таблиц и список литературы из 102 наименований.Введение содержит обзор современного состояния предметной области,обоснование актуальности диссертационной работы. Во введении сформулированы предмет и цели исследований, аргументирована научная новизна работы,представлены выносимые на защиту положения, приведена оценка их теоретической и практической значимости.Первые три главы содержат описание алгоритмов, разработанных дляреализации комплекса программ по исследованию и классификации биомедицинских изображений. В четвертой главе приведено описание особенностейреализации разработанного комплекса.Первая глава содержит исследование метода классификации изображений с помощью статистических методов Харалика второго порядка с точкизрения его применимости для классификации изображений биомедицинскогохарактера.Для вычисления признаков Харалика второго порядка изображение представляется как решетка пикселей заданной интенсивности, по нему строятсячетыре матрицы относительных частот расположения пикселей по направлениям 0, 45, 90 и 135 градусов.
На основании матриц вычисляются 14 числовыххарактеристик, набор которых в дальнейшем может быть использован как век-13тор признаков для классификации изображений.Рассмотрена применимость вычисления статистических характеристик Харалика второго порядка для задачи классификации изображений растворов серебра различной концентрации. Показано, что для предварительно приведенных к оттенкам серого изображениям растворов серебра ни один из вычисленных признаков не позволяет разделить изображения на группы в соответствиис их действительной классификацией.Предложен и реализован метод использования координат цветовых пространств RGB и HSV в качестве входных данных для алгоритма классификации.
Для исследуемых изображений растворов серебра различной концентрации показано, что предложенный автором метод при вычислении для координаты H признаков “суммарная энтропия” и “обратный момент” позволяет разделить их на группы, соответствующие действительной классификации изображений. Это дает возможность построить классификатор высокой точности,разделяющий изображения в соответствии с их действительными классами.В результате проведенных в первой главе исследований можно утверждать,что выбор координаты для представления исходных изображений в различныхцветовых пространствах, таких как RGB или HSV, может значительно влиятьна результаты классификации.Вторая глава посвящена исследованию использования диффузионноймодели DLA (Diffusion Limited Aggregation) для описания изображений сложных процессов в системах различной природы, в том числе биологических.Модель DLA описывает рост группы частиц, называемой агрегатом, приброуновском блуждании этих частиц по линиям координатной сетки.