Автореферат (1150571)
Текст из файла
На правах рукописиБатюковАлександр МихайловичРАЗРАБОТКА И РЕАЛИЗАЦИЯ АЛГОРИТМОВ КЛАССИФИКАЦИИИЗОБРАЖЕНИЙ БИОМЕДИЦИНСКИХ ПРЕПАРАТОВ05.13.11 — Математическое и программное обеспечениевычислительных машин, комплексов и компьютерных сетейАвтореферат диссертации на соискание ученой степени кандидатафизико-математических наукСанкт-Петербург — 2015Работа выполнена в Санкт-Петербургском государственном университетена кафедре информатики математико-механического факультетаНаучный руководитель: кандидат физико-математических наук, доцент АМПИЛОВА Наталья Борисовна, доцентОфициальные оппоненты: ФЛЕГОНТОВАлександрВладимирович,доктор физико-математических наук, профессор, РПГУ им. А.
И. Герцена, профессор,зав. каф.СЕНИЧЕНКОВ Юрий Борисович, доктортехнических наук, профессор, СПбПУ, профессорВедущая организация: ФедеральноеучреждениегосударственноенаукибюджетноеСанкт-Петербургскийинститут информатики и автоматизацииРоссийской академии наукЗащита состоится 24 декабря 2015 г. в 15:30 часов на заседаниидиссертационного совета Д 212.232.51 на базе Санкт-Петербургскогогосударственного университета по адресу: 198504, Санкт-Петербург, СтарыйПетергоф, Университетский пр., 28, математико-механический факультет,ауд.
405.С диссертацией можно ознакомиться в Научной библиотеке им. М. ГорькогоСанкт-Петербургского государственного университета по адресу:199034,Санкт-Петербург,Университетскаянаб.,7/9инасайтеhttp://spbu.ru/science/disser/Автореферат разослан “”Ученый секретарь диссертационного совета2015 г.д.ф.-м.н. Демьянович Ю. К.Общая характеристика работыАктуальность темы исследования.
Вопрос создания компьютерныхалгоритмов, способных разделить множество изображений на классы в зависимости от типа иллюстрируемой ими информации (решить задачу классификации), часто возникает при решении задач из совершенно различныхприкладных областей знаний, таких как анализ аэрофотографий местности, дефектоскопия материалов по изображениям, исследование фотоснимков областей звездного неба. Необходимость автоматизации в таких задачах обусловливается чрезвычайно большим числом анализируемых изображений, настолько большим, что ручной анализ их занял бы месяцы и годы.Поэтому важными качествами используемых алгоритмов должны быть каквысокая точность классификации, так и высокая скорость работы. Крометого, алгоритмы анализа и классификации изображений всегда проблемноориентированы.Биология и медицина — активно развивающиеся области современной науки, в которых анализ и классификация изображений играют особую роль:фактически это единственный способ наблюдения за той или иной исследуемой в их рамках органической системой, начиная с наблюдаемой в микроскопклетки и заканчивая изображениями органов и тканей.
Точные и быстрые алгоритмы компьютерной классификации изображений по определенным признакам могут сильно облегчить задачу врача или ученого, работающего вуказанных областях.Несмотря на взрывной рост числа новых работ в исследуемой области запоследние 15 лет, достаточно очевидно, что объем и разнообразие доступнойдля анализа информации чрезвычайно велики, и существующие методы невсегда могут дать приемлемый результат.Актуальность темы исследования обусловлена необходимостью использования новых идей и создания на их основе алгоритмов для анализа и классификации биомедицинских изображений, что позволит исследователям получить более полное представление о процессах, происходящих в объектахестественного происхождения.Степень разработанности темы исследования.
В последнее времярастет число работ, посвященных анализу и классификации биомедицинских3изображений. Наиболее часто используется морфологический анализ, текстурный анализ, фрактальный и мультифрактальный анализ, анализ c помощью нейронных сетей, многомерный анализ изображений, исследования изображений с помощью теории графов и при помощи кластерного анализа. Дляповышения точности и скорости классификации применяются методы полянаправлений, вейвлет-преобразования, дискриминантный и факторный анализ. Большое число различных применяемых методов обусловлено большойвариативностью исследуемых изображений.
Методы классификации изображений применяются для распознавания мочекаменной болезни, заболеванийкрови, исследования препаратов тканей различных органов, определения наличия герпеса, определения наличия заболеваний нервной системы и сердечных заболеваний.
Для решения перечисленных задач анализируются снимкивнутренних органов и тканей, образцы кристаллизированных (дегидратированных) капель биологических жидкостей, снимки микрообъектов (клетки,нервные окончания), изображения кровеносных сосудов глазного дна, рентгеновские изображения коронарных сосудов. Множество исследуемых данныхрасширяется еще и за счет того, что снимки объектов естественного происхождения могут отличаться большой вариабельностью форм даже в рамкаходного класса.Особое внимание уделяется вопросам исследования цветных изображенийи вопросам их предварительной обработки для повышения точности работыклассифицирующих алгоритмов.
Кроме того, исследуются вопросы оптимизации, распараллеливания и организации вычислений с помощью графических карт с целью повышения быстродействия.Объектом исследования являются модели, методы, алгоритмы и программные средства обработки изображений. Предметом исследования являются разработка и реализация алгоритмов решения задачи классификацииизображений биомедицинских препаратов.Исследуемое изображение при решении задачи классификации биомедицинских изображений полезно рассматривать как фазовый портрет некоторой сложной динамической системы.
Математическое описание такой системы редко бывает возможным, поскольку моделирование процессов, происходящих в живых тканях требует учета огромного числа параметров и связей4между ними. Анализ фазовых портретов позволяет охарактеризовать состояние системы в определенный момент времени, а также промоделировать развитие процесса, например, достижения системой некоторого стационарногосостояния.Цифровые изображения представляются в виде решетки пикселей с заданными параметрами, поэтому их характеристики формулируются в этихтерминах.
Так характеристики Харалика описывают взаимное расположениепикселей различной интенсивности. Методы фрактального и мультифрактального анализа используют разбиение изображения на ячейки и вычисление их мер с последующим определением размерности (или набора размерностей).
С точки зрения динамики фазовый портрет системы характеризуетраспределение траекторий по фазовому пространству в некоторый моментвремени, а распределение меры характеризует частоту попадания траекторий в ячейки разбиения.Такой подход к анализу изображений позволяет:- охарактеризовать текущее состояние процесса с помощью вычислениястатистических и фрактальных характеристик;- для широкого класса диффузионных процессов реализовать модель ихразвития от начального состояния;- охарактеризовать стационарные состояния процесса с помощью построения стационарного потока на связанном с изображением графе.Целью работы является разработка алгоритмов классификации изображений биомедицинских препаратов, основанных на анализе фазовых портретов динамических систем, и реализация на их основе комплекса программ.Для достижения поставленной цели решаются следующие задачи:- исследовать влияние выбора цветовых координат в качестве начальныхданных для классификации биомедицинских изображений с помощью вычисления статистических признаков Харалика второго порядка;- разработать модификацию алгоритма построения агрегатов по математической модели DLA (Diffusion Limited Aggregation) с помощью априорнойоценки коэффициентов присоединения;- разработать модификацию алгоритма построения стационарного потокана графе путем построения стационарных потоков на подграфах;5- разработать комплекс программ, реализующих все перечисленные алгоритмы.Методология и методы исследования.
Методология работы основанана методах индукции и дедукции, обобщения, математического моделирования, анализа и синтеза теоретического и практического материала. При получении основных результатов работы использовались методы работы с двумерными изображениями, построения математических моделей сложных систем, компьютерного моделирования, математического анализа, теории графов, теории сложности вычислений, а также программирование на языкевысокого уровня.Достоверность и обоснованность полученных результатов опирается на проведенные доказательства, рассуждения и эксперименты.Научная новизна диссертации заключается в том, что разработанныев ней алгоритмы классификации изображений биомедицинских препаратовпредложены впервые.
Использование координат цветовых пространств в качестве исходных данных для классификации с помощью статистических признаков Харалика дает более высокую точность классификации по сравнениюс классическим методом. Использование модифицированных алгоритмов построения агрегатов и стационарного потока на графе позволяет значительноуменьшить временную и емкостную сложности вычислений, что позволяетполучить сопоставимые с оригинальными алгоритмами результаты до 40 разбыстрее.
В диссертации сформулированы и доказаны четыре теоретическихутверждения, обосновывающие эффективность разработанных алгоритмов.Теоретическая и практическая значимость работы. В рамках диссертационного исследования разработана алгоритмическая основа для комплекса программ анализа и классификации изображений биомедицинскихпрепаратов. Предлагаемые алгоритмы дают большую точность классификации и обладают меньшей вычислительной сложностью, что делает результаты диссертации теоретически значимыми. Практическая значимость результатов диссертации заключается в реализации комплекса программ, позволяющего оценить эффективность разработанных алгоритмов классификациидля каждого конкретного случая исследований.6Положения, выносимые на защиту1.
Предложен метод использования координат цветовых пространств RGBи HSV в качестве входных данных для алгоритмов анализа изображений спомощью статистических характеристик Харалика второго порядка. Полученные наборы характеристик для разных цветовых пространств позволяютвыбрать наиболее подходящую пару координата-признак или комбинациютаких пар для эффективной классификации изображений.2. Разработаны и реализованы алгоритмы эффективного построения агрегатов по модели DLA с помощью априорного анализа коэффициентов выбора как в плоском случае, так и в случае построения агрегатов на произвольной поверхности.
Путем вычисления емкостной размерности и дивергенции Кульбака–Лейблера показано, что полученные с помощью модифицированного алгоритма агрегаты качественно близки к агрегатам, построеннымпо классической модели DLA. Дана теоретическая оценка вычислительнойсложности предложенных алгоритмов. Программы для реализации классических алгоритмов запускались на компьютере с процессором Intel CoreDuoT2050 и объемом оперативной памяти 1.5GB. Время вычислений одного агрегата из 10000 частиц для плоского случая составило 37 мин. 43 сек.; времявычислений 10 агрегатов из 1000 частиц на поверхности составило 4 ч.
47мин. 33 сек. Оптимизированные алгоритмы запускались на той же конфигурации оборудования. При этом время вычислений одного агрегата из 10000частиц для плоского случая составило 1 мин. 8 сек.; время вычислений 10агрегатов из 1000 частиц на поверхности составило 31 мин. 58 сек. В результате продемонстрировано уменьшение времени вычислений приблизительнов 40 раз для плоского случая и в 10 раз при моделировании на поверхностипо сравнению с классическими алгоритмами.3. Разработана и реализована модификация алгоритма Шелейховского–Брэгмана построения стационарного потока на графе путем разбиения изображения на подмножества, построения стационарного потока на каждом изподмножеств и объединения стационарных потоков в один общий поток.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.