Диссертация (1150572), страница 6
Текст из файла (страница 6)
Найдя координаты, информация в которых искаженанаименьшим образом, можно построить лучший классификатор.Стоит отметить, что идея применения координат различных цветовых пространств в качестве начальных данных — очень общая и никоим образом независит от дальнейшего способа обработки изображений. Для метода классификации изображений с помощью вычисления характеристик Харалика этоозначает, что можно пользоваться любым из его оптимизированных вариантов (что оказывается важно для изображений больших размеров). Более того,может оказаться полезным рассматривать изображения с точки зрения различных цветовых пространств и при использовании других методов классификациии анализа.Для конкретной задачи классификации растворов серебра различной концентрации лучшей координатой стала H.
Нельзя утверждать, что в общем случае использование координаты H даст лучший результат для всех классов изображений и методов классификации. В каждом случае необходимо проводитьпредварительные исследования. Тем не менее, в качестве еще одной иллюстрации хороших результатов классификации изображений по координате H цветового пространства HSV можно привести исследования [90] по классификацииизображений тканей печени с помощью сигнатурных методов. Изображения,использованные в указанных исследованиях, также были получены с помощьюатомно-силового микроскопа.
Это позволяет предположить, что для построенияклассификаторов изображений, полученных с помощью атомно-силового микроскопа, из-за особенности прибора информация об исходной структуре изображения наименьшим образом искажается именно в координате H цветовогопространства HSV.В результате проведенных в первой главе исследований можно утверждать,что выбор координаты для представления исходных изображений в различныхцветовых пространствах, таких как RGB или HSV, может значительно влиятьна результаты классификации.36Глава 2.
Использование диффузионных моделейописания поведения сложных систем2.1Понятие диффузионной моделиМногие процессы, происходящие как в природе, так и в обществе, обла-дают хаотической динамикой, которая характеризуется возникновением фрактальных структур [22, 31, 44]. Для некоторых из них заранее известны законыи принципы, определяющие поведение этой системы, в то время как для другихвнутренние закономерности могут быть определены только экспериментально.Понимание этих закономерностей приводит к построению теоретических моделей поведения подобных систем, которые в дальнейшем могут быть использованы для предсказания их поведения.Процессы, происходящие в различных веществах, как неорганической, таки органической природы, — примеры систем, для понимания поведения которых давно и успешно применяется подобный подход [40, 41, 65, 78].
Одним изопределяющих физико-химических принципов взаимодействия веществ является диффузия [17], поэтому модели, возникшие при исследовании этого принципавзаимодействия, называют диффузионными. Диффузионные математическиемодели изучают начиная с 70-х годов XX века [50].Диффузионные модели изучают рост структур, обладающих статистическим самоподобием, называемых обычно хаотическими фракталами [42].
Важный класс среди хаотических фракталов составляют так называемые фрактальные кластеры — класс физических объектов, плотность которых уменьшается37при увеличении размера кластера. Фрактальный кластер, состоящий из частиц,объединенных связями того или иного рода, называют агрегатом (встречаетсятакже термин конгломерат). В качестве примера такого естественного агрегатамогут выступать структуры, полученные в результате роста кристаллов илиструктуры, которые образуют пути электронов во время пробоя диэлектрика[22, 36, 65, 78].
Примеры подобных структур представлены на рисунке 2.1.а) Пробой диэлектрикаб) Рост кристалловРисунок 2.1. – Примеры естественных агрегатов.Существуют несколько основных диффузионных теоретических моделей.Одной из них, с которой началось исследование роста агрегатов, является модель агрегации, ограниченной диффузией (diffusion limited aggregation, DLA).Позже были предложены и другие модели, такие как cluster-cluster aggregation(CCA) и reaction-limited cluster aggregation (RLCA). Их подробный обзор можнонайти в [31].382.2Использование диффузионных моделей дляклассификации изображенийПри решении задачи классификации изображений сложных процессов по-лезно принимать во внимание структуру иллюстрируемого ими процесса. Дляэтого в изображении тем или иным способом может быть выделен каркас (скелет) этого процесса, являющийся набором отрезков, пересекающихся друг сдругом в вершинах [89].
Оказывается, что для изображений многих процессов их каркас оказывается близок по структуре к некоторому агрегату, построенному по той или иной теоретической модели [5, 22, 31]. При этом каркасыразличных изображений процессов одной природы оказываются близкими кагрегатам, построенным по одной модели с конкретными параметрами, в товремя как каркасы изображений процессов различной природы зачастую близки к агрегатам, построенным по разным моделям или по одной модели, но сразличными параметрами.
Это позволяет говорить о том, что агрегат можетбыть представителем класса процессов, и этому классу процессов могут бытьприписаны характеристики, присущие структуре их представителя. Простейшая из таких характеристик — емкостная размерность [54].
При этом любаяиз таких характеристик агрегата или их набор могут быть использованы какклассифицирующий признак для представляемых им изображений. Именно поэтому изучение различных моделей роста агрегатов оказывается полезным длярешения задачи классификации изображений.2.3Модель Diffusion-limited aggregation (DLA)для плоского случаяМодель diffusion-limited aggregation (DLA) описывает рост агрегата прислучайных (броуновских) [82] блужданиях частиц.
Эта модель была предложе-39на Виттеном, Сандлером и Пинским [83, 96] и оказалась широко применимойдля имитационного моделирования таких явлений, как осаждение металла приэлектролизе и протекание диффузионных процессов в жидкостях и газах. В работах [22, 79] эта модель была использована для имитации роста минеральныхдендритов, бактериальных колоний, а также образования кластера при высыхании на стекле коллоидного раствора. Кроме того, были описаны применениямодели DLA к исследованию расположения аксонов [71] и моделированию физического процесса пробоя диэлектрика [78, 86].Согласно классической модели DLA, блуждание частиц происходит по линиям дискретной прямоугольной сетки. Кроме того, предполагается, что частицы присоединяются к агрегату последовательно, одна за одной.
Процесспостроения агрегата начинается с единственной частицы, располагающейся вначале координат прямоугольной сетки. Случайным образом вычисляется первоначальное положение другой частицы. Эта частица начинает блуждание полиниям сетки, при этом на каждом шаге она может с вероятностью 1/4 переместиться либо на единицу вправо, либо на единицу влево, либо на единицу вниз,либо на единицу вверх относительно своего текущего положения. Блужданиепродолжается до тех пор, пока частица не окажется соседней с какой-либо изчастиц, входящих в агрегат. Остановившаяся частица соединяется отрезком сагрегатом и, начиная с этого момента, входит в него.
После этого происходитбросание новой частицы. Описанный процесс повторяется многократно. Примерпостроенного агрегата показан на рисунке 2.2.При практической реализации вводят дополнительные ограничения: бросают частицу в заданную окрестность агрегата и ограничивают число шагов ееблуждания некоторым числом N. Если за N шагов частица не присоединилась кагрегату, ее отбрасывают. Если точка при блуждании отходит слишком далекоот агрегата, ее также отбрасывают.Одной из основных проблем при использовании указанного алгоритма является значительное количество времени, которое требуется для вычислений.40Рисунок 2.2.
– Пример построенного по классическому алгоритму DLA агрегата.Действительно, число шагов блуждания точек по плоскости практически ничемне ограничено и его природа носит вероятностный характер. В любом случаеоказывается, что для построения агрегатов из достаточно большого (большего тысячи) числа частиц математическое ожидание требуемого для построениячисла шагов велико. Поэтому большой интерес вызывают вопросы оптимизацииуказазанного алгоритма [63, 69].2.4Оптимизация модели DLA для плоскогослучаяИтак, большое время расчета объясняется прежде всего большим числомобрабатываемых данных: число точек велико и траектория блуждания каждой точки может быть достаточно длинной.
Рассматриваемый нами алгоритмпредставляет собой классический пример детерминированного алгоритма, обрабатывающего большие объемы данных. Его можно ускорить за счет переходак решению упрощенной задачи с частичной информацией.412.4.1Априорная оценка коэффициентов выбораРассмотрим момент времени бросания частицы на координатную сетку,представленный на рисунке 2.3.Рисунок 2.3. – Блуждание частицы по координатной сетке.Предположим, что при бросании частицы на координатную сетку ее координаты оказались равны (x + a, y + b). Сделаем оценку того, что даннаячастица присоединится к точке агрегата с координатами (x, y).