Автореферат (1137225), страница 4
Текст из файла (страница 4)
Векторпризнаков строится для каждого пикселя размером 250 метров, как билинейная интерполяция по пикселям каналов более низкого разрешения 500 или1000 метров.Получившееся пространство признаков имеет, с одной стороны, достаточно небольшую размерность для успешной задачи класификации, однако18некоторые спектральные каналы изображения имеют пересекающиеся диапазоны длин волн, и данные, содержащиеся в них, могут быть сильно коррелированы.Для снижения размерности применён метод главных компонент. Экспериментальные результаты показывают, что различные компоненты признакового пространства действительно сильно коррелированы.
Таким образом,размерность пространства признаков может быть уменьшена отбрасыванием последних координат в пространстве главных компонент. Граница значимости для компонент задана условием на объяснённую дисперсию не ниже99, 9%, чего достаточно для задачи разделения классов, при этом размерностьпространства главных компонент, в зависимости от выборки, составляет от 7до 10, то есть размерность задачи понижается в 2 − 3 раза.Для получения обучающей выборкидостаточного размера необходимо предварительно выделить зоны, достоверно соответствующие выгоревшей и невыгоревшей территории. Был был разработан алгоритм, автоматически определяющий, к какому классу отнести ту или иную точку, с использованием карты детектированных активных пожаров за предстоящий периоди маски облачности для исследуемого изображения.Сначала для каждой точки изображения определяется степень её облачного покрытия. Было создано два варианта алгоритма использования маскиоблачности.
В любом случае, точки, отмеченные как «облачность» с высокойстепенью уверенности, отбрасываются и не входят ни в обучающую выборку,ни в тестовую; точки, отмеченные, как «отсутствие облаков» также одинаково обрабатываются. Точки, отмеченные как «туман», «дымка» в первомслучае обрабатываются так же, как безоблачные, а во втором составляютотдельный класс.Затем определяется, лежит ли точка и её соседи по 4-связности в какомлибо из полигонов. Если все 5 точек лежат в одном из полигонов, то точкадобавляется к обучающей выборке как класс «выгоревшая территория». Если ни одна из пяти точек не лежит в полигонах, точка добавляется к выборкекак класс «невыгоревшая территория», с учетомвероятностногоразрежи, так как количество точек, не лежащих в полигонах на несколько пованиярядков больше.
Если же часть точек лежит в каких-либо полигонах, а часть19не входит в них, такая точка не добавляется в обучающую выборку.Вероятностное разреживаниеприменяется для увеличения в выборке доли класса, который на изображении встречается реже — выгоревшейтерритории. До начала сканирования изображения производится оценка соотношения величин выборки для разных классов. Для двух классов назовёмэто отношение = 1 /2 , ≫ 1, где 1 , 2 — оценка количества элементоввыборки большего и меньшего класса соответственно.Затем, при заполнении обучающей выборки, элементы меньшего классапопадают туда все, для большего класса в выборку попадает каждый −ыйэлемент, где — псевдослучайное число, равномерно распределённое на отрезке [1, 2].
Таким образом, математическое ожидание числа объектов двухклассов в обучающей выборке равно.При классификацииалгоритм проходит по всем точкам, определяет,закрыты ли они облаками, и если нет, производит преобразование векторапризнаков к пространству главных компонент и классификацию с использованием сохранённых параметров обученного классификатора. Точки, классифицированные как выгоревшая территория, добавляются в создаваемуюкарту гарей.Разработанный метод был реализован в виде тестового приложения и исследован на реальных данных. Точность работы классификатора, обученного на два класса, без отбраковки слабой облачности, оказалась неприемлемонизкой, и была улучшена после введения маски полупрозрачной облачностикак отдельного класса. Однако, несмотря на это, результат остался неудовлетворительным.
Причины такого результата проанализированы. Первое условие, ослабляющее точность распознавания — требование выделения гарей поединственному изображению. Более важно, что допущение о нормальностираспределения элементов класса не соответствует действительности, что было показано исследованием выборки по критерию нормальности хи-квадрат.Для улучшения результата возможно выделение множества классов либо путём выделения для них отдельных обучающих выборок, либо кластеризациейпо принципу разделения гауссовой смеси.Метод детектирования транспортных средств на цветных аэрокосмических изображениях сверхвысокого разрешения.20Аэрофотосъемка позволяет оперативно получать данные дистанционного зондирования в сверхвысоком пространственном разрешении — до 5-10сантиметров на пиксель.
Одна из задач, решаемых с помощью таких данных — распознавание автомобилей с целью отслеживания их расположения,движения.Входными даннымиявляются аэрокосмические изображения сверхвысокого разрешения, достаточного, чтобы выделить геометрические особенности автомобиля. Изображение содержит спектральные каналы в красном,зеленом и синем диапазоне видимого света (RGB), каждому пикселю изображения соответствует вектор яркостей :⃗ = (, , )(9)Требуется найти автомобили (их положение, ориентацию, размеры) при минимизации ошибок первого и второго рода.Метод решенияоснован на выделении областей с близкими цветовымихарактеристиками. Такой подход оправдан тем, что большинство автомобилей имеет однотонную окраску и при этом тон этой окраски, как правило,отличается от фонового (дорога, растительность).Основные стадии работы алгоритма таковы:∙ выделение тоновых характеристик (исключение влияния освещённости);∙ формирование областей одинакового тона путём кластеризации;∙ вычисление геометрических признаков областей и отбраковка.Выделение тоновых характеристикпроизводится переходом к нормализованным цветовым компонентам ⃗ = (, , ) :⃗ =⃗,||||1(10)где — глубина цвета (максимальное возможное значение яркости).
Вся дальнейшая обработка изображения происходит с использованием нормированных цветов.21Формирование областей одинакового тоназаключается в разбиении изображения на связные области, каждая из которых содержит точкиодинакового или близкого цветового тона ⃗, а соседние области существенно различны. Выбран подход слияния, то есть последовательного, начинаяс отдельных точек, объединения близких по цветовым характеристикам областей. Объединению подвергаются соседние по 4-связности области 1 , 2 ,если средние по этим областям цветовые характеристики ⃗ различаются менее, чем на заданную пороговую величину :|⃗(1 ) − ⃗(2 )| < ,(11)затем вычисляются характеристики новой области. Важно, что по построению характеристик, их вычисление выполняется за (1) независимо от размеров областей.Области организованы в виде очереди, для каждой из них алгоритмпроверяет условия объединения с соседями, причём полученная при слиянииобласть добавляется в конец очереди.
Таким образом, проходы идут один задругим. Алгоритм заканчивает работу, когда на очередном проходе не произведено ни одного объединения. При этом области, для которых не былопроизведено слияние, извлекаются из списка, поэтому после остановки прохода необходимо провести сканирование очереди с начала. Окончание работыалгоритма происходит, когда на протяжении очередной сканирования очереди от начала не происходит ни одного слияния.Отбраковка по геометрическим признакампроисходит в два этапа.
Сначала отбираются области-кандидаты по условию на площадь области:500 < < 5000.(12)Для каждой области, прошедшей отбраковку по площади, рассчитываются длины большой и малой полуосей эквивалентного эллипса инерции , .Через эти параметры выражаются условия на отношение длины к ширине икомпактность области, сооветствующей автомобилю:1.3 < / < 3, < 2.22(13)Оценка вычислительной сложностиОсновная часть вычислительной сложности алгоритма заключается в этапе формирования областей одинакового тона путём кластеризации, поэтому сложность будет оцениватьсядля кластеризации. Количество объединений не может быть больше, чем приобъединении всех точек в одну область, то есть ограничено сверху числом точек в изображении.
Количество проходов, то есть определения для каждойактивной области, можно ли её объединить с какой-либо другой, ограниченосверху случаем, когда за каждый проход совершается только одно слияние.Однако на реальных изображениях на начальном этапе происходит быстроеслияние, поэтому сложность кластеризации составляет ( 2 ) в худшем случае и ( log ) в среднем на реальных изображениях.Экспериментальная проверка и анализ результатовДля проверки результатов работы алгоритма была использована серия изображений спространственным разрешением 5-10 сантиметров в трех каналах с динамическим диапазоном 8 бит ( = 255). Было использовано 46 изображений,содержащих в общей сложности 2226 автомобилей.На изображениях было обнаружено 1613 автомобилей и получено 2452ложных срабатывания, что даёт 60% ложных срабатываний и 28% пропусков цели, что несколько уступает аналогам. Таким образом, можно сказать,что алгоритм недостаточно селективен для надёжного определения автомобилей, но принципиально работоспособен для предварительного выделениякандидатов на роль автомобилей.Основной причиной пропусков цели является спектральная близость автомобиля к фону (для серых и белых автомобилей).
Этот недостаток можетбыть устранён путём введения в рассмотрение яркостных характеристик илипри использовании большего числа спектральных каналов.Большое количество ложных срабатываний связано с достаточно слабыми ограничениями на геометрические параметры автомобиля. Более строгоеописание формы может уменьшить количество ошибок. Кроме того, количество ложных срабатываний можно уменьшить, если применять карту автомобильных дорог, и не детектировать автомобили вне проезжей части.2324ЗаключениеВыводы.1.Исследованы возможности средств дистанционного зондирования Земли, применимых для распознавания объектов на поверхности суши. Определены предпочтительные для решения поставленных задач данные, предложеныметоды их обработки.