Метод и алгоритмы обработки информации с гиперспектрометров при дешифровке наземных объектов (1025264), страница 2
Текст из файла (страница 2)
Визуализация является малоэффективным алгоритмом в анализе данных гиперспектрального снимка. Эти данные не только обширные, но и многомерные в диапазоне от 400 до 2400 нм.
Такое представление имеет существенный недостаток. Так как человеческий глаз видит в диапазоне от 200 до 600 нм, то визуализация гиперспектральных данных ведет к большой потере информации.
Таким образом, вся информация, не вошедшая в этот диапазон, будет при такой работе утеряна. Более информативным будет невизуальное представление. Подобное представление позволяет определить кривую спектральной яркости объекта в чисто цифровом виде и дает возможность выделить объект, не прибегая к визуальному представлению изображения, а используя его как иллюстрацию.
Рис.2 Невизуальное представление гиперкуба.
Реализация этого подхода в работе осуществляется путем построения невизуальной версии гиперкуба. При построении и описании невизуального представления данных были использованы методы многомерного статистического анализа и определения свойств линейного n-мерного пространства.
Каждый канал гиперспектрального снимка представляется как массив пикселей (1).
С учетом количества каналов образуется n-мерное пространство таких массивов, где n количество каналов снимка. Эти массивы связанные между собой, представляют трехмерный куб.
Каналы гиперспектрального снимка представляют информацию о снимке в диапазоне от 0 до 2400 нм с шагом от 10 до 20 нм в зависимости от характеристик гиперспектрометра. Следовательно, каждый пиксель на снимке характеризует спектральную яркость объекта на данной длине волны. По этим данным можно построить кривую отражательной способности объекта. Ниже приведен пример кривой отражательной способности сосны, где по оси Y отложена отражательная способность, по оси X длина волны. (Рис.3)
Рис.3 Кривая отражательной способности сосны.
Данная кривая характеризует отражательную способность объекта в конкретной точке снимка. Совокупность кривых для всех пикселей, всех точек снимка позволяет получить представление гиперспктрального снимка как массива кривых отражательных способностей объектов в каждой точке снимка.
Указанное представление исходной информации позволило предложить формализованный метод уменьшения зависимости результатов дешифровки от внешних факторов при съемке (спектральные тренды, недостаток освещения, угол съемки, задымленность и другие шумовые характеристики). Суть метода состоит в создании разностной матрицы на основе сдвинутых матриц одного и того же гиперспектрального представления пикселей (рис.4,5).
Рис.4 Кривые отражательных способностей сосны (красный) и ольхи (зеленый), построенные по данным спектров лесных пород.
Рис.5 Кривые отражательных способностей сосны (красный) и ольхи (зеленый), построенные по данным разностных матриц спектров лесных пород.
Для реализации предложенного метода в диссертации разработан алгоритм, который представлен следующей последовательностью операций:
1) из исходного гиперспектрального изображения создают и записывают матрицу интенсивностей всех спектральных каналов для определяемого пиксела;
2) сдвигают матрицу по оси частот (по номерам каналов) и записывают ее;
3) матрицы вычитают (из второй первую) и записывают разностную матрицу;
4) указанные действия повторяют для всех пикселов изображения.
В результате будет трехмерная матрица по координатам пикселов и длинам волн (или номеров каналов).
Кривые разностных матриц приведенные на рис. 3 образуют набор информативных признаков, относящихся к каждому исходному спектру. Такими признаками могут являться, в зависимости от конкретной задачи положительная и отрицательная амплитуды, расстояния между нулями положительной и отрицательной полуволн и комбинации (например, суммы и разности соответствующих параметров) и т.д.
В таблице 1 приведена разрешающая способность новых признаков и существующих, для оценки преимуществ.
Таблица 1 разрешающая способность новых и существующих признаков
сосна | ольха | |
(Max-min)/среднее по y | 51% | 136% |
(Max-min)/среднее по x | 136% | 45% |
(Разница полуволн)/среднее | 132% | 132% |
Разрешающая способность(NDVI) | 30% | 23% |
Разрешающая способность методов кластерного анализа | 35% | 25% |
Разрешающая способность статистических методов | 25% | 20% |
Для реализации этого алгоритма было разработано программное обеспечение DESH, с использованием которого была построена математическая модель процесса обработки информации с гиперспектрометра на основе предложенного метода.
В третьей главе проводится апробация и экспериментальная проверка разработанных метода и алгоритмов на модели космических снимков с помощью разработанного программного обеспечения DESH.
Описывается программное обеспечение DESH, принцип построения и расчета шумовых характеристик для кривых отражательных способностей и статистический анализ и проверка эффективности разработанных методов на модели космических снимков.
Программное обеспечение DESH реализует две функции:
1. Создает модель космического гиперспектрального снимка с определенным количеством объектов на нем (в том числе лесных и сельхоз пород).
2. Проверяет работу разработанных метода и алгоритмов.
Для описания программы нам будет достаточно смоделировать снимок состоящий из 25 пикселей (5*5).
Программа направлена на определение пяти пород растительности (сосна, ель, береза, осина, ольха), которые в случайном порядке регенерируются при работе программы в поле матрицы
Входные данные 5 на 5. Каждому полю матрицы соответствует пиксель с одной из пород растительности. Каждая порода в свою очередь задается при помощи кривой из сорока точек в двумерном пространстве. Программа DESH включает в себя библиотеку эталонов вышеуказанных пород растительности. В поле “Эталон” появляется матрица пикселей эталонов пород растительности и шумовых пикселей. В поле “Входные” появляется матрица пикселей неклассифицированных пород, заданных с помощью библиотеки и шумовой характеристики, которая изменяет координаты точек каждой из кривой библиотеки эталонов. Далее над матрицей «Входные данные» проводят преобразования, приведенные в алгоритме, по всем признакам и полученный результат попиксельно сравнивают с библиотекой эталонов. Классифицированную матрицу записывают в поле “Выходные данные” (рис.6).
Рис. 6 Пример работы программы DESH
Далее в 3 главе приводится статическая оценка эффективности метода с учетом смоделированных внешних факторов (шумов) на примере модельного снимка в 5625 пикселей (75*75).
Для моделирования внешних факторов проделаны следующие операции: точки эталонного графика сдвигаются вверх или вниз по оси y, то есть изменяется отражательная способность каналов (для достоверности программа изменяет случайное количество точек, но не менее 70%, случайным образом, но не менее чем на 2 единицы).
Далее приводится статистический анализ на модельном снимке с помощью разработанного программного обеспечения. На каждом этапе будем увеличивать пороговую погрешность, а так же минимальное количество необходимых совпадений.
Для простоты сравнения в правом нижнем углу находится окно «Количество определенных пород», в котором приведена таблица, показывающая эталонный набор пород на снимке (колонка «Эталон») и количество определенных пород (колонка «Выходные данные»), в количественных и процентных показателях от всего снимка. К примеру «Сосна: 1873 – 37%», означает, что на снимке 1873 сосновых породы, что составляет 37% от всего количества пород на снимке. Для достоверности модельного снимка, 2% и эталонного и обрабатываемого снимка, будут заполняться породами с кривыми отражательных способностей, задаваемыми в абсолютно произвольном порядке и даже близко не подпадающие ни под один из эталонов. В окне «Количество определенных пород» такие породы обозначены как «Другое»1,2,3. (Рис. 7)
Рис. 7 Результат работы программы (для всех пород)
Увеличим погрешность на 15 процентов. (Рис.8)
После увеличения погрешности до 15% правильность определения пород снизилась: сосна – 97%, ель – 100%, береза – 70%, осина – 69%, ольха – 77%, другое (в целом) – 11%. Ниже приведена сводная таблица 2 разрешающих способностей объектов, наглядно иллюстрирующая преимущества новых дешифровочных признаков.
Рис. 8 Результат работы программы при отклонении в 15 единиц
Таблица 2 Разрешающая способность дешифровки по каждой породе
сосна | ель | береза | осина | ольха | |
Сумма амплитуд | 51% | 50% | 136% | 147% | 114% |
Период переколибаний | 136% | 45% | 45% | 91% | 182% |
Разница полуволн | 132% | 44% | 132% | 58% | 132% |
Дешифровка по NDVI | 30% | 32% | 23% | 24% | 23% |
Дешифровка методами кластерного анализа | 35% | 35% | 25% | 30% | 25% |
Дешифровка статистическими методами | 25% | 25% | 20% | 20% | 20% |
Далее в диссертации приводится описание проверки эффективности разработанных метода и алгоритма на натурном снимке.
Для проверки эффективности разработанных метода и алгоритмов в реальных условиях были взяты гиперспектральные и наземные данные, предоставленные одной из ведущих в России организацией по разработке технического и программного обеспечения для гиперспектральных измерений.
Для проверки был предоставлен гиперспектральный снимок, состоящий из 287 каналов в диапазоне от 300 до 900 нм, с пространственным разрешением 1,8 м. Для оценки полученных результатов были также предоставлены наземные (априорные) данные того же участка, который изображен на снимке с подробным описанием количественных и качественных характеристик пород и объектов на снимке.
Для определения на снимке были взяты следующие 7 пород: лен, лен с сорняками, лежь, рожь, рижик, пшеница, крапива. Также в отдельный класс была выделена лесополоса, точный данных по которой предоставлено не было.
Из гиперспектрального снимка была выделена спектральная яркость каждой породы. Далее, используя наземные (априорные) данные и гиперспектральный снимок, был создан и занесен в программное обеспечение эталонный образец дешифровки. Гиперспектральный снимок был введен в программное обеспечение, проведена его обработка и сравнение результатов с эталоном (Рис.9).