Диссертация (1137223), страница 18
Текст из файла (страница 18)
Рассмотрены этапы усовершенствования моделиплодородия для повышения точности и заблаговременности прогнозирования.3. Сформулированы рекомендации по применению разработанных моделей дляпрогнозированияхарактеристикопределённому классу.явленийипроцессов,принадлежащихк105Глава 4.Анализ результатов применения численного методадля прогнозирования урожайности различных областей РФ иразличных сельскохозяйственных культурВ главе приводятся результаты вычислительных экспериментов с набором моделей,описанных в главе 3. Обучение моделей проводится с использованием алгоритмовмногомерной оптимизации. Результатом прогнозирования является ожидаемое значениеурожайности сельскохозяйственных культур для различных территорий.
Проводится анализприменимости моделей с помощью процедуры кросс-валидации. Оценивается значимостьполученных прогнозов. Получены и проанализированы графики зависимости точностипрогнозирования от продолжительности сезонных наблюдений и момента прогнозирования.4.1 Настройка моделей плодородияВычислительный эксперимент требует предварительной подготовки, которая состоит изстадии подготовки и сбора данных (см.
Рис. 4.1). Перед тем, как начинать экспериментнеобходимо задать параметры исходных данных и осуществить их загрузку согласнопроцедуре, описанной в пункте 4.1.1. Как показано на рисунке 4.2 параметры загрузкиисходных данных определяют тип и количество сельскохозяйственных культур, набор лет длянаблюдения за состоянием областей интереса, набор областей интереса и типы данных ДЗЗ.После чего происходит загрузка данных согласно процедуре 4.1.1.4.1.1Планирование численного эксперимента. Сбор данных для численногоэкспериментаСхематически описание стадий предварительной подготовки численного экспериментапредставлено на рисунке 4.1.106Стадия планирования численногоэксперимента1Параметры загрузкиисходных данныхНаборс/х культурСерверСервер ЕМИССЕМИСС2Периоднаблюдений NНабор областейинтересаИнтерактивнаяИнтерактивнаявитринавитрина ФГССФГССДанные ДЗЗ (типизображений)FTP-серверFTP-сервер USGSUSGSСтадия сбора данных для численногоэкспериментаИсходные данные1) коллекция изображений (Level 3)2) статистическая информацияРисунок 4.1 – Блок-схема стадий предварительной подготовки численного экспериментаПерваястадияпредварительнойподготовки–этопланированиечисленногоэксперимента, результатом которого является параметры загрузки исходных данных:— набор сельскохозяйственных культур C ;— период наблюдений N ;— набор областей интереса R ;— данные ДЗЗ (тип изображений).Вторая стадия предварительной подготовки – это сбор данных для численногоэксперимента.Результатомвторойстадииявляетсяколлекциямультиспектральныхкосмических изображений (Level 3) для заданных областей в течение N лет и статистическаяданные по урожайности с/х культур для заданных областей интереса на протяжении периоданаблюдений N .РаботасданнымиДЗЗ,вчастности,космическимиизображениямитребуетопределенных знаний о том, как получаются подобные изображения и где можно их получить.107Большая часть изображений высоко разрешения является платным продуктом, которыйпоставляется соответствующими компаниями.
Остальные данные имеют свободный доступ,например, размещаются на ftp-серверах в сети интернет. В данном случае загрузка изображенийосуществляется из официального архива геологической службы USGS [211] в пакетном режимес помощью утилиты wget [214]. Как указано в пункте 2.2.1, для прогнозирования характеристиксостояния областей земной поверхности используются спутниковые данные, соответствующиеуровню предварительной обработки Level 3 (см. Табл. 2.1).
Важным условием применениятаких изображений в данном эксперименте является наличие географической привязки,поскольку с её помощью совмещаются данные дистанционного зондирования и данныеназемных наблюдений.Загрузка статистических данных осуществляется с серверов официальной службыстатистики РФ [46] и Единой межведомственной информационно-статистической системы [40].Наличие двух источников информации позволяет проводить верификацию и заполнениенедостающих данных. Выгрузка данных с серверов указанных служб доступна в виде таблицXML [221] или в формате SDMX [197].Результатом предварительной подготовки численного эксперимента является коллекциямультиспектральных изображений, собранная за период наблюдений N лет для набораобластей интереса R , и статистические данные наземных наблюдений по урожайности с/хкультур C в течение N лет для набора областей интереса R .
Эти данные поступают на входметода прогнозирования (см. Рис. 4.2).4.1.2Численный экспериментОбщая схема численного эксперимента представлена на рисунке 4.2.108Исходные данные1) коллекция изображений (Level 3)2) статистическая информацияПредварительная обработка1) Структурирование исходных данныхпо областям и по годам с получениеммногослойных изображений2) Выбор продолжительности сезонныхнаблюдений3) Выделение информативного сигнала12Вычисление матрицинформативныхпризнаков1) Вычислениевекторов состояния2) Составлениематриц «объектыпризнаки»ТестовыеданныестатистикиМатрицы «объекты-признаки»Тестовые данные1) сезонныенаблюдения по ДДЗ2) статистическиеданныеСтруктурированиестатистических данныхСтатистическиеданныеДанные на обучение1) долгосрочныенаблюдения по ДДЗ2) статистические данные35ПолучениепрогнозаПрогноз4Поиск параметров модели1) Многомерная оптимизацияВыбор моделидля обучения1) Модель 12) Модель 23) Модель 34) Модель 4Статистический анализ61) Оценка точности прогноза2) Проверка значимостипрогнозовРисунок 4.2.
– Блок-схема численного эксперимента по обучению моделей плодородия ипрогнозированию урожайностиЭтап 1 начинается со структурирования исходных данных согласно параметрам,определённым на стадии планирования численного эксперимента (блок-1, рис. 4.1).
Исходныеданные (коллекция изображений и статистическая информация), загруженные из внешнихисточников, попадают на вход блоку-1 (см. Рис. 4.2) предварительной обработки. Внутри этогоблока изображения формируются в многослойные изображения по признаку области интереса ипо отдельным годам, также осуществляется выбор продолжительности сезонных наблюденийдля последующего вычисления матриц информативных признаков. Наличие географическойпривязки исходных данных позволяет автоматизировать процесс выделения областей интересана изображениях с помощью шейп-файлов [125], которые задают границу областей интереса.На следующем шаге происходит выделение информативного сигнала с помощью метода,описанного в пункте 2.3.1, который заканчивается набором шейп-файлов для уточнённыхграниц областей интереса.
После чего полученные многослойные изображения преобразуются с109учётом найденных границ областей интереса. Подробно описание процесса предварительнойобработки приведено в пункте 2.2.1. Выбор продолжительности сезонных наблюденийосуществляется на всей коллекции изображений за все годы N с учётом числа наблюденийgn ,проводимых внутри одного года n N , по формуле (2.8). Данные статистикиструктурируются по типу с/х культур, значения урожайности за N лет объединяются в векторапо признаку области интереса.На выходе этапа 1 формируется коллекция изображений, структурированных попризнаку области интереса в датасеты по годам, статистические данные структурированы ввектора значений урожайности за N лет по каждой области интереса и культуре, определеныпродолжительность и конкретные моменты1,..., M сезонных наблюдений.Этап 2 начинается с загрузки датасетов, полученных на этапе 1, в блок-2 (см.
Рис. 4.2)вычисления матриц информативных признаков. На этапе 1 определены продолжительность и конкретные моменты1,..., M состоянием области интересамногослойного изображениясезонных наблюдений. Вектор сезонных наблюдений заrp вычисляется с помощью формулу (3.5) для каждогоDnза годnи удовлетворяет определению 2.16 векторасостояния области интереса, то естьVrnp v1где vmrp– усредненное по областиrp,..., vMrp n,(4.1)rp значение индекса состояния v в момент наблюденийm.Процедура нахождения вектора сезонных наблюдений (4.1) повторяется для всех имеющихсялет N по всем областям интереса R {rp }Pp 1 .
Из полученных наборов векторов составляютсяматрицы «объекты-признаки». Процесс вычисления векторов состояния областей и составленияматриц информативных признаков описан в пункте 2.4.2.2-ой этап завершается формированием матриц «объекты-признаки» для заданнойпродолжительности иобласти1,..., M сезонных наблюдений в течение каждого годаn N поrp R .Поскольку при обучении моделей плодородия данные по урожайности для различныхс/х культур не смешиваются, то этап 3 начинается с выбора сельскохозяйственной культуры,для которой осуществляется прогнозирование урожайности, выделяются наборы тестовыхданных и данных на обучение. Статистические данные хранят историческую информацию о110значениях характеристик областей интереса на протяжении всего периода долгосрочныхнаблюдений. Эти данные разделяются на два множества:1.