Оптимизация применения агрохимических средств с использованием информационных технологий и математического моделирования (1098311), страница 7
Текст из файла (страница 7)
Характеристика условий проведения полевых опытов Геосети в Нечернозёмной зоне проведена по следующим величинам:
1. Показатели агрохимических и агрофизических свойств почвы
1.1. Величина кислотности солевой вытяжки из почвы (рН сол.),
единиц pH, по методу ЦИНАО, ГОСТ 26483 (1 М KCl вытяжка, соотношение
почва:раствор равное 1:2,5).
1.2. Величина гидролитической кислотности почвы, ммоль / кг почвы, по методу Каппена в модификации ЦИНАО, ГОСТ 26212 (1М CH3COONa вытяжка, соотношение почва:раствор равное 1:2,5).
1.3. Содержание в почве подвижных фосфатов, мг P2O5 / кг почвы, по методу Кирсанова в модификации ЦИНАО, ГОСТ 26207 (0,2 М HCl вытяжка, соотношение почва:раствор равное 1:5).
1.4. Содержание в почве обменного калия мг K2O / кг почвы, по методу Масловой (1 М CH3COONH4 вытяжка, соотношение почва:раствор равное 1:10).
Следует отметить, что в опытах Геосети определение содержания обменного калия в дерново-подзолистых почвах производилось по методу Масловой, в то же время, как учреждениями Государственной агрохимической службы используется метод Кирсанова (0,2 М HCl вытяжка при соотношении почва : раствор равном 1:5). Основанием для замены методов послужило наличие тесной корреляции между результатами исследования двумя методами, а также необходимость определения содержания фосфора и калия в одной аналитической пробе (Минеев, 1999; Сычёв, 2000).
1.5. Содержание в почве органического вещества, в массовых процентах, по методу Тюрина в модификации ЦИНАО, ГОСТ 26213.
1.6. Доля физической глины (частиц менее 0,01 мм), %. При значении переменной менее 10% почва песчаная, 10-20% - супесчаная, 20-30% - легкосуглинистая, 30-40% - среднесуглинистая, 40-50% - тяжелосуглинистая, 50-65% - легкоглинистая, 65-80% - среднеглинистая, 80-100% - тяжелоглинистая (классификация Н.А. Качинского, цит. по: Розанов, 1975).
2. Агроклиматические показатели
2.1. Сумма осадков за год, мм.
2.2. Cумма средних дневных температур выше 10 град. С (активных температур по Г.Т. Селянинову) за вегетационный период.
2.3. Величина ГТК за апрель - октябрь.
Значения перечисленных показателей для каждого из 62 опытов в Реестре АИС “Геосеть-2000” составили обучающую выборку. Для типизации условий их проведения использован статистический метод кластерного анализа (алгоритм разбиения “k средних”), вычислительная реализация в программе Statistica 5.5 (STATISTICA..., 1999). Блок-схема расчётов представлена на рисунке 4.1.
Работа алгоритма на шаге 1 начинается с вычисления нормированных значений исходных признаков x*(k) по следующей формуле:
Здесь - среднее выборочное,
- стандартное отклонение признака x(k), оцененное по обучающей выборке.
Нормирование значений признаков необходимо, поскольку они имеют сильно различающиеся абсолютные значения и дисперсии.
На шаге 2 определяются эталонные точки e1, e2, em, представляющие на первой итерации центры кластеров (групп объектов). Каждая точка ei,
i = 1, 2, …, m имеет координаты (x*i(1), x*i(2),…, x*i(p)) в многомерном признаковом пространстве. На первой вычислительной итерации эталонным точкам ei назначаются координаты первых m значений обучающей выборки.
На шаге 3 рассчитываются элементы матрицы парных расстояний между объектами обучающей выборки по формуле 4.2.
На шаге 4 из обучающей выборки извлекается очередной элемент Xt.
На шаге 5 вычисляются парные расстояния между текущими эталонными точками по формуле 4.2.
На шаге 6 определяется эталонная точка, ближайшая к извлеченному на шаге 4 элементу выборки.
Рисунок 4.1. Блок-схема работы алгоритма
кластерного анализа “k средних”
Если расстояние от него до ближайшей эталонной точки больше, чем минимальное расстояние между двумя любыми эталонными точками, ближайшей эталонной точке присваивают координату вновь извлеченного элемента выборки (шаг 7). В противном случае (шаг 8), новые координаты ближайшей эталонной точки рассчитывают по формуле:
где k - порядковый номер признака, - координата эталонной точки ei;
- координата извлеченной из обучающей выборки на шаге 4 точки.
Процедуру (шаги 4 - 8) повторяют, пока не будут исчерпаны элементы обучающей выборки.
После того, как координаты эталонных точек установлены, производится распределение элементов обучающей выборки по принадлежности к классификационным группам (кластерам).
На шаге 9 извлекают очередной элемент обучающей выборки Xt, оценивают по формуле 4.2 расстояние dE (ei, Xt) до каждого из m центров кластеров. Кластер, для которого расстояние оказывается наименьшим, считается выбранным.
На шаге 10 положение центра кластера пересчитывают, как среднее арифметическое значений координат содержащихся в нём точек.
Работа алгоритма завершается, когда все значения обучающей выборки распределены по кластерам.
Для оценки качества разбиения множества объектов на кластеры использован метод, основанный на сравнении дисперсии внутри- и межкластерного рассеяния элементов выборки. Рассчитывается средняя внутрикластерная дисперсия центральных расстояний s21, характеризующая рассеяние точек в пределах индивидуальных кластеров:
Здесь m - общее число кластеров, i - порядковый номер кластера, Ni - число элементов в нём, ei ‑ центр кластера (эталонная точка), j - порядковый номер точки Xi,j в кластере, - среднее арифметическое расстояния всех точек кластера порядковым номером i до соответствующей эталонной точки ei, вычисленное по формуле 4.2.
Теснота взаимного расположения всех точек обучающей выборки (независимо от принадлежности к кластерам) характеризуется общей дисперсией расстояний s22 по формуле:
где - координаты центральной точки обучающей выборки, n - совокупный её объем,
- среднее арифметическое расстояния всех точек выборки i до центральной точки
.
Для проверки статистической гипотезы о равенстве оценок дисперсий s21 и s22 использован F - критерий Фишера. Условие проверки нулевой гипотезы, при которой оценки двух дисперсий достоверно не различаются, записывается следующим образом:
H0: = s21 = s22, если Fвыч. = s22 / s21 F крит. (4.7)
Оптимальное число выделяемых кластеров - минимальное значение параметра m, при котором опровергается гипотеза 4.7. Критическое значение F - статистики соответствует заданному уровню значимости и степеням свободы (n - m) для s21 и (n ‑ 1) для s22, соответственно.
В результате анализа данных по приведенному алгоритму, обучающая выборка, содержащая характеристики почвенных и агроклиматических условий проведения 62 опытов Геосети в Нечернозёмной зоне, разделена на 5 групп. Средние значения и доверительные интервалы признаков для них приведены в таблице 4.1.
Число степеней свободы средней внутрикластерной дисперсии s21 составляет 57; общей дисперсии s22 - 62. Для проанализированной выборки s21 равно 0,07, s22 - 0,12, F выч. - 1,65. F крит. при уровне значимости = 0,05 составляет 1,53. Поскольку F выч. > F крит., средняя внутрикластерная и общая дисперсии достоверно различаются, что свидетельствует о правильном выборе числа кластеров (m = 5).
Анализ результатов классификации позволил выявить различия между условиями проведения полевых опытов, включенных в группы 1-5 (таблица 4.2). Большинство опытов в группе 1 проведены в Российской Федерации ВИУА им. Д.Н. Прянишникова: Центральной опытной станцией, Смоленским и Новозыбковским филиалами, всего - 5 опытов. Опыты группы 2 выполнены, преимущественно, опытными учреждениями Белоруссии: Белорусской сельскохозяйственной академией, Белорусским научно-исследовательским институтом земледелия и Белорусским научно-исследовательским институтом почвоведения и агрохимии, всего - 13 опытов. В группе 3 преобладают эксперименты, проведенные Центральной опытной станцией ВИУА им. Д.Н. Прянишникова. Опыты в группе 4 проведены различными опытными учреждениями России и Белоруссии. В группе 5 преобладают эксперименты, выполненные Смоленским филиалом ВИУА им. Д.Н. Прянишникова (названия опытных учреждений приведены на время публикации результатов исследований).
Таблица 4.1. Средние показатели почвенного плодородия и агроклиматических условий в группах
полевых опытов на дерново-подзолистых почвах. Информационный банк АИС “Геосеть-2000”
| Группа 1 | Группа 2 | Группа 3 | Группа 4 | Группа 5 | |||||
Гумус | 1,40 | 0,39 | 1,90 | 0,21 | 1,71 | 0,10 | 2,01 | 0,20 | 3,10 | 1,51 |
pH сол. | 4,7 | 0,3 | 4,5 | 0,2 | 4,3 | 0,3 | 5,8 | 0,2 | 4,4 | 0,2 |
Н г. | 28,0 | 6 | 42 | 3 | 44 | 3 | 21 | 3 | 54 | 13 |
P подв. | 100 | 37 | 142 | 41 | 46 | 09 | 199 | 77 | 86 | 108 |
К обм. | 65 | 21 | 99 | 15 | 108 | 14 | 131 | 25 | 79 | 33 |
ФГ | 25,7 | 9,8 | 24,7 | 0,6 | 42,6 | 1,9 | 28,5 | 4,2 | 40,6 | 7,6 |
r I-XII | 567 | 23 | 615 | 5 | 585 | 5 | 604 | 7 | 601 | 32 |
t IV-X | 2201 | 84 | 1955 | 22 | 1825 | 18 | 1880 | 55 | 1635 | 122 |
ГТКIV-X | 1,55 | 0,03 | 1,89 | 0,01 | 1,92 | 0,01 | 1,93 | 0,05 | 2,22 | 0,14 |
Число опытов | 8 | 14 | 17 | 13 | 10 |
Примечания: - среднее значение величины;
- доверительный интервал среднего при уровне значимости = 0,05; Гумус - содержание гумуса в почве, %, pH сол.- реакция солевой вытяжки, ед.; Н г. - гидролитическая
кислотность, ммоль-экв / кг; Р подв. - содержание подвижных фосфатов, мг P2O5 / кг почвы; K обм. - содержание
обменного калия, мг K2O / кг почвы; ФГ - содержание физической глины, %; r I-XII - годовая сумма осадков, мм;
t IV-X - сумма активных температур за год, ˚С; ГТКIV-X - гидротермический коэффициент за апрель - октябрь, ед.