Диссертация (1141478), страница 15
Текст из файла (страница 15)
Следующий слойпредставляет собой скрытый слой, который получает информацию из входного слояи после обработки генерирует ее в выходной слой, таким образом все созданныеданные передаются в выходной слой. На выходном уровне данные преобразуютсяс помощью функций в чистое выходное значение, которое сравнивается с целевымпутем вычисления величины средней квадратичной ошибки (MSE).MSE рассчитывается по формуле:2∑Ni=1(t i − a i )MSE =N(5.3)где ti – целевой выход;ai – прогнозируемые выходы;N – количество точек.ПолученныезначенияMSEраспределяютсяпометодуобратногораспространения от выходного слоя к входному, таким образом происходиткорретировка веса и уклона сети.
Этот шаг повторяется до тех пор, пока сеть неприблизитсякцелевымзначениямсприемлемойвеличинойошибки.Соответственно, количество необходимых итераций проводится до достиженияоптимального случая.Нейронная сеть имеет несколько параметров, таких как сетевая архитектура,тип сети, выбор входных данных, алгоритмы обучения, функции активации, веснейронной сети, значение смещения, количество импульсов итераций икоэффициент распределения данных, которые влияют на построение модели ИНС[145].Однако все передаточные функции и алгоритмы могут быть неприменимыдля исследуемых процессов.
Выбор функции передачи, подходящего алгоритмаобучения и количество нейронов в каждом слое являются очень чувствительнымипараметрами для проектирования сети, поскольку они контролируют и влияют навремя обучения сети, производительность обучения и возможности его обобщения.108Обучение ИНС чувствительно к количеству скрытых слоев и нейронов в этихслоях. Чем больше нейронов в скрытом слое, тем лучше для моделирования, илинаоборот, потому что чрезмерное количество нейронов в слое подходит для подбораданных, но приводит к чрезмерной установке, которая может быть причиной потеривозможности обобщения сети.
С другой стороны, небольшое количество нейроновв скрытом слое может не соответствовать эксприментальным данным, и,следовательно, сеть может не обучиться. То есть, если модель не согласуется сэкспериментальными результатами, выходное значение будет неверным. В нашемисследовании был применен метод проб и ошибок для поиска наиболее подходящейсетевой модели [146]. На рисунке 5.15 приведена полученная нами конфгурацияИНС для моделирования процесса адсорбции иона аммония и органическихвеществ на сорбенте из рисовой соломы.Рисунок 5.15 – Конфигурация искусственной нейронной сети (ИНС)109Данная искусственная нейронная сеть была сконфигурирована по принципу«6–10–2».
Сеть состоит из трех слоев: входной слой с шестью элементами(начальная концентрация иона аммония, начальное значение ХПК, количествоадсорбента, температура, время контакта и рН), один скрытый слой с десятьюузлами или нейронами, выбранный методом проб и ошибок, и выходной слой сдвумя конечными элементами (эффективность адсорбция иона аммония иэффективность снижения ХПК). Каждый элемент входного слоя (P6x1)подключается к каждому входу нейрона через весовую матрицу 10×6 (W10x6).Входы взвешиваются и суммируются (W6x3, P6x1), а затем добавляется смещениеодиннадцати отрезков (b6x1).
Полученная сеть ввода (U11x1 = Σ W10x6 P6x1 + b10x1) преобразуется нелинейным способом через передаточные функции.Логистическая функция определяется по формуле 5.3, и выводит выходныепараметры в диапазон от 0 до 1, поскольку чистый вход нейрона имеет значения отнуля до положительной бесконечности.В последнем слое используется функция активации, определяемая поформуле 5.4.Формулы 4.5 и 4.6 приведены ниже:() = tanh() =, 0 ≤ () ≤ 11 + (5.4)() = ,(5.5)− ∞ ≤ () < +∞На рисунке 5.16 показано влияние входных параметров на адсорбционныепроцессы и эффективность удаления загрязняющих веществ (органических и азотааммонийного).110Рисунок 5.16 – Влияние входных параметров на эффективность удаления азотааммонийного и органических веществВлияние времени контакта на эффективность удаления иона аммонияпоказано на рисунке 5.16 (А), где концентрация азота аммонийного повышается сувеличением продолжительности контакта до 90 минут.
Это, предположительно,связано с большей поверхностью функциональных групп адсорбента в началереакции. Поверхностные адсорбционные участки попадают в область насыщения,тогда адсорбат транспортируется во внутренние участки частиц адсорбента, в этомслучае эффективность адсорбции замедляется до тех пор, пока не будет достигнутополное насыщение. Увеличение концентрации ионов аммония от 3 мг/л до 25 мг/лприводит к снижению эффективности удаления аммония с 55,5 до 36%. Напротив,увеличение концентрации ХПК от 150 до 1000 мг/л приводит к увеличениюэффективности снижения ХПК с 76,67% до 90,44%. Кроме того, эффективностьадсорбции органических веществ, которая достигла значения по ХПК 76,67%,выше, чем эффективность адсорбции азота аммонийного (55,56%) на биоуголе,полученном из рисовой соломы.
Адсорбция аммония на биоуголе происходит в111результате химической и физической адсорбции. Химическая адсорбцияпроисходит в результате наличия функциональных групп с отрицательнымизарядами на поверхности угля. Процесс физической адсорбции в порах протекает снизкой эффективностью, однако при увеличении концентрации азота аммонийногоактивные участки функциональных групп с отрицательным зарядом наповерхности биоугля насыщаются азотом аммонийным, количество активныхучастков уменьшается, что приводит к снижению эффективности адсорбции приувеличении концентрации азота аммонийного в растворе.
При увеличении ХПК,эффективностьегоудаленияувеличивается,посколькубольшаячастьорганических веществ адсорбируется за счет физической адсорбции, и лишьнемногиеизнихпоглощаютсяхимическойадсорбцией.Эффективностьфизической адсорбции возрастает с увеличением концентрации адсорбата врастворе, поскольку он вызывает высокое давление на поверхности адсорбента, чтоприводит к созданию центров адсорбции [145]. Также эффективность удаленияадсорбента возрастает с увеличением рН от 2 до 8,5, потому что при низком уровнерН концентрация иона аммония, который имеет положительный заряд,увеличивается, в результате увеличивается конкуренция за активные участкимежду адсорбентом и ионом водорода на поверхностях функциональных групп.При высоком уровне рН более 8,5 адсорбция азота аммонийного уменьшается засчет превращения ионов аммония в аммиак NH3, что проиллюстрировано нарисунке 5.16 (E) [145, 146, 147].Количество адсорбента и температура раствора имеют прямую связь сэффективностью адсорбции.
Увеличение количества адсорбента создает большешансов для адсорбции на функциональных группах и в порах (рисунок 5.16 (С)). Сдругой стороны, при более высокой температуре ионы обладают высокойкинетической энергией, что позволяет быстрее находить адсорбционные участки(рисунок 5.16 (D)).Искусственная нейронная сеть, показанная на рис. 5.15, была сгенерированапрограммой MATLAB с помощью набора нейронных сетей «Nntool». Страницапрограммы в процессе моделирования приведена на рис. 5.17.112Рисунок 5.17 – Страница программы при моделировании ИНСМодели ИНС были протестированы с различным числом нейронов и слоев,чтобы найти оптимальное количество нейронов и скрытых уровней, при этомучитывались значения средней квадратичной ошибки MSE и сравнивалисьпредсказанные значения тестовых данных с целевыми.Автором данной работы найдено оптимальное значение ИНС на одномскрытом слое с 10 нейронами со структурой 6–10–2.
Входная матрица состоит из126 столбцов и 6 строк, а целевая матрица состоит из 126 столбцов и 2 строк. Натренировочном процессе используется 70% входных и целевых данных, гдепрограмма ИНС случайным образом делит данные ввода и цели на 3 группы (70%для обучения, 15% для проверки и 15% для тестирования). Был использованалгоритм обучения Левенберга–Марквардта (LM), так как он является одним изнаиболее быстрых для обучения нейронных сетей среднего размера. Алгоритм LMпредназначен для приближения к скорости обучения второго порядка безвычисления матрицы Гессиана.
Более того, алгоритм LM имеет лучшуюпроизводительность, чем другие методы при аппроксимации функций. На рисунке5.17 приведен снимок экрана программы в ходе обучения. Обучение сетиостановилось через 56 сек. из-за числа проверок валидации, которое было равно113100, поскольку прогресс обучения не достиг цели градиентного значения 1e-7, ноградиент достиг значения 0,225 в 100 эпохах (тренировка останавливается, когдапроисходит какое-либо из этих условий: максимальное количество временипревышено, достигнутовалидации),градиентмаксимальное количествопроизводительностипадаетэпох (число проверокнижеминимального,производительность сводится к цели).График на рисунке 5.18 показывает значение средней квадратичной ошибкипо сравнению с количеством итераций обучения. Наилучшая эффективностьвалидации составляла 3,78 в эпоху 0.
После эпохи 0 тестовая кривая увеличиваласьпо мере увеличения кривой валидации, при этом кривые тестирования и валидацииочень схожи.Рисунок 5.18 – Состояние обучения и производительность созданноймодели ИНСВо время обучения вес и смещения всех параметров в сети корректируютсядо тех пор, пока сетевой выход не будет соответствовать цели, то есть до тех пор,114пока нейроны, которые приближаются к выходу, не приобретут больший вес, чемдругие. Ниже приведены веса и смещения после тренировки ИНС.Вес от входов до скрытого слоя− 17.87 0.68 − 0.92 5.66 − 13.73 − 4.62 0.571.99 − 2.64 − 0.45 0.65− 1.41 1.82 − 13.72 − 0.70 0.780.95− 9.63 5.36 − 0.53 − 0.41 − 0.26 − 11.20 0.16 0.87− 2.31 − 0.44 − 5.12 0.720.39 0.34 − 0.88 1.870.35− 0.32 4.66 − 0.19 − 1.72 1.70 − 3.52 − 0.38 − 3.32 9.04 − 0.46 − 0.07 4.98 − 24.73 1.43 − 8.55 − 0.37 − 0.02 − 1.03 − 0.230.70 2.344.00 − 0.80 6.471.21− 0.66 Вес от скрытого слоя до выхода 0.01 − 2.22 − 8.16 11.03 10.53 − 5.75 − 4.58 9.67 − 2.98 0.733− 1.74 0.090.05 − 2.42 − 1.85 0.830.35 − 0.14 0.41 0.86 Смещение к скрытому слою− 22.94 − 2.06 − 5.89 − 4.99 − 7.93 1.45 − 1.17 25.61 − 0.86 − 7.22 Смещение к выходу− 5.22 0.59 На рисунке 5.19 приведены сравнительные графики выходного значенияискусственной нейронной сети и целевого значения.
Сравнение производилось спомощью корреляционной функции (R). Из данных рисунка 5.19 следует, чтографики обучения, валидации и тестирования показывают хорошую совместимостьс R-значением, близким к 1. Вызывает интерес тот факт, что полученная модель115архитектуры ИНС соответствует всем данным со значением R, равным 0,99. Этирезультаты подтверждают надежность архитектуры ИНС и возможность ееиспользования для прогнозирования новых значений.Рисунок 5.19 – График регрессии точек данныхВлияние шести независимых переменных, таких как рН, время контакта,концентрация азота аммонийного, ХПК, температура и количество доз адсорбентапри сорбции иона аммония и органических веществ на биоугле, полученном изрисовойсоломы,практическинеизучаетсяученымиразличныхстранприменительно к очистке оборотных вод УЗВ. Текущая работа демонстрируетуспешное удаление ионов аммония и органических веществ из водных растворов смаксимальной эффективностью 70,83% и 90,44%, соответственно.116Исследования сорбционных свойств рисовой соломы,5.3модифицированной экономичными способамиИсследования, приведенные в главе 3 и в этой главе, убедительнодоказывают,чторисоваясоломаРСII,активированнаяспомощьюпредварительной промывки в гидроксиде натрия и карбонизации при температуре600 оС, является перспективным сорбентом для снижения концентрации азотааммонийного и/или органических веществ.