Автореферат (1150359), страница 3
Текст из файла (страница 3)
Таким образом, в массиве есть сенсоры,чувствительные к анионам додецилсульфата. Кроме того, сенсор Кат3проявляет чувствительность к ионам натрия.11На рисунке 5 представлена экспериментально полученная информацияо чувствительности сенсоров к веществам класса фенолов. Всеградуировочные измерения проводились по три раза, затем вычислялосьсреднее значение потенциала каждого сенсора в каждом образце.Среднеквадратичныеотклонения(СКО)величинэлектроднойчувствительности, установленные в условиях воспроизводимости (n=3), непревышали 2 мВ/дек.Рисунок 5.
Величины наклонов электродных функций некоторых сенсоров вводных растворах веществ класса фенолов. Диапазон изучениячувствительности для фенола и п-крезола от 10-5 до 10-3 моль/л и от 10-5 до 102моль/л для о-нитрофенолаНа диаграмме видно, что большинство из используемых в данноммассиве сенсоров проявляют чувствительность в растворах о-нитрофенола. Врастворах фенола чувствительность большинства сенсоров невелика,исключение составляет сенсор Кат5, а также сенсор Ан5, чувствительный корганическим анионам.
В растворах п-крезола сенсоры проявляютчувствительность схожую с откликом в растворах фенола.Полученные на этом этапе данные свидетельствуют о возможностииспользования рассмотренных сенсоров для оценки состояния вод,загрязнённых различными веществами: тяжелыми металлами, ионогеннымиПАВ, фенолами, органическими кислотами, диссоциирующими в воде принормальных условиях (Табл.1).2. Классификация водных образцов по токсичностиНа следующем этапе работы массив сенсоров использовали для оценкитоксичности водных образцов, как модельных, представляющих собойводные растворы индивидуальных токсикантов, так и реальных образцовприродных вод.
В рамках каждого отдельного эксперимента все образцыисследовались по крайне мере три раза, в случайном порядке, после чего12вычислялось среднее значение потенциала каждого сенсора в каждомобразца.Все водные растворы индивидуальных токсикантов изучались сразупосле приготовления. Все реальные образцы изучались в том виде, в которомони доставлялись в лабораторию, анализ проводился не позднее, чем через 6часов после отбора пробы, дополнительная пробоподготовка не проводилась(ПНД Ф Т 14.1:2:4.10-2004, ПНД Ф Т 14.1:2:3:4.11-04 16.1:2.3:3.8-04, ПНД ФТ 16.1:2.3:3.10-06, ФР.1.39.2007.03222). Между измерениями образцыхранились в холодильнике.Значения потенциалов сенсоров в трех повторных измерениях одного итого же образца воспроизводились с СКО ≤ 3 мВ.Результаты анализа мультисенсорной системой каждого из объектовпредставлялись в виде матриц, где число строк – количество исследуемыхобразцов, а число столбцов – количество сенсоров в массиве.
Обработкуданных проводили с помощью программного обеспечения «Unscrambler 9.7»(CAMO, Norway), а также «R version 2.13.0» (The R Foundation for StatisticalComputing).2.1.Классификацияводныхрастворовиндивидуальныхтоксикантов по токсичностиНа этом этапе работы оценивалась возможность применениямультисенсорной системы для классификации водных растворовиндивидуальных токсикантов согласно их токсичности.
Для этогоприменялись алгоритм случайных лесов и метод случайного выбора kближайших соседей. Была поставлена задача отнесения любогопроанализированного с помощью мультисенсорной системы образца кодному из двух классов: с ЭК50 ≤ 100 – токсичные образцы и ЭК50> 100 –нетоксичные образцы.Метод случайных лесов применяется в хемометрике для решенияклассификационных и регрессионных задач. Ряд, так называемых, деревьеврешений строится на основе полученных экспериментальных данных, исходяиз того, что есть N тестовых образцов и M независимых переменных.Пример дерева решений представлен на рисунке 6.
Для того чтобыпостроить одно дерево, случайно выбирается n≤ N (n=N-1) тестовыхобразцов, необходимых для формирования обучающей выборки этого дерева.В нашем примере это n сенсоров, использующихся для оценки токсичностиводных образцов. Для построения корневого узла дерева, случайным образомвыбирается m ≤ M переменных, лучшее разделение данных основывается назначении одной из m переменных, в примере выбранной переменнойявляется значение потенциала каждого из сенсоров (S1, S2…Sn) в образце.Рассмотрим значения потенциалов сенсоров S1 и S2 в образце, токсичностькоторого неизвестна.13Рисунок 6. Пример дерева решенийЕсли значение S1 не превышает 10 мВ, то можно сделать вывод о том,что образец относится к классу нетоксичных, если нет, то следуетпереместиться вниз по дереву и оценить превышает ли потенциал второгосенсора (S2) значение 30 мВ.
В зависимости от этого водный образецпринадлежит либо к классу малотоксичных образцов, либо, если S2>30 мВ,то образец токсичен.В этой работе в качестве n тестовых образцов используются образцыповерхностных и сточных вод, а также водные растворы индивидуальныхтоксикантов, а в качестве единственного параметра m – значениетоксичности водного образца.Метод случайного выбора k-ближайших соседей является расширеннойверсией алгоритмаk-ближайших соседей. В этом алгоритме тестовый набориспользуетсядляосуществленияпрогнозирования:дляэтогорассматривается расстояние d между точками, соответствующими образцам,например, Евклидово расстояние между векторами переменных.Для классификации образца рассматриваются k ближайших (взависимости от выбранного d) образца («соседа»), которые присутствуют втестовом наборе.
Если решается вопрос, связанный с классификациейобразца, то учитывается класс, к которому принадлежат большинство изсоседних точек, если задача регрессионная, то зависимая величинаусредняется.На рисунке 7 представлен пример классификации с помощью методаслучайного выбора k-ближайших соседей. В этом случае необходимоопределить класс образца, отмеченного треугольником, зная классыближайших пяти соседей. На рисунке видно, что большинство (три из пяти)ближайших соседей относятся к классу, отмеченному кругом, таким образомможно сделать вывод, что класс неизвестного образца соответствует классубольшинства соседей.14Рисунок7.Примерклассификацииспомощьюметодаслучайного выбора kближайших соседейВ этой работе в качестве тестового набора используются образыповерхностных и сточных вод, а также водные растворы индивидуальныхтоксикантов, для осуществления классификации рассматривается одинближайший сосед (k=1).Метод случайных лесов оказался более эффективным дляклассификации водных растворов индивидуальных токсикантовнавыбранные классы, чем метод случайного выбора k-ближайших соседей, вкачестве критерия эффективности в этом случае использовался процентверно классифицированных образцов.
Для метода случайного выбора kближайших соседей процент верно классифицированных образцов непревышал 80%.Для метода случайных лесов в таблице 2 представлена матрицаошибок, вычисленная в процессе полной перекрестной проверки ииспользующаяся для оценки точности классификации водных образцовиндивидуальных токсикантов по их токсичности.
Для методов со случайнымвыбором параметров (таких как метод случайных лесов) принято проводитьмногократную проверку результатов с последующим усреднением, поэтомубыло построено 1000 матриц ошибок с разными случайно выбраннымитестовыми образцами, которые в последующем были усреднены.В матрице ошибок, отмеченной в таблице серым цветом, в столбцахзаписываются классы, спрогнозированные с помощью математическихметодов, т.е. метода случайных лесов, а в строках – классы, использующиесядля проверки, т.е. классы, установленные референтным методомбиотестирования. Главная диагональ матрицы (13,7 и 8,3) показываетусредненное число случаев, когда реальные и прогнозируемые классысовпадают – верная классификация.15Таблица 2. Усредненная матрица ошибок для метода случайных лесов дляводных растворов индивидуальных токсикантовПрогнозируемыезначения “≤ 100”Прогнозируемыезначения “> 100”Общеечислообразцов13,70,3141,78,31015,48,624Реальные значения“≤ 100”Реальные значения“> 100”Усредненное числопопаданий в классОтношение суммы элементов главной диагонали к общему числуобразцов называется усредненным процентом верно классифицированныхобразцов, для метода случайных лесов эта величина составила 91,7%.
Эта жевеличина для метода случайных лесов для класса “≤ 100” – 88,9%, для класса“> 100” – 96,5%.2.2. Классификация реальных водных образцов по токсичностиДляизучениявозможностираспознаваниятоксичных/нетоксичныхреальных образцов для начала применялся наборданных, полученный при анализе образцов природных вод, отобранных вСанкт-Петербурге. Для обработки данных применялся метод главныхкомпонент (МГК), который позволяет, выявить наличие скрытой внутреннейструктуры данных, установить наличие групп образцов схожих/различныхмежду собой.На рисунке 8 приведен график счетов метода главных компонент,представляющий собой «карту образцов» для 36 образцов сточных вод,токсичность которых определялась с помощью Paramecium caudatum.806040ГК2 (8%)200-20-40-60-1000100200300400ГК1 (85%)Рисунок 8.График счетов для образцов сточных вод, токсичность которыхопределялась с помощью Paramecium caudatum.