Диссертация (1145490), страница 11
Текст из файла (страница 11)
Также методыраспознавания образов в химическом анализе делят на линейные и нелинейные.Линейные методы, основаны на том, что вклад измеряемых величин в результатаддитивен. Хемометрические методы, наиболее часто используемые для решениязадач аналитической химии, их преимущества и недостатки , перечислены в Табл.I.2.Для решения задач многомерного анализа в данной работе былииспользованы следующие хемометрические методы анализа: Метод ГлавныхКомпонент (МГК), Метод Множественной Регрессии (ММР), Проекция наЛатентные Структуры (ПЛС), Регрессия на Главные Компоненты (РГК), а такжеклассификационные разновидности МГК и ПЛС - Формальное НезависимоеМоделирование Аналогий Классов (SIMCA) и Дискриминационный Анализ спомощью Регрессии на Латентные Структуры (ПЛС-ДА) соответственно.
Вследующем разделе приводится краткое описание вышеупомянутых методов, вто время как примеры применения этих хемометрических методов всовокупности с мультисенсорными системами на основе новых чувствительныхматериалов, разработанных в данной работе, обсуждаются в Главе VIII.46Табл. I.2 Хемометрические методы, используемые в аналитической химииМетодСокр.названиеКонтролируемыйЛинейныйПреимущества инедостаткиМетод ГлавныхКомпонент (PrincipalComponent Analysis)МГКнетдаПрост винтерпретации vsчувствителен кдрейфу данныхнетдададададададададанетнетФормальноеНезависимоеМоделированиеАналогий Классов(Soft IndependentModeling of ClassAnalogy)ДискриминационныйАнализ с помощьюРегрессии наЛатентные Структуры(PLS discriminantanalysis)Метод множественнойрегрессии (MultipleLinear Regression)(PСA)-(SIMCA)ПЛС-ДА(PLS-DA)ММР(MLR)Проекция наЛатентные Структуры(Projection on LatentStructures)ПЛСРегрессия на ГлавныеКомпоненты (PrincipalComponent Regression)РГКИскусственнаяНей ронная Сеть(Artificial NeuralNetwork)PLS(PCR)ИНС(ANN)Прост винтерпретации vsчувствителен кдрейфу данныхПрост винтерпретации vsчувствителен кдрейфу данныхСтатистическоепредставлениерезультатовvs чувствителен кдрейфу данныхСтатистическое представлениерезультатовvs чувствителен кдрейфу данныхСтатистическоепредставлениерезультатовvs чувствителен кдрейфу данныхЭффективноепредставление nразмерных данных vsограниченное числопередаточныхфункцийI.4.2.1 Метод Главных КомпонентМетодГлавныхКомпонентпредставляетсобойлинейныйнепараметрический метод “сжатия данных” и позволяет представлять ивизуализировать исходные данные путем уменьшения числа переменных безсущественных потерь информации, а также и выявлять структуру связей между47переменными [ 134 ].
Основу МГК составляет комбинирование синхронноизменяющихся (коррелированных) переменных в одну новую переменную инахождение новых координатных осей. Применительно к двумерному случаю,это означает поворот координатных осей таким образом, чтобы регрессионнаялиния совпала с одной из осей. В многомерном пространстве, новыекоординатные оси представляют собой линейные комбинации исходныхкоординатных осей, и между собой и они коррелированы и ортогональны.
Перваяось, называется первой "Главной компонентой”, ГК1, и выбирается в направлениинаибольшей дисперсии исходных данных. Вторая ГК определяется внаправлении, ортогональном к ГК1 с наибольшей дисперсией, и т.д. Этапроцедура проводится итеративно, таким образом, что ГК1 содержит наибольшееколичество исходной информации, ГК2 содержит наибольшее количествооставшейся информации, и так далее. Размерность нового пространствапеременных будет равна количеству рассчитанных главных компонент, при этомвсе ГК ортогональны и каждая предыдущая компонента содержит большееколичество информации, чем последующая.Математически метод МГК сводится к декомпозиция исходной двухмернойматрицы измерений X, и ее представление в виде произведения двух новыхматриц, T и P [135 ], уравнение : = + = ∑=1 + (I.20)где X – таблица из чисел, состоящая из I строк и J столбцов.
Каждая строка в такойтаблице представляет новый анализируемый образец, а каждый столбец –переменную величину (отклик химического сенсора Jn в образце In). Новыематрицы Т и Р, полученные в результате МГК преобразования, это матрицысчетов (scores) и нагрузок (loadings) соответственно; а E представляет из себяматрицу остатков, то есть неучтенную дисперсию как разницу между значениямиданных в новом поостранстве координат и матрицей Х. Число столбцов – ta вматрице T и pa в матрице P, равно величине A - числу главных компонент исоответствует рангу матрицы Х. Число главных компонент при эффективном МГКвсегда меньше чем число столбцов (количество сенсоров) в матрице X.
При этомвеличины счетов можно рассматривать как новые координаты (векторыкоординат в n-мерном пространстве) каждого измерения ( образца, или строкиматрицы X). Нагрузки представляют собой значения косинусов углов между ГКи исходными переменными, и таким образом отображают вклад сенсоров в ГК.Нагрузки могут варьироваться в диапазоне [-1; +1]; высокая нагрузка означает,что отклик данного сенсора сильно скореллирован с направлением ГК. Значенияостатков прямо пропорциональны дисперсии данных в новом пространствекоординат.Суть метода МГК и процедура нахождения новых главных компонент прианализе двух неизвестных образцов, красного и зеленого, с помощью массива,48состоящего из 8-ми химических сенсоров с высокой перекрестнойчувствительностью, представлена на Рис.
I.15.Так, случай, когда несколько последовательных измерений с сенсорами 1 и2 проводятся в двух анализируемых образцах (красном и зеленом) может бытьлегко отображен графически в двухмерном пространстве Декартовой системыкоординат. Поскольку образцы различаются между собой, на графике скоординатными осями, вдоль которых отложены показания сенсоров 1 и 2соответственно, можно наблюдать две группы тесно прилегающих точек (двакластера), соответствующих серии изменений с двумя сенсорами в двух образцах.Образец 1Сенсор 1: x1Сенсор 2: y1Сенсор 2Образец 2Сенсор 1 – x2Сенсор 2 – y2МГКтрансформацияСенсор 1ГК 22 сенсора – 2-х мерное пространствографическое представление вДекартовом пространствеСенсор 2Сенсор 3ГК1Сенсор 4??Сенсор 5Сенсор 6Сенсор 1Сенсор 7Сенсор 88 Сенсоров – 8-ми мерное пространство!КАК ОТОБРАЗИТЬ ОБРАЗЦЫ?Рис.
I.15 Графическая иллюстрация метода главных компонент длядискриминации 2 неизвестных образцов с помощью мультисенсорной системыиз 3-х неселективных сенсоров.Пунктирными линиями отображены направления, в которых дисперсияданных наибольшая. Эти направления и являются собственно главнымикомпонентами (новыми координатными осями) в методе МГК. При этом векторнагрузок первой главной компоненты (ГК1) определяет ее направление.
Втораяглавная компонента ортогональна первой, и ее направление (ГК2) соответствуетнаибольшему изменению в остатках данных, неучтенных в ГК1. Графическоепредставление отклика всех 8-ми сенсоров, полученных в двух анализируемых49растворах, не представляется возможным, поскольку предполагает изображение8-мерного пространства, с координатными осями, вдоль которых отложеныпоказания сенсоров 1-8 соответственно.
Однако, как упоминалось ранее вразделе I.3.1, использование откликов от всех сенсоров массива важно, посколькучасто это единственный путь к получению искомой информации(количественной или качественной, как в данном примере) о составе сложнойанализируемой среды. В этом случае метод МГК позволяет достичь эффективногоснижения размерности пространства исходных данных и отобразитьанализируемые образцы в новой, двухмерной системе координат (с ГК1 и ГК2значениями, отложенными по осям), а также регистрировать различия/сходствамежду образцами.I.4.2.2 Методы регрессииРегрессионные методы используются для описания и интерпретациивзаимосвязи между несколькими независимыми Х- переменными и зависимой Yпеременной (переменными) , и для прогнозирования Y- значения новых образцовиз значений Х- переменных.
В простейшем случае одномерная линейнаярегрессия между переменной х и зависимой y описывается уравнением:(I.21) = + Данное уравнение в применении к химическому анализу с использованиемотдельного сенсора будет называться градуировочной зависимостью, где y этоотклик сенсора, x – концентрация аналита, s – угловой коэффициентградуировочной зависимости, b – показания сенсора при нулевой значении х(значение стандартного потенциала для ИСЭ в частности).Процесс градуировки усложняется при переходе от измерений с одиночнымсенсором к применению массива сенсоров, а также при анализе сложныхмногокомпонентных сред в сравнении с определением одного определенногоаналита.