Диссертация (1145490), страница 12
Текст из файла (страница 12)
В последнем случае на конечный результат оказывает влияние сразунесколько параметров, которые необходимо учитывать с применением методовмногомерных калибровок [132]. Необходимо оговориться, что здесь и далеетермин «калибровка» в применении к хемометрическому анализу используетсякак синоним термина «градуировка», который в свою очередь являетсяобщеупотребительным в российской литературе по аналитической химии.Процесс калибровки называется многомерным, когда зависимая переменная(концентрация определяемого компонента) является функцией несколькихнезависимых переменных (отклики сенсоров). Многомерная калибровкапроводится по серии калибровочных растворов, которые представляют собойнабор многокомпонентных растворов с изменяющейся в заданном диапазонеконцентрацией всех компонентов.
Калибровочные растворы могут содержатьразличное число ионных и нейтральных, органических и неорганических50компонентов в зависимости от поставленной задачи. В калибровочной процедуредля представления полученной матрицы данных Х используется математическаямодель, калибровочный процесс по сути заключается в определении параметровэтой модели. После определения параметров модели система может бытьиспользована для анализа проб неизвестного состава.Подбор наиболее подходящей регрессионной модели часто определяетуспешный исход многомерно калибровки и мультисенсорного анализа в целом.
Внекоторых простых случаях этот выбор может быть сделан на физикохимической основе. Например, для массивов потенциометрических химическихэлектродов может быть использовано уравнение Никольского, процесскалибровки тогда будет заключаться в определении параметров уравнения(стандартных потенциалов и коэффициентов селективности). Однако во многихситуациях теоретическое описание калибровочной модели недоступно. В этомслучае прибегают к эмпирическим моделям, которые должны не толькопредставлять калибровочные данные как можно точнее, но и давать правильныерезультаты для тестовых проб, неиспользовавшихся в процессе калибровки.Метод множественной регрессииММР является линейным и параметрическим методом, основанным наметоде наименьших квадратов [136 ].
При этом предполагается, что сам сложныйсигнал Ri является линейной комбинацией индивидуальных компонентов(предикторов) и может быть представлен в соответствии с уравнением (I.22): = 1 ∙ 1 + 2 ∙ 2 + ⋯ + ∙ + (I.22)где ji – коэффициент i – го компонента, вносящего вклад в Ri; pj – сигнал,полученный для чистого j-го компонента; i – значение остатка.
Остаток дляданного образца и заданной переменной вычисляется как разность междунаблюдаемым значением и значением рассчитанным (прогнозируемым) наоснове полученной модели. Для n компонентов уравнение (I.22) можно обобщитьи записать в матричной форме: =∙+(I.23)В данной матрице P и R известны, в то время как значения коэффициентов можно оценить, используя критерий наименьших квадратов. Эта операцияподразумевает получение обратной (инвертированной) матрицы, что в своюочередь приводит к проблемам коллинеарности, если переменные не являютсялинейно независимыми. Независимые переменные, используемым в качествепредикторов в методе ММР , должны быть истинно независимы, что не всегдаосуществляется и может приводить к искажению результирующих модельныхпараметров.
Более того, для успешного применения метода ММР числоизучаемых образцов должно превосходить число переменных, в противном51случае матрица не может быть инвертирована. Для преодоления указанныхсложностей используют метод проекций на латентные структуры, ПЛС.Методы Проекции на Латентные Структуры (ПЛС) и Регрессии на ГлавныеКомпоненты (РГК)В общем случае, результаты серии M наблюдений, описываемых посредствомК зависимых переменных, могут быть представлены в виде матрицы Y = M*К; вто время как значения J предсказателей, соответствующих М наблюдениямсобраны соответственно в матрице: Х = M*J.
Цель методов регрессии - предсказатьY из X и описать их общую структуру. В случае, когда Y - вектор и X-матрица имеетполный ранг, эта цель достигается с помощью обычной множественнойрегрессии [ 137 ]. Однако, когда число предикторов велико по сравнению сколичеством наблюдений, матрица Х может быть вырожденной и регрессионныйподход не представляется возможным (например, из-за мультиколинеарности).Несколько подходов были разработаны для решения этой проблемы.
Один изподходов заключается в устранении некоторых предсказателей в целяхизбежания мультиколлинеарности.Метод регрессии на главные компоненты (РГК) сочетает в себехарактеристики метода главных компонент и множественной регрессии. Прииспользовании метода РГК сначала проводится разложение матрицы данных Хметодом МГК анализа, иными словами Х разлагается в соответствии суравнением (I.20). Затем полученная новая матрица счетов T используется какблок независимых предикторов для ММР регрессии с матрицей откликов Y, т.е.Y=T*b, Рис.
I.16А. Таким образом, ортогональность полученных новых главныхкомпонент устраняет проблему мультиколлинеарности. Однако проблемавыбора оптимального подмножества предикторов (числа главных компонент)остается.Использование линейного параметрического методапроекций налатентные структуры, ПЛС, заключается в нахождении набора скрытыхзависимых переменных из большого набора независимых предикторов ипозволяет находить единственное решение в тех случаях, когда системапереопределена[138].
При наличии единичной зависимой переменной в формевектора Y и матрицы исходных данных X, скрытые переменные Тх извлекаютсядля моделирования Х и установления корреляции с Y. В случае, когда зависимыхпеременных несколько и Y имеет форму матрицы, производится одновременнаядекомпозиция матриц X и Y, и определяются латентные вектора X-счетов t и Yсчетов u: = + = + (I.24)Проекции строятся согласованно – так, чтобы максимизироватькорреляцию между X и Y (соответственно между векторами t и u) Рис. I.16Б.52Рис. I.16 Схематическое графическое представление методов (A) регрессии наглавные компоненты, РГК, и (Б) проекции на латентные структуры, ПЛС.Нагрузки переменных матрицы Х рассчитывают как wa=u’aX, где ua=Y, и aотносится к числу измерений.
Тогда скрытую переменную находят как ta=Xw’a иопределяют коэффициент va, который соотносит скрытые переменные матрицX и Y:ua = vata + d,va = t’aua/||ta||2(I.25)Нагрузочный вектор для X, задаваемый величиной pa, определяют как pa = t’a*X идалее нормируют на единицу. Остатки Е и F рассчитывают как:E = X – ta p aF = Y – vata.(I.26)При следующем измерении E и F подставляют вместо X и Y и повторяютвсю процедуру сначала.
Итерация останавливается на значении a = A, когда тестна перекрестную проверку показывает, что значение (а+1) не являетсязначимым [139].Валидация регрессионных моделейЛюбая хемометрическая модель, и регрессионные модели в частности,53нуждаются в валидации – проверке ее адекватности и прогнозирующей силы. Припроведении многомерной калибровки посредством регрессионных методовточность последней принято характеризовать величиной среднеквадратичнойошибки калибровки, СКОК (Root Mean Square Error of Calibration, RMSEC, ванглоязычной литературе), которая вычисляется по формуле (I.26):СКОК = √∑(,известное −,рассчитатанное )2−1(I.26)Величина СКОК, имеет размерность определяемого параметра, и чем она меньше,тем точнее регрессионная модель описывает обучающие данные. Другим важнымпараметром, характеризующим успешность калибровки является коэффициенткорреляции R2 между известными концентрациями компонента y и величинами,рассчитаными при помощи регрессионной модели; чем ближе R2 к единице, темлучше.Среднеквадратичное отклонение прогнозирования, СКОП, используется дляоценки прогнозирующей способности модели при анализе n тестовых образцов,не вошедших в набор калибровочных данных:СКОП = √∑(,предсказанное −,истинное )2(I.27)При этом истинные концентрации доступны из референтных данных(определены посредством стандартных методов анализа, либо тестовые образцыс известными исследователю концентрациями могут быть приготовленызаранее).
Чем меньше СКОП, и ближе к единице R2вал тем лучше даннаярегрессионная модель описывает систему. Величина СКОП сильно зависит отколичества переменных и от количества измерений. Часто случается, чторезультаты исследований ограничены небольшим набором экспериментальныхданных, и дальнейшее разбиение таких данных на калибровочные и тестовые непредставляется возможным. В таких случаях для валидации хемометрическихмоделей используют метод полной перекрестной проверки (ППП) либопроцедуру случайного разбиения (СР). Метод ППП подразумевает использованиеодних и тех же исследуемых образцов для обучения и проверки прогнозирующейсилы модели. В ППП при обучении модели каждый раз опускается один образец,который затем используется как тестовый, и данная процедура повторяются длявсех образцов.
В методе СР случайным образом отбирается небольшая подгруппаобразцов, которые используются как тестовые, и данная процедура повторяетсязаданное число раз. Необходимо отметить, что часто методы ППП и СР приводятк переоценке модели, когда точность описания обучающих данных значительнолучше, чем качество прогнозирования.Существует две основных разновидности ПЛС-регрессии, ПЛС1 и ПЛС2,которые в рамках одной модели позволяют предсказывать соответственно один54или несколько параметров. Анализ современных исследований с применениемхемометрических методов анализа показывает, однако, что построениеотдельных моделей ПЛС1 для прогнозирования каждого нового компонентаявляется предпочтительным, поскольку это позволяет наилучшим образомподобрать состав мультисенсорной системы.