Диссертация (1150291), страница 13
Текст из файла (страница 13)
(X и Y употребляют в общем смысле, а х и y – для одномерной регрессии).Применительно к химическому анализу под y обычно понимают концентрациюинтересующего соединения, а под х – величину аналитического сигнала.Построение калибровки позволяет найти вид зависимости y от х, т.е.концентрации от аналитического сигнала. В случае традиционной одномернойкалибровки, например, в потенциометрии, эта задача обычно сводится к88нахождению углового коэффициента k и свободного члена b по методунаименьших квадратов.В случаях, когда имеются взаимные влияния компонентов в образце,наложение, перекрывание пиков и т.п., аналитический сигнал может стать менееинформативным, а использование одномерной калибровочной зависимостибудет приводить к неточным определениям интересующей концентрации вобразцах неизвестного состава.
В такой ситуации для того, чтобы повыситьточность аналитического определения, можно использовать не одиночныйаналитический сигнал x, а набор соответствующих аналитических сигналов х1,х2, …, хi. Например, в случае мультисенсорных систем – значение отклика неодного сенсора, а всего массива.2.10.3.1. Проекция на латентные структуры (ПЛС1 и ПЛС2)Дляпостроениякалибровочнойзависимостивслучаемножествапеременных х используют метод ПЛС-регрессии, широко применяемый дляцелей многомерной калибровки и последующего определения концентрацийразличных компонентов в сложных образцах [163].ПЛС-регрессия является обобщением обычной одномерной линейнойрегрессии на случай множества независимых переменных х.ПЛС регрессию обычно представляют в виде матричных уравнений:Y = XB + F ,(4)где X(I×J1) и Y(I×J2) – матрицы данных, в которых – I (число строк) – числообразцов, а J (число столбцов) – число измеренных параметров системы.Каждая строка этой матрицы – набор переменных (например, откликовсенсоров), характеризующий один образец, а каждый столбец – набор значенийпеременной (например, показаний одного сенсора) во всех образцах.
Есликалибровка (ПЛС регрессия) строится по определенному параметру, то иполученная регрессионная модель будет предназначена для определения этогопараметра в новых образцах, для которых эта величина неизвестна. Результатыпостроения калибровочной модели представляются обычно в виде прямых для89калибровки и проверки в координатах «введено-найдено». Основнымипараметрами калибровочной PLS1-модели являются наклон, оффсет, квадраткоэффициентакорреляциииостаточнаясреднеквадратичнаяошибкакалибровки и предсказания.Наклон (slope) и квадрат коэффициента корреляции (R2) описываютнасколько хорошо точки в калибровке и проверке ложатся на прямую. Чемближе эти величины к единице, тем адекватнее данные описываются моделью.Параметр «оффсет» (offset) описывает смещение прямой относительно началакоординат и должен быть максимально близок к нулю.
Среднеквадратическоеотклонение(RMSE,residualrootmeansquareerror)характеризуетпредсказательную силу модели. Она имеет размерность величины Y, по которойпроводилась калибровка и для хорошей модели должна быть минимальна.Если матрица Y имеет одну переменную, используют частный вариант –ПЛС1 (PLS1). Если Y многопараметрична, используют алгоритм ПЛС2 (PLS2).2.10.3.2. Такер1-ПЛС регрессия (3wayPLS)В последние годы для математической обработки результатов химическогоанализа стали использоваться мультилинейные методы [165]. Калибровочныемодели более просты, устойчивы к наличию шума и к переобучению.
Этообъясняется меньшим числом оцениваемых параметров калибровочной моделипри использовании неразвернутых данных и мультилинейных методовобработки.В настоящей работе применен мультилинейный ПЛС, а именно Такер1ПЛС регрессия (3wayPLS). Применение такого алгоритма подразумеваетналичие не матричной, а трехмерной тензорной структуры данных. В качестветретьего измерения в данных используют развертку потенциалов сенсоров приизмерении образцов во времени. Полученный тензор имел размерностьсенсоры×образцы×время (20×10×19). Поскольку различные вещества в образцахимеют различную кинетику взаимодействия с материалом сенсорных мембран,то использование данных о форме кривой выхода потенциала сенсора на90стабильные значения позволяет получать и использовать дополнительнуюинформацию.
Аналогично билинейному ПЛС, цель алгоритма трилинейногоПЛС – разложить исходную трехмерную матрицу данных X на «триады»,являющиеся аналогом билинейных факторов в обычном ПЛС. Получениедвумерных и трехмерных данных схематично представлено на рис. 40.сенсорыОтклик сенсора, мВобразцыEijОтклик сенсора, мВВремя, сi - сенсорj - образецВремя, свремяобразцысенсорыобразцыEijkсенсорыРис. 40. Получение двумерных и трехмерных данных.i - сенсорыj - образцыk - время91Более подробное описание алгоритма мультилинейного ПЛС изложено в[165].2.10.4.
Матричный корреляционный анализ2.10.4.1. Вычисление коэффициентов матричных корреляцийМатричные корреляции имеют длительную историю в многомерноманализе, начиная с 1974 г. Обширный обзор методов был дан уже в 1984 г. [166].Коэффициенты матричных корреляций могут быть интерпретированы каккоэффициенты корреляции Пирсона для одномерного анализа, расширенные наматрицы.Идея матричной корреляции – найти сходство матриц, т.е. выявить общиезакономерности в структурах данных. Допустим: мы имеем 2 матрицы данныхX(I×J1) и Y(I×J2), в которых – I (число строк) – число образцов, а J (числостолбцов) – число измеренных параметров системы.Обычно используют матричный RV-коэффициент, значения которогонаходятся в пределах [0,1], вычисляемый по формуле:где tr – сумма диагональных элементов матрицы.Однако, как отмечается в [167], при большом числе измеренных параметровсистемыкоэффициентRVобычнодовольновысок,т.е.корреляцииобнаруживаются там, где их в действительности может и не быть.
Для решенияэтой проблемы предлагается [167] использовать модифицированный RV’коэффициент, который может принимать и отрицательные значения [-1,1]:где92Считается, что модифицированный RV-коэффициент дает более надежнуюинформацию о величине корреляции между двумя матрицами переменных дляодного набора образцов [167-168].Еще один пример матричного коэффициента корреляции – коэффициентконгруэнтности Такера, изменяемый в пределах [-1,1], который вычисляется поформуле[168]:где Т1 и Т2 – матрицы счетов, полученные при МГК-анализе,Т1’ и Т2’ – соответствующие транспонированные матрицы.Поскольку коэффициент конгруэнтности Такера рассчитывается для матрицсчетов при разложении на главные компоненты, утверждают, что он глубжеописывает схожесть наборов данных, чем RV и RV’-коэффициенты.Получение матрицы счетов происходит следующим образом: выберемобразец i и опустим проекцию на первую главную компоненту (рис.
41).Полученная величина — это расстояние до начала системы ГК-координат(отрицательное или положительное).Рис. 41. Счета в ГК-координатах.Эта координата называется счетом образца i, который обозначается как ti1.Проекция объекта i на вторую главную компоненту даст счет ti2, на третью – ti3 ит.д. Количество счетов, т.е. количество координат каждого объекта в этом93подпространстве, будет равно количеству главных компонент. Собрав все счетадля всех образцов, получаем матрицу счетов Т.В силу снижения размерности пространства при МГК-анализе числоглавных компонент будет на единицу меньше числа столбцов исследуемойматрицы.Так, в нашем случае приходится ограничиваться 3 ГК (две матрицы имеютлишь по 4 измеренных параметра). И при этом нельзя утверждать, чтосокращение до 3 ГК для остальных матриц не внесет существенныхпогрешностей.2.10.4.2.
Канонический корреляционный анализДля нахождения взаимосвязи между наборами переменных используетсяканонический корреляционный анализ. Это - метод выявления каноническойкорреляции, основанный на построении таких линейных комбинаций признаков(в двух заданных группах признаков); коэффициент парной корреляции междуэтими комбинациями достигает максимального значения.Таким образом, каноническая корреляция - обобщение парной корреляции;используется для определения взаимосвязи между двумя группами признаков.Пусть имеются 2 матрицы данных X(I×J1) и Y(I×J2), в которых – I (числострок) – число образцов, а J (число столбцов) – число измеренных параметровсистемы. Матрицы изначально рассматриваются как независимые.На первом этапе находим два векторакоторые максимизируют корреляцию между линейными комбинациями:Таким образом, U1 и V1 – первые канонические переменные, а ρ1 – перваяканоническая корреляция.
Затем находятся следующие переменные.При этом .ssВ итоге строится вектор для каждого значения λ = (λ1, λ2)94Получаемыерешения называются каноническими корнями, каждое изкоторых объясняет разницу между двумя наборами переменных. Алгоритмнаходит новые собственные значения по шагам, на каждом из которыхмаксимизируется корреляция между каноническими переменными.
Первыенесколько пар канонических переменных объясняют наибольшую долюразличиямеждудвумямножествамипеременных.Согласногрубомуэмпирическому правилу канонические корреляции, меньшие 0.3, вряд лиокажутся значимыми, но обычно стоит рассматривать и корреляции, близкие кэтому порогу, чтобы выяснить, не поддаются ли они содержательнойинтерпретации.Таким образом, в каждом множестве признаков отыскиваются линейныекомбинации величин, имеющих максимальную корреляцию.
Эти линейныекомбинации и являются первыми координатами новых систем.В каждом множестве рассматриваются следующие линейные комбинации,корреляция между которыми больше, чем корреляция между любыми другимилинейнымикомбинациями,некоррелированнымиспервыми.Итакпродолжается до тех пор, пока не будут построены две новые координатныесистемы, оси которых определяются как CV1 и CV2, вычисляются по формуле:Такие координатные системы называют также картами образцов (рис.
42).95111111612142000161-11402016 120109CV1-1CV2CV215-1615191088CV1-1Рис. 42. Пример карт образцов для индийского черного чая. Каноническиекорни: 0,9999; 0,9291Наличие общей схожести картин по расположению образцов относительнодруг друга свидетельствует о высокой канонической корреляции исследуемыхматриц, что подтверждается и значениями соответствующих коэффициентов.Многомерная модель канонических корреляций представляет собоймощный инструмент исследования и обобщения сложных взаимосвязей междудвумя множествами переменных. Данной моделью редко пользуются восновном из-за трудностей вычислений, однако сейчас, когда для проведенияэтих вычислений составлены эффективные алгоритмы, нет каких-либо особыхоснований пренебрегать этим методом, поскольку он является одним из самыхнаглядных и удобных для восприятия.96ГЛАВА 3.
ХРОМАТОГРАФИЧЕСКИЙ И ЭЛЕКТРОФОРЕТИЧЕСКИЙАНАЛИЗ СЛОЖНЫХ ОБЪЕКТОВ ПРИРОДНОГО ПРОИСХОЖДЕНИЯ3.1. Определение полифенолов и кофеина в образцах чаяСпециальный блок экспериментальных исследований был посвященэлектрофоретическому определению компонентов, входящих в состав зеленогои черного чая. В этом отношении оказался полезным уже имевшийся опыт внашей исследовательской группе [122-123].Мыобратилиськметодумицеллярнойэлектрокинетическойхроматографии (МЭКХ), где наряду с электрофоретическим, реализуется ихроматографический механизм разделения за счет распределения аналитовмежду буферным электролитом и мицеллами, представляющими собойпсевдостационарную фазу.Таким образом, разделение компонентов модельных смеси и анализреальных объектов проводился методом МЭКХ.
В качестве примера приведенаэлектрофореграмма для образца чая «Моnarch» (рис. 43):ГКЭКГ3ЭКЭГКЭГКГКоф75 mA UCapel1234567891011121314минРис. 43. Электрофореграмма образца чая «Монарх».Условия: Система капиллярного электрофореза «КАПЕЛЬ 105»; кварцевый капилляр:внутренний диаметр 75 мкм, Lэфф=60 см, Lобщ=50 см. Буферный электролит: 25 мМфосфатный буфер рН=7.0 с добавкой 25 мМ ДДСН. Проба: образец «Монарх». 200 мг чая на20 мл кипятка, 5 минут.