Диссертация (1145490), страница 13
Текст из файла (страница 13)
Напротив, использование одного итого же набора сенсоров в рамках модели ПЛС2 моделирования часто приводит кснижению прогнозирующей способности модели, поскольку некоторые сенсорывходящие в состав мультисенсорной системы, но неинформативные для данногоопределяемого компонента будут дестабилизировать модель.I.4.2.3 Методы классификацииКлассификацию, т. е.
нахождения сходств и различий между исследуемымиобъектами и отнесение их к определенным классам (группам, кластерам, и т.д.)можно осуществлять различным хемометрическими методами, наиболеераспространёнными (и использованными в этой работе) являются методы SIMCAи ПЛС-ДА. Метод МГК представляет собой разновидность исследовательского(эксплораторного) непараметрического (unsupervised) анализа, и, несмотря наактивное использование во многих работах, не является методом классификации,а дает лишь представление о структуре и дисперсии данных, а также позволяетполучить их графическое представление в пространстве уменьшеннойразмерности (см.
Раздел I.4.2.1).Метод SIMCA (формальное независимое моделирование классовых аналогий,в англоязычной литературе - soft independent modelling of class analogy), опираясьна аппарат МГК, использует в то же время дополнительные параметры, такие какрасстояние между классами и расстояние между новым объектом и центромкаждого класса (расстояние Махаланобиса) [140]. При классификации методомSIMCA сначала каждый класс из обучающего набора независимо моделируетсяметодом МГК, а затем, после расчёта расстояния между центрами классов, новыеобразцы классифицируются в зависимости от их близости к каждому классу.Использование метода SIMCA для дискриминации алкогольных напитков,произведенных из различных растительных источников (винограда и ячменя)проиллюстрировано в форме графика Кумана на Рис.
I.17.Были построены модели для двух классов напитков, вина и пива,неизвестными образцами служили крепкие алкогольные напитки граппа(дистиллят виноградного вина) и виски (напиток на базе ячменя). На графикепоказаны расстояния от неизвестных образцов до двух классов. Вертикальная игоризонтальная линии определяют доверительный интервал в 10%, находясьвнутри которого новые образцы могут быть отнесены к одному из классов. Видно,что все образцы граппы находятся далеко от классов вина и пива, в то время какобразцы виски более близки к классу пиво, но тем не менее могут быть легкодискриминированы.55Рис. I.17 SIMCA классификация (график Кумана) алкогольных алкогольныхнапитков из различных растительных источников: виноградного вина и граппы,ячменного пива и виски с применением потенциометрической мультисенсорнойсистемы.
Печатается из работы [141].Метод ПЛС-ДА является дискриминантным параметрическим методом собучением (supervised), поскольку в нем дается исходная информация опринадлежности образцов к различным классам. Наиболее распространенным вПЛС-ДА анализе является случай бинарной дискриминантной переменной: сответом Да/Нет о принадлежности к данному классу, К. В этом случаедискриминантная переменная (Y-переменная) кодируется в регрессионной ПЛСмодели как простое число, 0 или 1 (Да = 1, Нет = 0). С помощью разновидностиПЛС2 дискриминантный анализ может быть распространен на случай, когдаклассов больше, чем два. Каждый класс будет представлен посредством двоичнойпеременной-индикатора со значением 1 для членов этого класса, 0 для не членов.При построении модели ПЛС2 со всеми индикаторными переменными,входящими в матрицу зависимых переменных Y, можно непосредственнопрогнозировать членство класса из X-переменных, описывающих образцы.Дискриминационные правила для K классов задаются линейнымирегрессионными уравнениями вида XB=D, где X –матрица исходных данныхразмерности (I*J), B –матрица неизвестных коэффициентов регрессии (I*К), а D=Yи представляет собой дискриминантную матрицу размера (I*К), состоящую изнулей и и единиц.
Результат ПЛС-ДА интерпретируется путем сравненияспрогнозированных значений Y-переменной для каждого класса; для Yпрогн> 0,5образец расценивается как член класса; когда Yпрогн <0,5 – образец непринадлежит к данному классу. После валидации, для осуществления которой56могут быть использованы различные методы: проверка с тестовым набором(ПТН), ППП или СР, полученная регрессионная модель может быть примененазатем для классификации новых образцов. Для этого результат прогнозированияпринадлежности к данному классу К, рассчитанный посредством моделисравнивается с нулем или единицей [136]. Результаты дискриминантного ПЛС-ДАанализа часто представляются в форме так-называемой матрицы ошибок(confusion matrix в англоязычной литературе), в которой отображается числообразцов отнесенных к каждому классу, а также количество неклассифицированных образцов.
Например, в Табл. I.3 приведен результат ПЛСДА классификации 16 образцов сыра моцарелла, произведенных из коровьего ибуйволиного молока с применением массива потенциометрических сенсоров. Всоответствии с имеющимися референтными данными о принадлежностиобразцов сыра к классу сыра, произведенного из коровьего или буйволиногомолока были успешно классифицированы 14 сыров, в то время, как 2 образцамоцареллы (произведенной из коровьего молока в соответствии с информациейпроизводителя)идентифицироватьнеудалось.Такимобразом,дискриминационная способность построенной ПЛС-ДА модели в последнемпримере составила около 88% (14 из 16 образцов успешно классифицированы).Табл.
I.3 Результаты ПЛС-ДА классификации образцов сыра моцарелла,произведенных из коровьего и буйволиного молока. Печатается из работы [115].Референтные данныеКоровьемолокоНеклассифицированыБуйволиноемолокоКоровье молоко82-Буйволиное молоко--6НайденоДля обработки многомерных данных, полученных от мультиcенсорныхсистем, используются специальное программное обеспечение, такое как MATLAB,R, Unscreambler, и т.д. Посредством применения специальных библиотек,содержащих стандартные алгоритмы обработки данных (как, в частностиUnscreambler)этипрограммыпозволяютпроводитьэффективныйхемометрический анализ. Более того, языки программирования, используемые вMATLAB и R, дают возможность вносить различные модификации, либо создаватьсовершенно новые, авторские алгоритмы расчётов и предварительной обработкиданных.57I.5Постановка задачи и методы ее решения.На основании проведенного анализа литературных данных можнозаключить следующее: в настоящее время существует большое количествохимических сенсоров, применение которых позволяет решать многие задачианалитической химии и проводить определение широкого спектра соединений.Разработаны теории функционирования и селективности, позволяющиесоздавать высокочувствительные сенсоры, основанные на различных методахпередачи сигнала: электрохимические, оптические, пьезоэлектрические и другие.Данные сенсоры эффективны при анализе сложных сред и позволяют проводитьколичественное определение интересующего аналита в присутствии большогочисла других компонентов.
Достоинством анализа с применением химическихсенсоров является его экспрессность, отсутствие необходимости пробоотбора ипробоподготовки. Однако, как показывает анализ современных исследований,число работ, посвященных разностороннему систематическому изучениюопределенных классов мембраноактивных веществ с целью создания новыхсенсорных материалов «под задачу», невелико.
По-прежнему в большинствеслучаев соединения, полученные в результате направленного синтеза, но необладающие ожидаемыми свойствами, отбрасываются как непригодные,возможность использования таких материалов в мультисенсорном анализе нерассматривается, хемометрической обработки их отклика не производится,редко исследуется влияние природы мембранного материала и методов передачисигнала на чувствительность и срок действия сенсорного материала. Очевиднанеобходимость в решении комплекса перечисленных проблем и развитии новыхметодических подходов к поиску чувствительных материалов для разработкиновых химических сенсоров.Исходя из вышеперечисленных соображений, задачи данного исследованиясостояли в следующем:1) Обоснование выбора мембраноактивных веществ на основе порфиринов игетерокраун-эфиров с требуемыми электрохимическими и оптическимисвойствами.