Диссертация (1150291), страница 16
Текст из файла (страница 16)
Последовательность процедур следующая: строится модель поимеющимся достоверным значениям о принадлежности образцов к тому илииному классу, затем с помощью независимого тестового набора образцовпроверяется вероятность отнесения конкретного образца к классу больных илиздоровых. При этом необходимо правильно установить границу решений –значение вероятности р(Х), при котором ошибка в определении класса будетминимальной.Графики зависимости суммы ошибок от выбранной границы решенийпредставлены на рис. 62.118сумма ошибок, %100,080,060,0аб40,020,00,000,20,40,60,81граница решенийРис. 62.
Зависимость суммы ошибок от выбранной границы решенийсогласно референтным данным (а) и данным от мультисенсорной системы (б)Граница решений (минимум на кривой) для референтных данных составила0.2, для данных от мультисенсорной системы – 0.04.При выбранных границах вычислены ошибки определения класса 35независимо выбранных образцов («норма» или «патология»). Показано, чтологистическая модель, построенная на основании референтных данных, не выдалани одной ошибки.
Модель для данных от мультисенсорной системы показалаошибку в 5%.Важно отметить, что для решения классификационных задач в подобныхисследованияхнеобходимоучитыватьдиурез–объемсуточноймочи,выражаемый в л/сут. Именно на основании количества аналита, выделяемого всутки (ммоль/сут) делают вывод о том, попадает ли данный параметр в норму.Для количественных задач, соответственно, нет необходимости в учете диуреза.Концентрации выражают в моль/л.119ГЛАВА 6.
ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯОБЪЕКТОВ СО СЛОЖНОЙ МАТРИЦЕЙРегрессионный анализ заключается в поиске корреляций между результатамианализа изучаемых объектов мультисенсорной системой и количественнымиреферентными данными.Обработка данных проводилась методом проекция на латентные структуры(ПЛС).ПЛС-модельпредставляетсобойзависимостьвкоординатах«введено/найдено» или «измеренная/прогнозируемая величина». Параметры,характеризующие эту зависимость, определяют наличие корреляции междуоткликом массива сенсоров и каким-либо количественным критерием, в качествекоторого могут выступать концентрации веществ, оценки дегустаторов и т.д.Таким образом, метод позволяет откалибровать систему по интересующемусвойству.Построены ПЛС-модели с полифенолами и кофеином, количество которыхнезависимо определено методом капиллярного электрофореза. На рис.
63 вкачестве примера представлена ПЛС-модель для эпикатехина, ее параметрыПрогнозируемая величина (%, масс.)указаны в табл. 20.Измеренная величина (%, масс.)Рис. 63. ПЛС-модельмультисенсорной системыдляопределенияэпикатехинаспомощью120Таблица 20. Параметры ПЛС-модели для эпикатехинаПроцедураКалибровкаПроверкаНаклон0.990.94Оффсет0.0010.028СКО0.0030.023R20.990.90Наклон характеризует правильность модели (чем ближе значение к единице,тем модель лучше); оффсет – величина, отсекаемая графиком по оси ординат (чемближе к нулю значение офсета, тем исследуемая модель правильней); СКО(среднеквадратическое отклонение) – величина абсолютной ошибки, выражаетсяв тех же единицах, что и референтные данные; R2 – квадрат коэффициентакорреляции.Относительная ошибка вычисляется по формуле:δ = СКОпр./хср.*100%,(9)где СКОпр – СКО при проверке, хср.
– среднее значение определяемойвеличины референтным методом.Установлено, что разработанная мультисенсорная система позволяет сошибкой не более 8-10% определять содержание эпикатехина и кофеина вобразцах черного чая.Чтобы предварительно оценить, с какими параметрами имеет смысл искатькорреляции, использовался предварительный алгоритм ПЛС2-регрессии.
Лучшиерезультаты получены для матриц В (содержанием компонентов чая) и Е (данныеот потенциометрической мультисенсорной системы).Из рис. 64 следует, что возможна корреляция между откликами сенсоров исодержанием теафлавина и теарубигина в образцах чая, а также яркостьюаромата.Значимыхкорреляцийсцветомнеобнаружено.подтверждается и значениями величин наклона и R2 в табл.
21.Последнее121СенсорыСодержаниетеафлавинаСодержаниетеарубигинаЯркостьароматаЦвет1,0ГК20,50,0-0,5-1,0-1,0-0,50,00,51,0ГК1Рис. 64. График коррелированных нагрузок для ПЛС2 модели по матрицам Е и В.Таблица 21. Параметры графиков «введено-найдено» для ПЛС2-регрессиина примере матриц Е и В.
Метод полной перекрестной проверкиТеафлавинНаклонОфсетСКОR2Калибровка0,430,880,360,43Проверка0,281,120,460,26ТеарубигинНаклонОфсетСКОR2Калибровка0,429,911,610,42Проверка0,1913,842,090,21НаклонОфсетСКОR20,597,163,020,59Проверка0,469,493,780,48ЦветНаклонОфсетСКОR2Калибровка0,017,421,070,01Проверка-0,259,331,34-0,27ЯркостьароматаКалибровка122Для установления возможности количественного определения интересующихпараметровматрицыисследовалисьпоалгоритмуПЛС1-регрессии,т.к.используемый для ПЛС2 массив сенсоров может быть избыточен/неоптималендля каждого конкретного параметра, и есть необходимость проводить отдельныйвыборпеременных.Результатыпредставляютсяввидетаблицссоответствующими коэффициентами.Таблица 22. Параметры графиков «введено-найдено» для ПЛС1-регрессиина примере матриц Е и В.
Метод полной перекрестной проверкиТеафлавинНаклонОфсетСКОR2Калибровка0,440,880,360,44Проверка0,271,140,470,25ТеарубигинНаклонОфсетСКОR2Калибровка0,990,220,240,99Проверка0,626,431,630,52НаклонОфсетСКОR20,607,183,020,59Проверка0,459,563,810,47ЦветНаклонОфсетСКОR2Калибровка0,305,270,900,30Проверка-0,4910,601,56-0,71ЯркостьароматаКалибровкаТаким образом, подтверждена возможность количественного определениятеарубигина в исследуемых образцах чая с ошибкой ±8%.Для выявления корреляций между откликом мультисенсорной системы иоценками панели дегустаторов по 4 дескрипторам (яркость вкуса, резкость вкуса,крепость вкуса и общее качество) в настоящей работе применен мультилинейныйПЛС, а именно Такер1-ПЛС регрессия (3wayPLS).
В качестве третьего измеренияв данных использовалась динамическая развертка потенциалов сенсоров приизмеренииобразцов.Полученныйтензоримелразмерность123сенсоры×образцы×время (20×10×19). Поскольку различные вещества в образцахчая имеют различную кинетику взаимодействия с материалом сенсорныхмембран, то использование дополнительных данных позволяет получать новуюинформацию.Для сравнения параметров построены ПЛС-модели (для данных размерностисенсоры×образцы, 20×10) и Такер1-ПЛС-модели (сенсоры×образцы×время,20×10×19).Таблица 23. Сравнение параметров ПЛС-моделей для двумерных итрехмерных данныхЯркость вкусаДвумерные данныеНаклонОфсетСКОR2Калибровка0,811,190,320,81Проверка0,61Калибровка0,90Проверка0,63Резкость вкуса2,510,52Трехмерные данные0,640,242,310,460,510,900,71Двумерные данныеНаклонОфсетСКОR2Калибровка0,900,700,280,90Проверка0,75Калибровка0,99Проверка0,70Крепость вкуса1,700,54Трехмерные данные0,080,091,930,430,630,990,80Двумерные данныеНаклонОфсетСКОR2Калибровка0,235,030,730,23Проверка0,07Калибровка0,98Проверка0,856,090,85Трехмерные данные0,090,091,130,360,090,980,82124КачествоДвумерные данныеНаклонОфсетСКОR2Калибровка0,215,310,710,21Проверка-0,27-0,61Калибровка0,988,591,09Трехмерные данные0,040,06Проверка0,751,710,820,310,98Показано, что применение данных об отклике каждого сенсора с течениемвремени позволяет получать высокую корреляцию с такими дескрипторами каккрепость вкуса и общее качество, что невозможно при использованиитрадиционной двумерной структуры данных.
Такер1-ПЛС регрессия являетсяболее информативным подходом.Для образцов растительных препаратов традиционной китайской медициныобнаружена корреляция и с другим органолептическим параметром – горькостью,что оказалось важным для лекарственной терапии. Исследуемые образцыоценены профессиональными дегустаторами по упоминаемой ранее шкале: 0 –отсутствие горькости; 6 – максимально горько.Усредненные результаты анализа образцов ТКМ, полученные с помощьюмультисенсорной системы, представляют собой матрицу 33*17, где 33 – числообразцов, 17 – число сенсоров.По результатам построена ПЛС-модель (рис.
65).125Прогнозируемая величина(оценка горькости)65432100123456Измеренная величина (оценка горькости)Рис. 65. ПЛС-модель при определении горькости препаратов ТКМ.Проверка модели проводилась на 10 независимо выбранных образцах(красный цвет на графике). Полученная модель свидетельствует о том, чтомультисенсорная система способна оценить горькость препаратов ТКМ сосредней относительной погрешностью 14 %, что является приемлемымрезультатом для измерений такого типа [187].Основнымикомпонентами,определяющимигорькийвкусотвароврастений, являются полифенолы и алкалоиды [139]. В рамках данногоисследования было решено подтвердить этот факт, а также выявить возможностимультисенсорной системы в оценке суммарного содержания полифенолов икофеина. Для каждого образца ТКМ согласно результатов, полученных методомКЭ вычислено суммарное содержание полифенолов и кофеина и построена ПЛСрегрессионная модель как соответствие откликов мультисенсорной системы изначений суммарного содержания полифенолов и кофеина для этих же образцовТКМ (рис.
66).Прогнозируемая величина (%, масс.)126Измеренная величина (%, масс.)Рис. 66. ПЛС-модельполифенолов и кофеина.дляопределениисуммарногосодержанияПостроенная модель позволила установить, что мультисенсорная системаспособна оценить суммарное содержание полифенолов и кофеина в препаратахкитайской народной медицины со средней относительной ошибкой 12 %.Оценка содержания компонентов в моче, влияющих на камнеобразование(аммоний, калий, натрий, кальций, магний, оксалат, цитрат, урат, хлорид,сульфат, фосфат), также проводилась с помощью построения ПЛС-моделей.
Вслучае потенциометрических измерений интенсивность аналитического сигналалинейна от логарифма концентрации компонента. Именно по этой причинеконцентрации компонентов, полученные методом капиллярного электрофореза,преобразованы в логарифмические.На основании данных мультисенсорной системы для всех параметров,определяемых в моче (рис. 50), построены ПЛС-модели.
Проверка направильность полученных моделей проводилась на 40 независимо выбранныхобразцах мочи. Пример такой модели для ионов аммония представлен на рис. 67.Прогнозируемая величина, lg C(NH4+)127Измеренная величина, lg C(NH4+)Рис. 67. ПЛС-модель для определения содержания ионов аммония в моче.Исходя из построенных ПЛС-моделей для всех параметров мочи,определяемых при диагностике мочекаменной болезни, вычислена относительнаяошибка определения концентраций ионов в моче (табл. 24).Таблица 24. Результаты количественного анализа при определениисодержания ионов в моче мультисенсорной системойОтносительнаяошибка, %2.7натрий8.6калий7.2аммоний11.6кальций12.3магний3.1хлорид10.9сульфат8.2фосфат17.0оксалат21.5цитрат11.5урат11.6креатининАналитКалибровочныйдиапазон, ммоль/л3.8-255.54.2-100.04.0-81.80.6-10.70.7-8.711.1-222.31.5-25.93.1-48.40.1-0.40.2-5.50.5-7.02.1-26.7128Установлено, что потенциометрическая мультисенсорная система можетопределять содержание компонентов мочи с ошибкой 3-13%.
При этом точностьв определении ионов оксалата и цитрата оказалась довольно низкой, что можетбыть связано как с узким диапазоном калибровочного набора, так и сприсутствием больших концентраций хлорид-ионов, на фоне которых довольносложно вычленить вклад в сигнал малого количества таких анионов.Важно отметить, что в ряде случаев мультисенсорная система способнаоценить не только химические параметры, такие как концентрации отдельныхкомпонентов, но и физические. Так, при анализе мочи оказалось возможнымпрогнозировать ее плотность, что подтверждается ПЛС-моделями, построенныминаосновереферентныхданныхиданныхмультисенсорнойОтносительная ошибка составила 5 и 8 % , соответственно.системы.129ГЛАВА 7.