Диссертация (1150291), страница 17
Текст из файла (страница 17)
ИСПОЛЬЗОВАНИЕ МАТРИЧНОГО КОРРЕЛЯЦИОННОГОАНАЛИЗА ДЛЯ СЛОЖНЫХ ОБЪЕКТОВ ПРИРОДНОГОПРОИСХОЖДЕНИЯДляоценкикорреляциймеждуимеющимисямассивамиданныхиспользуются различные критерии: вычисление коэффициентов матричныхкорреляций (RV, RV’ и коэффициент конгруэнтности Такера – φ), а такжеканонический корреляционный анализ. Так, для образцов индийского черного чая(C-DAC, Калькутта) имеются четыре набора данных, построенные по результатамразличныхизмерений,мультисенсорнойсистемы(V),средисистемыкоторых:(Е),профессиональнаяданныеотпотенциометрическойвольтамперометрическойоценкадегустаторовмультисенсорной(S),содержаниекомпонентов чая, определенное традиционными аналитическими подходами –ВЭЖХ и спектрофотометрия (B).Профессиональными дегустаторами чая (ти-тестерами) были выставленыоценки в баллах исследуемым образцам в соответствии с критериями: яркость,резкость, крепость вкуса и общее качество.
Оценка чая по некоторым важнымпараметрам качества была проведена нами в специализированной индийскойлаборатории (C-DAC, Калькутта). Содержание теафлавина и теорубигина вобразцах определено методом ВЭЖХ, интенсивность аромата – ГХ, цвет –колориметрическим методом. Соответствующие данные представлены в табл. 25.Таблица 25. Оценки дегустаторов (S) и данные из чайной лаборатории (В)№обр.68910111214151620Яркость Резкость Крепость Качество88888888665,56665,56677767777888665,56665,566676,5%TФ1,722,372,171,552,051,281,150,771,271,26%TР16,5317,1215,6614,0516,1518,121,7617,5415,3819,67Аромат18,6425,8921,620,9720,5614,9511,5310,0217,3313,63Цвет8,368,456,596,078,917,788,486,315,977,94130Для вычисления коэффициентов матричных корреляций применяютсяследующие процедуры.
Мы имеем 2 матрицы данных X(I*J1) и Y(I*J2), в которых– I (число строк) – число образцов, а J (число столбцов) – число измеренныхпараметров системы. Коэффициент RV вычислялся по формуле:Как видно из табл. 26 коэффициенты матричной корреляции для всех парвидов данных близки к единице, что означает высокую степень схожести вструктуре данных (то есть выявлены общие закономерности). Это нескольконеожиданный результат, если принять во внимание совершенно различнуюприроду этих данных.Таблица 26.
Значения RV-коэффициентовRVEVBSE10,990,980,98VBS10,980,9710,981Известно [171], что высокие значения RV-коэффициента, могут быть связаныс большим количеством переменных (в нашем случае это характерно для матрицE и V, то есть данных от мультисенсорных систем) при относительно небольшомчисле образцов, при этом, корреляция между матрицами обнаруживаются там, гдеее может не быть в действительности, поскольку число коррелируемыхпараметров огромно. К тому же, если какой-либо элемент матрицы равен нулю,учесть его не удается. Для решения этих проблем предлагается использоватьмодифицированныйRV-коэффициент,отрицательные значения [-1,1]:которыйможетприниматьи131Таблица 27.
Значения RV’-коэффициентовRV’EVBSE1-0,370,67-0,25VBS10,270,191-0,591Показано, что значимые коэффициенты корреляции (>0.5) сохранились лишьдляпарматриц В иЕ, B иS (содержанием компонентов чая ипотенциометрической мультисенсорной системой; содержанием компонентов чаяи профессиональной оценкой дегустаторов). Это может свидетельствовать оналичии взаимосвязи между данными матрицами и косвенно указывать навозможность предсказания структуры одной матрицы по структуре другой наосновании имеющихся корреляций.
Таким образом, можно прогнозироватьрезультат компонентного состава чая с помощью мультисенсорной системы.Еще одним методом исследования матричных данных является вычислениекоэффициента конгруэнтности Такера, построенного на матрицах счетов Т.В силу снижения размерности пространства при МГК-анализе число главныхкомпонент будет на единицу меньше числа столбцов исследуемой матрицы. Так,в нашем случае приходится ограничиваться 3 ГК (две матрицы имеют лишь по 4измеренных параметра). И при этом нельзя утверждать, что сокращение до 3 ГКдля остальных матриц не внесет существенных погрешностей.
Возможно, именнопо этой причине значения коэффициентов Такера оказались довольно низкими.Таблица 28. Значения коэффициентов ТакераφEVBSE10,19-0,590,07VBS1-0,14-0,2110,061132Показано, что наибольшее значение вышеуказанных коэффициентов (0,9860;0,6721; -0,5987) наблюдается между матрицами данных от потенциометрическоймультисенсорной системы и биохимическими параметрами черного чая, как иранее, что свидетельствует о потенциальной возможности замены сложногоисследованиябиохимиичаянаболеепростыеиудобныеизмеренияпотенциометрической системой.Результатыхроматографического,электрофоретическогоипотенциометрического анализов растительных препаратов ТКМ обработаны длявыявления корреляций между ними.В силу огромного числа переменных в матрицах данных (5150 дляхроматографии и 6800 для капиллярного электрофореза) коэффициенты RV имодифицированныйRVмогутоказатьсязавышенными.Вычисленыкоэффициенты Такера (табл. 29).Таблица 29.
Значения коэффициентов Такерамультисенсорнаясистема&хроматографияφ0,0449мультисенсорнаясистема&капиллярныйэлектрофорез0,0406хроматография&капиллярныйэлектрофорез0,4667Из значений полученных коэффициентов Такера следует, что максимальноесходство в полученных результатах наблюдается при использовании методовхроматографии и капиллярного электрофореза. Этот факт вполне объясним: врассматриваемых методах одинаковый тип детектирования - ультрафиолетовое , вто время как мультисенсорная система регистрирует электрохимическиепроцессы.133Для нахождения взаимосвязи между наборами переменных используетсятакжеканоническийкорреляционныйанализ.Егорезультатыобычнопредставляют в виде карт образцов:111111612142000161CV2CV215-1615140-12016 120109CV1-1191088CV1-1Рис. 68.
Пример карт образцов, полученных для матриц В и Е (содержаниекомпонентов чая (ВЭЖХ) и данные потенциометрической мультисенсорнойсистемы) при анализе индийского черного чая.Наличие общей схожести картин по расположению образцов относительнодруг друга в координатах двух первых главных канонических переменныхсвидетельствует и о высокой канонической корреляции исследуемых матриц, чтоподтверждается и значением соответствующих корреляционных коэффициентов(в данном случае 0,9999; 0,9291). Получены карты образцов и коэффициенты дляпар матриц изучаемых параметров как для всех главных компонент матриц счетовисходных данных, так и для сокращенных до трех первых главных компонент(Приложение 5).Выявлено, что данная процедура снижения размерности уменьшаеткоэффициенты корреляции для всех пар исследуемых матриц.
Это может бытьсвязано с тем, что большая часть скоррелированной в исходных данныхинформации являлась шумом.Подобие в структурах данных гибридных методов анализа в случаеисследованиярастительныхпрепаратовТКМтакжеподтверждаетсяканоническим корреляционным анализом. В связи с тем, что значения134канонических корней значительно отличаются только в 6 степени, было решенопостроить карты образцов в координатах 5 и 6 канонических переменных (рис.69).а)мультисенсорнаясистемаКП60,8хроматографияКП60,8640,40,4826-0,8051-0,400,432КП50,8-0,8-0,4050,4КП50,88 3КП50,40,880341 -0,47-0,47-0,8-0,8б)мультисенсорнаясистемакапиллярныйэлектрофорезКП60,868426 0-0,4КП51050,40,830-0,85077-0,8хроматография-0,44-0,4в)20,40,4-0,8КП60,8-0,8КП60,81-0,4капиллярныйэлектрофорез0,8КП62280,40,48КП55 01-0,86-0,400,40,8-0,86-0,45 013070,43-0,4-0,847-0,4-0,84Рис.
69. Карты образцов при рассмотрении пар различных методов.КП50,8135Наличие схожести картин по расположению образцов относительно другдруга косвенно свидетельствует о схожести в структурах данных от капиллярногоэлектрофореза и хроматографии.Результаты, полученные в рамках данного исследования, сопоставлены слитературными (табл. 30).Таблица 30.
Применение мультисенсорных систем при анализе сложныхобъектов природного происхождения (левый столбец – литературные данные,правый – результаты представленного диссертационного исследования)биологические жидкостипищевые продуктырастительные препаратымочачайТКМчисло одновременноопределяемых ионовотносительная погрешностьопределения полифеноловотносительная погрешностьопределения горькости5 [171]10% [188]12определение плотности-относительная погрешностьопределения кофеина12% [188]+8%10%15% [182]14%определение суммарногосодержания полифенолов икофеина-+В [171] при многокомпонентном анализе образцов мочи рассматривалисьтолько 5 ионов в отличие от 12 в нашем исследовании.
Данные по определениюплотности биологических жидкостей с помощью мультисенсорной системы влитературе отсутствуют.При оценкесодержания полифенолов и кофеина в образцах чая иинструментальной оценке горькости препаратов ТКМ достигнуты меньшиезначения относительных погрешностей, чем в [188, 182].Это может быть связанокак с другим набором сенсоров в составе массива, так и с применением другихметодов обработки данных.При этом в литературе отсутствует описание регрессионных моделей,связывающих сумму полифенолов и кофеина с откликами мультисенсорнойсистемы. Кроме того, ранее не было описано применение логистическойрегрессии к анализу данных, полученных с помощью мультисенсорных систем.136ЗАКЛЮЧЕНИЕВ рамках диссертационной работы поставленные задачи решены и цельдостигнута.
На основании полученных результатов можно сделать ряд выводов:1. Установлено, что анализ образцов мочи мультисенсорной системой споследующейобработкойпозволяетпроводитьПодобныйподходрезультатовклассификациюможетбытьметодомпологистическойпринципурекомендованврегрессии«норма»/«патология».качественезависимогодиагностического критерия мочекаменной болезни на ранней стадии.2.
Показано, что мультисенсорная система обеспечивает определениеионного состава образцов мочи при использовании данных капиллярногоэлектрофореза в качестве референтных (погрешность 3-13%; время анализа 10-15мин.).3. На примерах анализа мультисенсорной системой образцов лекарственныхпрепаратов ТКМ и чая установлена возможность определения суммарного ииндивидуального содержания полифенолов (погрешность до 12%).4. Обнаружено, что мультисенсорная система позволяет количественнооценитьпараметргорькостивпрепаратахТКМиорганолептическиехарактеристики в образцах чая с использованием в качестве референтныхпоказаний дегустаторов.5. Методом канонического корреляционного анализа установлено наличиекорреляций между откликами мультисенсорной системы и характеристическими(хроматографические и электрофоретические) профилями образцов препаратовТКМ.137ПРИНЯТЫЕ СОКРАЩЕНИЯ И ТЕРМИНЫААС – атомно-абсорбционная спектроскопияБИА – бензимидазолВЭЖХ – высокоэффективная жидкостная хроматографияГХ – газовая хроматографияДДМ – детектор на диодной матрицеДОС – ди-(2-этилгексил)себацинатДЭА – диэтаноламинЖЭ – жидкостная экстракцияИНС – искусственные нейронные сетиИСП – индукционно-связная плазмаИСЭ – ионоселективный электродКЗЭ – капиллярный зонный электрофорезКЭ – капиллярный электрофорезМГК – метод главных компонентМКБ – мочекаменная болезньМС – масс-спектрометрическийМЭКХ – мицеллярная электрокинетическая хроматографиян.ф.
– неподвижная фазаНФОЭ – o-нитрофенилоктиловый эфирПВХ – поливинилхлоридПИД – пламенно-ионизационный детектор138ПЛС – проекция на латентные структурып.ф. – подвижная фазаТКМ – традиционная китайская медицинаТОФ – три(2-этилгексил)фосфатТСХ – тонкослойная хроматографияТФМЭ – твердофазная микроэкстракцияТФЭ – твердофазная экстракцияУФ – ультрафиолетовыйЦТАБ – цетилтриметиламмоний бромидЭН – электронный носЭОП – электроосмотический потокЭХ – электрохимическийЭЯ – электронный язык139СПИСОК ЛИТЕРАТУРЫ1.Mitra S. Sample Preparation Techniques in Analytical Chemistry /S. Mitra.