Диссертация (1145462), страница 19
Текст из файла (страница 19)
Графики счетов (верхний рисунок) и нагрузок (нижнийрисунок)МГКдляанализаферментационныхрастворовспомощьюмультисенсорной системыНа Рис. 5.6 в качестве еще одного примера приведен график счетов МГКдля образцов 4 ботанических сортов томатов, культивируемых в Бельгии. Данныеполученыотмассива15потенциометрическихсенсоров.Дляпотенциометрических измерений томаты измельчали в блендере, полученное132пюре разбавляли дистиллированной водой в соотношении 1 к 5 и проводилиизмерения в полученном растворе в течение 3 минут.
Видно, что реплики вобразцах томатов различных сортов образуют отчетливые кластеры на графикесчетов. Особое внимание стоит обратить на то, что в МГК различия междугруппами образцов не всегда визуализируются в двух первых ГК, так в данномслучае приведен график ГК1-ГК3, в координатах ГК1-ГК2 (12%) кластерыобразцов томатов Санстрим и Клотиль существенным образом перекрывались.Подробно методика исследования и некоторые другие результаты экспериментаизложены в работах [159, 160].
Исходные данные от мультисенсорной системыдля МГК моделирования в этом примере приведены в Таблице 4 Приложения 1.15СанстримАморосоТришаКлотиль10ГК3(6%)50-5-10-15-40-200204060ГК1 (76%)Рисунок 5.6. График счетов МГК для образцов 4 ботанических сортовтоматов по результатам анализа с помощью мультисенсорной ситсемы.Помимо МГК, в случае, когда набор образцов охарактеризован какмультисенсорной системой, так и другими независимыми методами, для133экплораторныхкорреляции,целейможнокоэффициентамипользоватьсякоэффициентамиконгруэнтностиТакера,матричнойканоническимкорреляционным анализом (ККА, canonical correlation analysis, ССА,). Эти методыпозволяют путем несложных расчетов количественно оценить наличие связеймежду структурой данных, полученных от референтных методов и от массивасенсоров.В Таблице 5.2 в качестве примера приведены модифицированныекоэффициенты матричной корреляции, рассчитанные для матриц данных,полученных от потенциометрической мультисенсорной системы (26 перекрестночувствительных электродов), ВЭЖХ (определение содержания полифенолов) ипрофессиональной панели дегустаторов (семь различных вкусовых дескрипторов)при анализе образцов сухих красных вин.Таблица 5.2.
RV’ коэффициенты матричной корреляции для данных отпотенциометрическоймультисенсорнойсистемы(МС),ВЭЖХ,панелидегустаторов (ПД).МСВЭЖХПДМС1––ВЭЖХ0.691–ПД0.810.521Из величин RV’ коэффициентов следует, что сильнее всего отклик МСкоррелирован с откликом панели дегустаторов, однако корреляция с ВЭЖХ(определялись в основном полифенолы) также существенна.
На основании такогобыстрого эксплораторного анализа можно определить дальнейшие направлениядля более детальной обработки данных эксперимента. В случае низких значенийкоэффициентов между данными МС и каким-либо из референтных методов,попытки создания количественных регрессионных моделей без предварительнойоптимизации массива вряд ли будут успешными. Корреляция между ВЭЖХ и ПД134крайне умеренна, это свидетельствует о том, что прогнозирование откликовпанели дегустаторов из данных ВЭЖХ эксперимента вряд ли возможно.
Другойпример применения матричных коэффициентов описан в работе [161]Метод канонического корреляционного анализа удобен тем, что позволяетвизуализировать результаты в виде карт подобия (similarity maps) образцов. НаРис.5.7 приведены карты подобия для образцов воды, собранных в ходепрограммы экологического мониторинга малых водоемов Санкт-Петербурга.Образцы для исследования были отобраны из 29 прудов в черте города ипригородах, для каждого пруда было отобрано по два образца: из придонногогоризонтаиспроанализированыповерхностинабором(всего58стандартныхобразцов).Всеобразцыгидрохимическихметодовбыли(15различных видов анализа), включающих определение рН, растворенногокислорода, электропроводности, фосфора, химическогои биологическогопотребления кислорода и др.
Помимо этого, все образцы были проанализированыпотенциометрическоймультисенсорнойсистемойиз23перекрестно-чувствительных сенсоров. Три первых извлеченных канонических корня имелизначения 0.964, 0.851, 0.547, что подразумевает значительное совпадениеструктуры дисперсии в обоих наборах данных.
Сопоставление карт подобиятакже это подтверждает: расположение образцов № 53, 55 и 17 в нижней частиграфиков и № 50, 41, 42 в верхней части аналогично для двух наборов данных.Такой результатподразумеваетгидрохимическихпараметроввозможность прогнозированиявобразцахводыизотдельныхрезультатовпотенциометрических измерений с помощью мультисенсорной системы.1350,20,15504944844 470,051524333272928165623392332243422581042353645872018402516374638 2612 1115411393031CV2-0,11954-0,2-0,357145317-0,4-0,5-0,32155-0,2-0,10,00,10,2CV10,2345047548 4360,1490,05152224283233 2273029561575831044-0,174593640 42 2635208 23243946373816182511 124114 13CV25431-0,2-0,31915531755-0,421-0,5-0,3-0,2-0,10,00,10,2CV1Рисунок 5.7.
Карты подобия для результатов измерений с потенциометрическоймультисенсорной системой (верхний рисунок) и для набора гидрохимическиханализов (нижний рисунок) [157].В случае применения мультисенсорных систем для качественного анализарешаются, как правило, классификационные задачи, т.е. решается вопрос о136принадлежности анализируемого образца к какому-либо заранее определенномуклассу образцов. Такие исследования можно проводить как в одноклассовомрежиме («да, это образец класса А/нет, это что-то другое»), так и в режименескольких классов.
Классификационную задачу логично начать с проведенияМГК, чтобы увидеть содержат ли отклики сенсоров требуемую для распознаванияклассов информацию. График счетов МГК позволяет это с легкостью сделатьпутемизучениякластеризацииобразцов.Вопрекираспространенномувлитературе подходу к МГК, как к методу классификации, МГК, строго говоря,таковым не является. А является лишь способом представления данных и анализаструктуры дисперсии. Проведение классификации на основе МГК возможно, нотребует введения дополнительных метрик (таких, как расстояние между классамии между образцами) – это реализовано в алгоритме SIMCA (soft independentmodelling of class analogy, формальное независимое моделирование классовыханалогий).Использование SIMCA эффективно и в случаях, когда имеется несколькоклассов образцов, и в режиме одноклассового классификатора.
В случаях, когдаколичество сенсоров в массиве сравнительно невелико (10-15) эффективнымспособом классификации может являться метод k ближайших соседей (kNN, knearest neighbors). Вывод о принадлежности образца к конкретному классу в этомметоде делается на основании классовой принадлежности k ближайших к немуобразцов.Расстояниемеждуобразцамирассчитываетсявмногомерномпространстве откликов сенсоров (размерность пространства равна числусенсоров).На Рис.
5.8 приведен т.н. график Кумана (Cooman’s plot) для классификацииобразцов, отобранных в ходе ферментации с генетически-модифицированнойкишечной палочкой E.Coli, используемой для наработки определенного белка вфармацевтике. Все образцы были проанализированы потенциометрическоймультисенсорной системой. Для построения классификатора использовалисьобразцы подсвеченные синим (ферментация с высоким выходом белка) и красным(ферментация с низким выходом белка).
Цель эксперимента была в изучении137возможности прогнозирования выхода белка (высокий\низкий) по образцам,отобранным в самом начале ферментации. В данном случае вновь отобранныеобразцы (зеленый цвет) не попали ни в один из классов. Как оказалосьвпоследствии, в ходе этой ферментации была изменена рецептура среды идобавлен пеногаситель, за счет этого интегральный химический состав среды,определяемый мультисенсорной системой, поменялся, и модель не смоглаотнести образцы ни к одному из известных классов.Рисунок 5.8.
График Кумана для классификации ферментационныхрастворов по методу SIMCA.На Рис. 5.9 приведен график Кумана для классификации образцов пива поданным от мультисенсорной системы из 29 потенциометрических перекрестночувствительных сенсоров. Для измерений образцы пива фильтровлаи черезкизельгуровый фильтр для удаления диоксида углерода и разбавляли водой всоотношении 30/70. Детали экспериментальной методики изложены в работах[162, 163].