Главная » Просмотр файлов » Диссертация

Диссертация (1145462), страница 7

Файл №1145462 Диссертация (Потенциометрические мультисенсорные системы на основе фосфор- и азотсодержащих экстрагентов и их аналитические возможности) 7 страницаДиссертация (1145462) страница 72019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 7)

Нежелательные систематические вариации могут возникатьиз-за нестабильного поведения аналитического инструмента (например, дрейфбазовой линии), в силу условий проведения эксперимента, либо из-за физическиххарактеристик анализируемых образцов. В целом, следует стараться избегатьпоявления таких систематических вариаций путем оптимизации условийэксперимента, однако, это не всегда возможно. В ряде случаев усилия, которыенужно для этого предпринять (например, сверхсложная пробоподготовка, строгийпротокол поддержания постоянной температуры, т.п.) могут быть настольковелики, что перестанут быть совместимы с идеей быстрых и недорогих измерений– одним из основных преимуществ мультисенсорных систем типа «электронныйязык» [82, 110]. При современных возможностях вычислительной техникизачастую бывает удобнее и проще произвести соответствующую математическуюобработку сигнала для придания ему требуемых характеристик, чем производитьфизические манипуляции с образцами и прибором.

Это обстоятельство удачновыражено фразой ‘‘math is cheaper than physics’’ (математика дешевле физики)[111]. Наиболее широкое распространение методы предобработки в хемометрикиполучили для спектроскопических инструментов, где активно применяютсяразличные способы сглаживания спектров, например, ставший классическимметод Савицкого-Голея [112], или недавно предложенный метод асимметричныхнаименьшихпредобработкиквадратов[113].применяются,Вмультисенсорныхглавнымобразом,системахдляметодысистемсвольтамперометрическим детектированием, где часто необходимо провести«сжатие» исходных данных, чтобы не работать с полной вольтамперограммой,41содержащей тысячи переменных [114, 115].

Наиболее широко для этих целейприменяются различные виды Фурье-преобразования.1.4.3. Метод главных компонент.МГК, метод главных компонент (principal component analysis, PCA) – этометод эксплораторного анализа данных, он имеет дело только с наборомнезависимых переменных, никакой дополнительной информации от референтныхметодов для реализации МГК не требуется. Как видно из Рис.

1.8, МГК – один изсамых широко используемых методов хемометрики в области мультисенсорныхсистем. МГК позволяет изучить структуру данных в общем виде и понятьвзаимоотношение между образцами и переменными, например, наличие группсхожих образцов, наличие выбросов, наличие скоррелированных переменных,несущих схожую информацию и т.д. [116]. Суть МГК удобно пояснить наконкретном примере. Пусть у нас есть определенные характеристики девятихимических элементов (Таблица 1.1).

Мы имеем набор из девяти образцов(химическихпеременнымиэлементов),каждый(температурыизкоторыхплавленияиохарактеризованкипения,пятьюплотность,электроотрицательность и степень окисления). Пусть мы хотим узнать, есть лисреди этих образцов (элементов) какие либо группы, схожие по своим свойствам.Разумеется, в данном конкретном примере это можно сделать и не прибегая кпомощи каких-либо специальных методов, однако, если данных довольно много(например, УФ-спектры 50 образцов, каждый из которых снят на 200 различныхдлинах волн), то искать такую информацию простым сравнением значенийпараметров в колонках довольно проблематично.

Результатом анализа этойтаблицы (матрицы размером 9х5) по методу главных компонент будут являтьсядва графика: график счетов и график нагрузок. График счетов (Рисунок 1.9)представляет собой так называемую карту переменных и описывает взаимноерасположение образцов (химических элементов) в пространстве новых координат,называемых главными компонентами. Следует отметить, что слово «компонент»42в данном случае имеет сугубо математический, а не химический смысл и несвязано с какими-либо химическими компонентами.

Эти математические главныекомпоненты представляют собой новые геометрические координаты в исходном5-мерном пространстве переменных.Таблица 1.1. Набор данных для пояснения сути МГК.ЭлементTплав, КТкип, КПлотность,кг/м3Электро-Типичнаяотрицательностьстепеньпо ПолингуокисленияAs109088957802,185Ba1002191035940,892Ca11121757155012Ni1726300589021,912P31755318202,195Pd18253413120202,22Pt20454100214502,282Sb903190866912,055Sr1042165725400,952Компоненты проводятся в направлении максимальной дисперсии (разброса) висходных данных, при этом каждый последующий главный компонентортогонален предыдущему. Такой критерий выбран потому, что количестводисперсии в данных напрямую связано с количеством информации.

Т.е. если бызначения всех переменных во всех образцах были примерно одинаковыми, тодисперсия в таких данных была бы невелика, однако и какой-либо полезнойинформации о сходстве/различии в образцах такие данные бы не содержали.43Направление максимальной дисперсии, которое можно выразить в виде линейнойкомбинации исходных переменных, представляет собой первую главнуюкомпоненту (ГК, либо РС в англоязычной литературе).

Вторая главнаякомпонента – это направление максимальной дисперсии, ортогональное первойГК, т. о. ГК2 объясняет максимум информации, не включенный в ГК1, инымисловами эти две новые переменные не скоррелированы между собой. Процессрасчёта последующих ГК продолжается аналогичными образом, пока не будетдостигнут заданный критерий остановки алгоритма, либо пока не будет объясненався дисперсия в данных. Важно, что процедура вычисления главных компонентпозволяет эффективно снизить размерность данных и отобразить все образцы вновых координатах на плоскости, что было бы невозможно, если бы мы осталисьв старой пятимерной системе координат, заданной пятью различными свойствамиэлементов.

Этот процесс часто называется «сжатием» данных. Количество общейдисперсии, содержащейся (объясненной) в каждом из главных компонент,указывается, как правило, возле соответствующей оси на графике счетов. В ходеМГК анализа мы смогли, учтя 96% исходной дисперсии (т.е. потеряв всего 4%информации), свести пятимерное пространство (пять исходных переменных) кдвумерному (две главных компоненты, описывающие 96% вариации в исходныхданных).На графике счетов отчетливо видны три не перекрывающихся кластера – группыобразцов, схожие по выбранным пяти свойствам.

Чем ближе точки на графикедруг к другу, тем более схожи в терминах исходных пяти переменных (физикохимическихсвойств)соответствующиеобразцы(химическиеэлементы).Наблюдаемые кластеры (группы образцов) хорошо согласуются с положениемсоответствующих химических элементов в Периодической системе. Элементывторой группы, пятой группы и переходные металлы находятся в разных частяхграфика.44Рисунок 1.9. График счетов по результатам МГК.Таким образом, МГК анализ позволяет выявить скрытую структуру в данных,которая не всегда очевидна при простом изучении исходных переменных.Заметим, что мы не сообщали методу никакой дополнительной информации осхожести/различии элементов, данный результат основан исключительно наисходных свойствах, приведенных в Таблице 1.1.На графике нагрузок (Рисунок 1.10) в тех же новых координатах главныхкомпонент представлены исходные переменные.

Как и график счетов, этот графикявляется мощным инструментом для понимания взаимосвязей в исходныхданных, а положение точек (переменных) в координатах главных компонентпозволяет сделать некоторые интересные наблюдения. Так, расположение точекрядом друг с другом свидетельствуют о высокой положительной корреляциимежду соответствующими переменными (например, Ткип и Тплав), т.е. чем большеезначение принимает одна переменная, тем большее значение для данного образцаимеет вторая.450,8Электроотрицательность0,6PC2(32%)Степень окисления0,40,20,0ПлотностьТ кипТ плав-0,2-0,6-0,4-0,20,00,20,4PC1(64%)Рисунок 1.10.

График нагрузок.Напротив, точки, находящиеся в противоположных частях графикасвидетельствуют об отрицательной корреляции между соответствующимипеременными. Чем больше Тплав, тем меньше степень окисления. Разумеется, этивыводы справедливы только в рамках имеющейся совокупности данных и, строгоговоря, не могут быть распространены далее. Кроме того, важную информациюможно извлечь также из совместного изучения графиков счетов и графиковнагрузок.

Так, кластер переходных металлов расположен в левой части графикасчетов и значения счетов по ГК1 для всех трех элементов отрицательны, а награфике нагрузок в левой части с отрицательными нагрузками по ГК1расположены такие переменные как «плотность», «Т кип» и «Т плав». Отсюдаможно сделать вывод, что именно они являются ответсвенными за отличиепереходных металлов от других элементов в представленном наборе данных, чтохорошо согласуется с физической природой металлов (высокая плотность,высокие температуры кипения и плавления).

Перед построением МГК моделей (имногих других хемометрических процедур) все переменные исходной матрицы46данных центрируются на среднее значение (т.е. из каждой переменной вычитаетсяее среднее значение) и нормируются (делятся) на стандартное отклонение,рассчитанное по всем образцам для данной переменной. Эти процедурынеобходимы для того, чтобы все переменные имели одинаковый статистическийвес в процессе построения МГК модели. Изначально каждая переменная имеетсвой разброс вокруг среднего значения и свое среднее (Рисунок 1.11).Соответственно и дисперсия, связанная с каждой из переменных, имеетнесопоставимые шкалы.

Переменные с большим разбросом вокруг среднегополучат в этом случае больший вес в МГК и большую «дискриминаторную» силу,хотя очевидно, что большой разброс может быть просто связан с природойпеременной. В ходе центрирования и нормировки происходит выравниваниеразброса значений.Рисунок 1.11. Центрирование и нормировка исходных переменных.47Суть МГК-моделирования сводится к эффективному снижению размерностиисходного пространства данных и представлению образцов в новой системекоординат, в которой отчетливо видны сходства и различия между образцами,обусловленныезначениямиописывающихихпеременных.Приэтомматематически МГК можно представить в виде матричного уравнения:X = TPT + E(1.4),в котором матрица Х представляет собой исходные данные (Таблица 1.1);матрица Т – это матрица счетов, элементами которой являются координатыобразцов в новой системе координат, заданной главными компонентами; матрицаР – матрица нагрузок, элементы которой отражают вклад каждой из переменныхисходного набора данных в направление новых координат – главных компонент;матрица Е – матрица остатков моделирования, содержащая в себе вариацию вданных, не учтенную в рассчитанных главных компонентах (остаточнуюдисперсию).Главные компоненты можно выразить в виде линейной комбинацииисходных переменных, коэффициенты, на которые умножаются эти переменные,представляютсобойнагрузки.Нагрузки–этовеличиныкосинусов(направляющих косинусов) углов между главными компонентами и исходнымипеременными, соответственно, они лежат в диапазоне [-1;+1] и отражают влияниена данную ГК конкретной исходной переменной.

Чем выше значение косинуса поабсолютной величине, тем более близки два направления и тем больше вкладпеременной в ГК. В терминах матричной алгебры вращение из пространстваисходных переменных в пространство ГК осуществляется с помощью матрицынагрузок Р:T=XP(1.5),где Т – это матрица счетов, Х – исходные данные.Ключевое свойство МГК заключается в возможности метода представлятьбольшие объемы информации в виде простых двумерных графиков (счетов и48нагрузок, либо в виде так называемого биплота с одновременным отображением иобразцов и переменных в новом пространстве ГК).Рисунок 1.12.

Биплот (совмещенный график счетов и нагрузок) из работы [117]На Рис. 1.12 показан пример совмещенного графика счетов и нагрузок из работы[117]. Исследуя этот график можно получить информацию о воспроизводимостиизмерений (реплики в образцах вина), различиях между образцами (вина трехразных возрастов), взаимосвязи между переменными и их важности дляразличения групп образцов.

Характеристики

Список файлов диссертации

Потенциометрические мультисенсорные системы на основе фосфор- и азотсодержащих экстрагентов и их аналитические возможности
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6540
Авторов
на СтудИзбе
300
Средний доход
с одного платного файла
Обучение Подробнее