Том 2 (1109662), страница 24
Текст из файла (страница 24)
Более эффективноесглаживание данных можно осуществить при помощи фильтров, использующих взвешенное усреднение. Веса можно выбрать так, чтобы аппроксимировать данные многочленом второй степени. Этотметод сглаживания называется фильтрацией по Савицкому-Толею.128Глава6.ХемометрикаПри ширине фильтра 2т + 1 точек средние значения равныj=mVk ~"= NORMлтП RM Sc yk+ii-(6Л5)j--mУл'ЛйН-Р и с . 6.6. Сглаживание данных при помощи различных цифровых фильтров.
1 — скользящее среднее, 5 точек; 2 — скользящее среднее,11 точек; 3 — фильтр Савицкого-Голея, 5 точек; 4 — интерполяционный фильтр.Весовые коэффициенты Cj для фильтров различной ширины табулированы (табл. 6.8). Значение NORM равно сумме всех величин Cj.Кривая 3 рис. 6.6 демонстрирует применение к исходным даннымфильтра Савицкого-Голея шириной 5 точек.
По сравнению с фильтрацией методом скользящего среднего с той же шириной окна структура исходных данных сохраняется значительно лучше.Для выбора подходящего фильтра можно пользоваться следующими правилами.• Ширина фильтра должна быть приблизительно равна половине ширины пика (полосы). Если ширина фильтра слишкоммала, сглаживание будет недостаточным.
В случае слишкомширокого фильтра форма пиков искажается (рис. 6.6).• Искажение пиков меньше сказывается на их площади, чем наих высоте. Поэтому, если требуется вычислить лишь площадипиков, ширину фильтра можно выбрать побольше.• При многократном применении одного и того же фильтранаибольший эффект сглаживания (> 95%) достигается припервой фильтрации. Поэтому обычно бывает достаточно применить фильтр только один раз.6.2. Обработка сигналов: цифровая фильтрацияТаблица 6.8.129Весовые коэффициенты для сглаживающих фильтровСавицкого-Голея различной ширины (см.
уравнение (6.15)).Ширина фильтра (число точек)-7-6-5-4-3-2-101234567NORM151311975-78-13 -11420 -3699 -218714 -212244162114769393 -31622484546 121677 172589591622484546 122169393 -31471224414 -216879 -219420 -36-13 -11-78105 143 429 231 21 35Существуют и специальные рекурсивные фильтры, использующие уже сглаженные данные и позволяющие осуществлять быструюфильтрацию непосредственно в процессе регистрации данных.
Среди рекурсивных фильтров чаще всего используют фильтр Калмана.Дифференцирование и интегрирование данныхФильтр Савицкого-Голея может быть использован и для дифференцирования или интегрирования данных. Для этого следует лишь соответствующим образом выбрать весовые коэффициенты.
Численные методы дифференцирования и интегрирования сигналов широко применяются в стандартном математическом обеспечении аналитических приборов.Дифференцирование позволяет устранить постоянный сигналфона и улучшить разрешение пиков. Интегрирование пиков необходимо для нахождения их площади в количественном анализе.Фильтрация данных с предварительнымпреобразованием сигналаСуществуют методы фильтрации, основанные на предварительномматематическом преобразовании данных, последующем умножении5—1150Глава 6. Хемометрика•ЙР?ИА5!.арезультата на некоторую фильтрующую функцию и, наконец, обратном преобразовании. Чаще всего для этого используют фурье-преобразование, о котором мы упоминали в связи с ИК- и ЯМР-спектроскопией.Фурье-преобразованиеРассмотрим принцип фурье-преобразования на примере электромагнитных спектров.
Обычная форма представления спектра — зависимость интенсивности от частоты излучения. Однако любойспектр можно представить и как зависимость интенсивности отвремени. В этом случае он выглядит как суперпозиция периодических синусоидальных колебаний. На рис. 6.7 показано представлениеспектра, состоящего из двух линий (частот), в разных формах.(в)F(V)1 -—> время t, с23частота v, с"1> время t, с%:-Р и с . 6.7. Принцип фурье-преобразования. Суммарный сигнал (а) состоит(б) из двух синусоид с периодами t\ = I c и (г = 1/3 с, (в) — этотже спектр, представленный в виде зависимости интенсивности отчастоты.В данном случае преобразование сигнала из функции, представленной в шкале времени /(£), в шкалу частот F(u) дает спектр,состоящий всего из двух линий с частотами 1 и 3 с - 1 .
Однако подобным образом можно преобразовать и произвольный спектр, в томчисле с непрерывным распределением частот.Представление спектра в шкале времени дает информацию осуммарной амплитуде сигнала, однако информация о частотах в такой форме представления непосредственно не видна. Представлениеже в шкале частот дает информацию лишь об относительных интенсивностях сигнала при тех или иных частотах, но не его суммарнойамплитуде.6.2.
Обработка сигналов: цифровая фильтрация 131В традиционных вариантах спектроскопических методов спектррегистрируют в шкале частот. Ряд новых методов таких, как ИКспектроскопия с фурье-преобразованием или импульсная ЯМР-спектроскопия, основаны на регистрации спектра в шкале времени. Дляперехода к привычной шкале частот в этом случае необходимо выполнить фурье-преобразование.Дискретное фурье-преобразованиеЕсли спектр, зарегистрированный в шкале времени, оцифровать,т.е. представить в виде дискретной последовательности значенийинтенсивности, то к нему можно применить дискретное фурье-преобразование. Пусть оцифрованный спектр представляет собой последовательность из п значений сигнала, находящихся на равныхрасстояниях друг от друга по шкале t. Тогда преобразование спектра в шкалу частот осуществляется как1пF(v) = ~Y.
f(t)e~(2nil,t/n\n(6.16)t=iгде г — у/—T — мнимая единица. Экспоненциальная функция отмнимого числа равнае-(2™^=cos(2Trvt/n)-ism(2Trvt/n).(6.17)Полученная в результате преобразования функция F(u) имеетдействительную и мнимую часть. Спектр в шкале частот представляет собой ее действительную составляющую.Обратное фурье-преобразованиеПреобразование спектра из шкалы частот в шкалу времени осуществляется при помощи обратного фурье-преобразования:пf{t) = ^F{v)e2lxiut/n.(6.18)U= IКак видно из сравнения выражений (6.16) и (6.18), прямое иобратное фурье-преобразование можно выполнить при помощи одного и того же алгоритма.
Существуют очень быстрые алгоритмытакого преобразования.Фильтрация данных при помощи фурье-преобразованияФильтрацию с помощью фурье-преобразования осуществляют следующим образом. Сигнал, зарегистрированный в шкале времени, поГлава 6. Хемометрикауравнению (6.16) преобразуют в шкалу частот. Затем его умножаютна подходящую фильтрующую функцию Н{и)G{v) = F{u)H{u),(6.19)и затем снова преобразуют в шкалу времени согласно уравнению (6.18).Как правило, полезный сигнал соответствует некоторой средней области частот.
Поэтому фильтрующую функцию подбираюттак, чтобы она подавляла крайние, высокие и (или) низкие частоты. Для подавления высоких частот, обычно представляющих собойшум, можно применить фильтрующую функцию, график которойпредставлен на рис. 6.8 (а). График функции для подавления низкихчастот (в частности, обусловленных временным дрейфом сигнала)изображен на рис. 6.8 (б).(а)(б)H(V)#(v)'•}}11RMT)- ^o)частота v-'\'оV00V0частота vРис. 6.8. Фильтрующие функции для подавления высоких (а) и низких (б)частот.Фурье-фильтрация очень эффективна, когда требуется подавитьлишь одну частоту (например, обусловленную наведенными помехами от сети переменного тока) или несколько определенных частот.Частотный спектр, полученный при помощи преобразования Фурье, сам по себе часто позволяет делать выводы о характере и источнике помех.
Так, один тип помех, называемый белым шумом,имеет равномерный спектр, т.е. одну и ту же интенсивность привсех частотах. Белый шум бывает обусловлен тепловым движениемчастиц (тепловой шум), он часто возникает при регистрации сигнала с помощью ФЭУ. Его можно эффективно подавить при помощипростых цифровых фильтров — скользящего среднего и СавицкогоГолея. Временной дрейф сигнала проявляется в виде шума, интенсивность которого обратно пропорциональна частоте.
Интерференционный шум, вызванный помехами со стороны сетей переменноготока, имеет очень четкую структуру с пиками при характерныхчастотах.6.3. Многомерные методы: обработка массивов данных 133Наряду с преобразованием Фурье для тех же целей можно использовать и преобразование Адамара. Алгоритм преобразованияАдамара не требует работы с комплексными числами.6.3.
Многомерные методы: обработкамассивов данныхАналитические приборы, снабженные компьютерами, позволяют собирать и обрабатывать большие массивы данных. Так, обычныйИК-спектр может быть представлен в виде массива из 2000 чисел, а хромато-масс-спектр — из 600000 чисел. Объемы информациимногократно возрастают при анализе сложных многокомпонентныхсмесей.
В частности, проба почвы может содержать до 1000 компонентов.Методы хемометрики для работы с массивами данных можноразделить на три основные группы.• Методы многомерного моделирования для градуировки прииспользовании неселективных методов (одновременный многокомпонентный анализ) и планировании эксперимента (методповерхностей отклика).• Методы группировки данных (кластерный анализ) для установления степени сходства между различными объектами —спектрами, химическими структурами, элементными и вещественными составами образцов.• Методы классификации, т.
е. отнесения исследуемого объектак тому или иному классу. Например, в криминалистике бывает необходимо на основании химического анализа образцаавтомобильного лака определить его сорт.Методы хемометрики позволяют анализировать весьма большиемассивы данных, которые невозможно обработать без помощи компьютера. Для этого применяют как общестатистическое, так и специализированное химико-аналитическое программное обеспечение.Математическое моделирование аналитическихданныхВ аналитической химии, как и в других областях, математическоемоделирование служит для описания зависимости между несколькими величинами. Например, в жидкостной хроматографии мож-Глава 6.