Диссертация (1150360), страница 14
Текст из файла (страница 14)
vulgaris, C. Vulgaris (50-кратное разбавление) и P. Caudatumсоответственно. Для дафний четыре компоненты суммарно объясняют 100% и91% дисперсии в данных X и Y соответственно. Для образцов, изученных спомощью водорослей, семь компонент объясняют 100% и 99% дисперсии вданных X и Y, в случае 50-кратного разбавления этих образцов 97% и 98%дисперсии объясняются четырьмя компонентами. Для инфузорий шесть главныхкомпонент суммарно объясняют 100% и 98% дисперсии в данных X и Yсоответственно. Все результаты построения градуировочной модели в видепрямых для градуировки и проверки в координатах значений токсичности,полученных с помощью методов биотестирования и мультисенсорной системы,представлены в приложении 2.Количество образцов было ограниченным, поэтому для проверки качестваразработанных моделей была проведена полная перекрёстная проверка моделей, атакже проверка, использующая k-кратное случайное разбиение образцов натестовый и градуировочный набор.
При k-кратном случайном разбиениислучайным образом извлекалась 1/3 образцов, которые использовались в качестветестового набора, а оставшиеся 2/3 образцов использовались для построениякалибровочной модели. Процедура разбиения проводилась 20 раз, столько же разрассчитывалась среднеквадратичное отклонение прогнозирования, кроме тоговычислялись наклон, оффсет и квадрат коэффициента корреляции (таблица 10).Таблица 10. Параметры регрессионных моделейТест-объект и вариантпроверкиНаклонОффсетСКОПR20,836,316,50,81--23,5-Daphnia magna(сточные воды)полная перекрёстная проверка20-кратное случайное95Тест-объект и вариантпроверкиНаклонОффсетСКОПR20,818,83,80,83--6,1-0,951,61,50,94--2,7-0,930,030,090,95--0,15-разбиение (5 образцов)Chlorella vulgaris(поверхностные воды)полная перекрёстная проверка20-кратное случайноеразбиение (5 образцов)Chlorella vulgaris (50-кратноеразбавление)полная перекрёстная проверка20-кратное случайноеразбиение (5 образцов)Paramecium caudatum(поверхностные и сточныеводы)полная перекрёстная проверка20-кратное случайноеразбиение (14 образцов)Данные, представленные в таблице, позволяют сделать вывод, чторегрессионные модели можно использовать для определения токсичности сточностью сопоставимой с величиной разброса данных, получаемых с помощьюживых объектов, независимо от того, какой тест-объект применялся для анализаобразцов.
Однако наилучшая корреляция в данных наблюдается для тех образцов,токсичность которых была установлена с помощью Chlorella vulgaris, и былопроведено 50-кратное разбавление. Погрешность прогноза составила 24, 27, 19 и9615% для D. Magna, C. vulgaris, C. Vulgaris (50-кратное разбавление) и P. Caudatumсоответственно.5.2.2. Образцы, отобранные в различных округах ИспанииСистема, состоящая из 21 сенсора, использовалась для анализа 26 образцов,отобранных на территории различных регионов Испании.
Все измеренияпроводились по методике, описанной в 2.6., каждый образец исследовался, покрайней мере, три раза в случайном порядке.Обработка данных, полученных с помощью мультисенсорной системы, атакжесистемыMicrotox,работакоторойосновываетсянаизмерениилюминесценции морских бактерий, проводилась с использованием трёх методовхемометрики: проекции на латентные структуры, метод случайных лесов, методk-ближайших соседей.Следует сказать, что образцам со значением эффективной концентрации>100%вметодепроекцийналатентныеструктурыбылиприсвоенымаксимальные значения эффективной концентрации 100%. Это допущение былосделано для сохранения репрезентативности регрессионных моделей, так какудаление образцов могло негативно повлиять на представительность модели,ввиду ограниченного количества данных.Все полученные данные использовались для создания регрессионноймодели для реальных водных образцов.
При создании регрессионной моделииспользовалось шесть главных компонент, которыми суммарно объясняется 89%и 97% дисперсии в данных X и Y. Результаты построения градуировочной моделив виде прямых для градуировки и проверки в координатах значений токсичности,полученных с помощью люминесцентных бактерий и мультисенсорной системы,представлены в приложении 3.
В этом случае несколько хуже прогнозируютсязначения токсичности для тех образцов, которые метод биотестированияопределил как токсичные, возможно это связано с небольшим количествомградуировочных образцов.97Так как количество образцов было ограничено, то для проверки моделейиспользовалось два разных подхода: полная перекрёстная проверка моделей, атакже проверка, использующая k-кратное случайное разбиение образцов натестовый и градуировочный набор. При k-кратном случайном разбиениислучайным образом извлекалась 1/3 образцов, которые использовались в качестветестового набора, а оставшиеся 2/3 образцов использовались для построениякалибровочной модели.
Процедура разбиения проводилась 30 раз, столько же разрассчитывалась среднеквадратичное отклонение прогнозирования, кроме тоговычислялись наклон, оффсет и квадрат коэффициента корреляции. Параметрыпостроенных моделей представлены в таблице 11.Таблица 11. Параметры регрессионных моделейВарианты проверкиНаклонОффсетСКОП, %R20,8412,520,70,78--21-полная перекрёстнаяпроверка (26 образцов)30-кратное случайноеразбиение (10 образцов)Данные из таблицы позволяют предполагать, что мультисенсорнуюпотенциометрическую систему и в этом случае можно использовать для оценкитоксичностиобразцов.Былоустановлено,чтосистемапозволяетсосреднеквадратичным отклонением прогнозирования не более 21% определятьтоксичность реальных водных образцов, для анализа которых в качестве тестобъекта использовались люминесцентные бактерии.Полученнаяпрогнозированиярегрессионнаязначениймодельэффективнойтакжебылаконцентрациииспользованатрехдлянеизвестныхобразцов, впрочем, информация о происхождении растворов была приоткрыта.
Втаблице 12 представлены значения токсичности, спрогнозированные с помощьюрегрессионных моделей, и оценка морских бактерий.98Таблица 12. Прогнозируемые с помощью мультисенсорной системы иреферентные значения токсичности водных образцовРеферентныеПрогнозируемыеОтносительнаязначения ЭК50,значения ЭК50,погрешность%%определения, %Сточные воды1007822Биофильтрат10081191007822ОбразецПоверхностныеводыИзтаблицывидно,чтоспрогнозироватьзначенияэффективнойконцентрации на основе данных потенциометрической мультисенсорной системыможно с погрешностью не более 22%. Следует отметить, что методы обработкимногомерных данных, в данном случае метод проекций на латентные структуры,можно,снекоторымидопущениями,использоватьвситуациях,когдаопределяемый параметр выражен в виде неравенств (ЭК50>100).Для численной оценки токсичности реальных водных образцов, отобранныхна территории различных регионов Испании, также использовались методслучайных лесов (количество тестовых образцов n=N-1, для построения узловдеревьев использовалась одна переменная m - значение ЭК50) и метод случайноговыбора k-ближайших соседей (k=1, r=100).
Выбор параметров для методовслучайных лесов и случайного выбора k-ближайших соседей производилсяметодом перебора. Методы случайных лесов и случайного выбора k-ближайшихсоседей использовали для образцов, относящихся к классу ЭК50≤100.В связи с ассиметричным распределением данных, а именно недостаткомобразцов с высокими значениями эффективной концентрации, было решенопровести логарифмическое преобразование (log2) данных и только потомиспользовать данные для прогнозирования значения эффективной концентрации.Таким образом, все ошибки прогнозирования далее даны в логарифмической99форме.
Так как наборы данных образцов были относительно небольшими, тоэффективность выбранных алгоритмов оценивалась с использованием полнойперекрестной проверки.Прогнозирование значений эффективной концентрации для реальныхобразцов, отобранных в Испании, проводилось с меньшей погрешностью прииспользовании метода случайного выбора k-ближайших соседей (k=1, r=100). Вкачестве критерия эффективности рассматривали значение среднего абсолютногоотклонения, т.е.
арифметическое среднее отклонений всех значений от среднего,вычисленное при проведении полной перекрестной проверки 1000 раз.Статистика распределения среднего абсолютного отклонения представленав таблице 13.Таблица 13. Статистика распределения среднего абсолютного отклоненияСреднее значениеСреднее абсолютное отклонениеСреднее арифметическое1,51Медиана1,49Из таблицы можно сделать вывод, что значение среднего абсолютногоотклоненияпрогнозированиязависимойпеременной,вданномслучаеэффективной концентрации, составило 21,5 ≈ 2,83 %.Все полученные результаты свидетельствуют о возможности использованияпотенциометрической мультисенсорной системы в качестве скрининговогометода оценки интегральной токсичности воды, а также водных растворовиндивидуальных веществ в шкалах методов биотестирования.
Таким образом,используя данные мультисенсорной системы в совокупности с соответствующимиметодамиобработкимногомерныхтоксичности/нетоксичностиобразцаданных,вшкалахможносделатьметодоввыводобиотестирования,основанных на реакциях различных живых тест-объектов, например, Daphniamagna, Paramecium caudatum, Chlorella vulgaris и Vibrio fischeri, с погрешностью100не более 27%. При этом скрининг с помощью системы, описанной в даннойработе, позволяет значительно снизить время оценки качества воды, с 48-96часов, необходимых для проведения методов биотестирования, до 3-5 минут, атакже избежать сложностей, связанных с применением живых биотестов.101ЗАКЛЮЧЕНИЕВ рамках диссертационной работы поставленные задачи решены и цельдостигнута.