Диссертация (1152335), страница 20
Текст из файла (страница 20)
Разработка комплексного подхода к идентификации вискис использованием инструментальных и статистических методов анализаДля обеспечения надежности результатов идентификации виски, полученныхс использованием разных методов инструментального анализа, в работеисследованы возможности применения методов многомерной статистики. Внаучной литературе часто встречается информация по применению таких методовдля определения качества и подтверждения подлинности пищевой продукции, втом числе есть данные по исследованию различных безалкогольных и алкогольныхнапитков [178,179].Методы многомерной статистики позволяют создать экспертную систему,представляющуюсобойкомпьютернуюсистему,способнуюэмулироватьтехнологию принятия экспертных решений.
Экспертная система включает в себядва основных компонента: базу данных, базу знаний и процедуру логическоговывода. База данных включает различные показатели, определяемые дляисследуемого продукта, контрольную и обучающую выборку продукции и методымногомерной классификации и принятия решений. База знаний и процедуралогического вывода содержат совокупность моделей логически связывающие этихарактеристики с качественными признаками продукции. Логическое решениепринимается специальной процедурой на основе поставленной задачи, по функциипринадлежности продукции происходит ее распределение по группам.Функция принадлежности продукции к одной из групп определяетсяразными методами многомерного статистического анализа. В данной работе будутрассмотрены возможности дискриминантного анализа.
Дискриминантный анализпозволяет получить различия между группами по отношению к множествупеременных одновременно в координатах дискриминантных функций и рассчитатьклассификационныефункции,позволяющиеопределитьпринадлежностьпродукции к одной из групп, сформированных по идентифицируемому признаку.Схема проведения исследования на данном этапе работы представлена нарисунке 20. Первоначально исследуемые образцы виски были разделены на группы139по наиболее значимым ассортиментным признакам. На основе совокупностиисследованных показателей была построена матрица парных коэффициентовкорреляции и выбраны показатели, имеющие существенную корреляционную связьс основными ассортиментными признаками виски (приложение 3).
Выбранныепоказатели легли в основу дискриминантного анализа.Рис. 20 Схема исследования виски с применением метода дискриминантногоанализа5.1. Дискриминантный анализ для целей идентификации срока выдержкивисковых дистиллятовДля проведения дискриминантного анализа по сроку выдержки висковыхдистиллятов, образцы виски были разделены на три группы:- группа 1: виски, выдержанные не менее 3 лет;- группа 2: виски, выдержанные 10 лет и более;140- группа 3: фальсифицированные виски.В качестве наиболее информативных были выбраны показатели: общеесодержание фенольных соединений (показатель Фолина-Чокальтеу), концентрациифенилэтилового спирта, изоамилового спирта и 1,2-метилбутанола.Статистическую значимость и дискриминирующую способность основныхфункций определяли путем измерения остаточной дискриминации с помощьюстатистики Уилкса и F-статистики (таблица 35).Таблица 35 Статистическая проверка гипотезы о градации образцов виски по сроку выдержкиИтоги анализа дискриминантных функцийПеременных в модели: 4; Группы: 3Лямбда Уилкса: 0,23 прибл.
F (8,84) =11,18 p< 0,0000ПоказателиФЧККонцентрация1,2метилбутанолаКонцентрацияизоамиловогоспиртаКонцентрацияфенилэтиловогоспиртаУилксалямбда0,77Частнаялямбда0,3147,85pуровень0,000,250,661-толерантность(R-кв.)0,340,941,270,290,040,960,260,912,170,130,030,970,240,970,550,580,270,73F-исключенияТолерантностьКритерий Лямбда-Уилкса, равный 0,23 (чем ближе к нулю, тем лучшедискриминация), критерий F-статистики с числом степеней свободы (8,84), равный11,18 (при уровне значимости p<0,0000), свидетельствуют о значимости разделениявиски на группы, при этом наибольший вклад в различение виски по срокувыдержки дистиллятов вносят показатель общего содержания фенольныхсоединений (ФЧК), у которого F=47,85, и концентрация изоамилового спирта(F=2,17), при незначительном вкладе двух других показателей - концентрации 1,2метилбутанола (F=1,27) и концентрации фенилэтилового спирта (F=0,55).Общая оценка качества классификации образцов по группам и оценкакачества классификации принадлежности образцов к одной из групп приведены втаблице 36.141Таблица 36 Оценка качества разделения образцов виски по сроку выдержки по выбраннымпоказателям№Правильностьдискриминации, %Группа 1Группа 2Группа 3Группа 1Группа 2Группа 3Всего81,095,580,087,51711194210250044Общая оценка качества классификации образцов по сроку выдержкивисковых дистиллятов равна 87,5%.Максимальное число дискриминантных функций (ДФ) равно 2.
В таблице 37представлены стандартизованные коэффициенты дискриминантных функций,которые применяют для выявления показателей, вносящих наибольший вклад взначение дискриминантной функции. Чем больше значение ДФ по абсолютнойвеличине, тем больше вклад этой переменной. Это является критерием значимостипоказателей.Таблица 37 Стандартизованные коэффициенты для показателей дискриминантных функцийПоказательФЧК (FCK)Концентрация 1,2-метилбутанола (M)Концентрация изоамилового спирта (Iz)Концентрация фенилэтилового спирта (F)Собственные значенияКумулятивная доляДФ1-1,17-1,351,89-0,283,180,99ДФ20,11-3,204,03-1,310,021,00Собственные значения первой функции равны 3,18, доля которой составляет99% и второй функции – 0,02, доля которой составляет 1%.
Основное разделениепо идентифицируемому признаку происходит по первой дискриминантнойфункции и менее значимое – по второй.По первой дискриминантной функции хорошее разделение осуществляетсясразу по трем показателям: показателю ФЧК f(FCK)=-1,17, по концентрации 1,2метилбутанола f(M)= -1,35 и концентрации изоамилового спирта f(Iz)= 1,89. Повторой дискриминантной функции наибольшее разделение также происходит потрем показателям: концентрации 1,2-метилбутанола f(M)= -3,20, концентрации142изоамилового спирта f(Iz)=4,03 и концентрации фенилэтилового спирта f(F)= -1,31.Наглядно распределение образцов виски по сроку выдержки на три группы впространстве двух дискриминантных осей представлено на рисунке 21.Рис.
21 Расположение точек, соответствующих образцам виски разных групп попродолжительности выдержки и фальсифицированных, в координатах двухдискриминантных функцийНа графике выделяются три основные области скопления образцов. Данныеобласти хорошо различимы в пространстве. То есть дискриминантный анализпозволяет сформировать содержательную гипотезу о различии образцов виски посроку выдержки по выбранным показателям.Для построения экспертной системы необходимо решение, котороепринимается на основе определения максимального значения коэффициентапринадлежности к одной из выбранных групп. Определить коэффициентпринадлежности позволяет классификационная функция (таблица 38).143Таблица 38.
Коэффициенты классификационных функций для каждой идентифицируемойгруппы вискиГруппа 15,436840,0237-0,010070,00282-5,76563ПоказательFCKMIZFКонстантаГруппа 29,86690,0551-0,02480,0218-16,4609Группа 30,23140,00384-0,00009-0,00245-2,36224Классификационная функция имеет следующий вид:hk = bk0 + bk1*FCK + bk2*M + bk3*IZ + bk4*F, гдеhk–значениефункциидлякаждой(18)идентифицируемойгруппывиски (k – 1,2,3);bk0 – константа функции;bk1, bk2, bk3, bk4 – коэффициенты классификационных функций;FCK, M, IZ, F – показатели образцов, выбранные для данногоидентифицируемого признака.Таким образом, для определения, к какой из групп по сроку выдержкидистиллятов относится образец виски, мы будем использовать следующиеуравнения:Группа 1 (виски, выдержанный не менее 3 лет):h1 = -5,76563+5,43684*FCK+0,0237*M-0,01007*IZ+0,00282*F;(19)Группа 2 (виски, выдержанный 10 лет и более):h2 = -16,4609+9,8669*FCK+0,0551*M-0,0248*IZ+0,0218*F;(20)Группа 3 (фальсифицированный виски):h3 = -2,36224+0,2314*FCK+0,00384*M-0,00009*IZ-0,00245*F.
(21)Таким образом, при необходимости проверить принадлежность новогообразца к одной из групп, достаточно подставить полученные значения показателейв уравнения (19-21). После решения уравнений, необходимо определить большеезначение среди h1, h2, h3. Функция группы, имеющая наибольшее значение,определяет группу, к которой принадлежит образец.Для проверки классификационной функции была произведена случайнаявыборка 4 образцов виски из исследованных с известными значениями144показателей, необходимых для расчета классификационной функции (таблица 39).Таблица 39. Значения показателей виски, выбранных для проверки классификационной функцииХарактеристика образца виски поFCKM, мВ∙сIZ, мВ∙сF, мВ∙с№данным маркировки1Виски, выдержанный 16 лет3,52352,8994,8120,92Виски, выдержанный не менее 3 лет1,4273,3198,224,434Фальсифицированный вискиВиски, выдержанный 12 лет0,113,891,3195282,6572,425,4124,8В таблице 40 представлен расчет классификационной функции для каждогоиз проверяемых образцов.Таблица 40 Расчет значений классификационной функции для проверяемых образцовКлассификационная функцияОбразец 1h1 = -5,76563+5,43684*3,52+0,0237*352,8-0,01007*994,8+0,00282*120,9=12,06h2 = -16,4609+9,8669*3,52+0,0551*352,8-0,0248*994,8+0,0218*120,9=15,67h3 = -2,36224+0,2314*3,52+0,00384*352,8-0,00009*994,8-0,00245*120,9=-0,58Образец 2h1 = -5,76563+5,43684*1,42+0,0237*73,3-0,01007*198,2+0,00282*24,4=1,76h2 = -16,4609+9,8669*1,42+0,0551*73,3-0,0248*198,2+0,0218*24,6=-2,79h3 = -2,36224+0,2314*1,42+0,00384*73,3-0,00009*198,2-0,00245*24,4=-1,83Образец 3h1 = -5,76563+5,43684*0,11+0,0237*91,3-0,01007*282,6+0,00282*25,4=-5,78h2 = -16,4609+9,8669*0,11+0,0551*91,3-0,0248*282,6+0,0218*25,4=-16,7h3 = -2,36224+0,2314*0,11+0,00384*91,3-0,00009*282,6-0,00245*25,4=-2,07Образец 4h1 = -5,76563+5,43684*3,8+0,0237*195-0,01007*572,4+0,00282*124,8=14,10h2 = -16,4609+9,8669*3,8+0,0551*195-0,0248*572,4+0,0218*124,8=20,30h3 = -2,36224+0,2314*3,8+0,00384*195-0,00009*572,4-0,00245*124,8=-1,09Схема принятия решения о соответствии заявленного срока выдержки вискипредставлена в таблице 41.145Таблица 41.