Диссертация (Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени". PDF-файл из архива "Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
«цилиндр»: () = (6 + ) * [,] () + (), 1 ≤ ≤ ,(−)+ (), 1 ≤ ≤ ,2. «колокол»: () = (6 + ) * [,] () * (−)3. «воронка»: () = (6 + ) * [,] () *где1. – длина⎧ временного ряда;⎪⎪0, < ⎪⎨2. [,] = 1, ≤ ≤ ,⎪⎪⎪⎩0, > (−)(−)+ (), 1 ≤ ≤ ,593. – случайная величина, подчиняющаяся стандартному нормальномураспределению (0,1);4. () – случайные величины, подчиняющиеся стандартному нормальномураспределению (0,1);5. – случайная величина, подчиняющаяся равномерному распределениюна отрезке [16, 32];6. – случайная величина, подчиняющаяся равномерному распределениюна отрезке [32, 96].Рисунок 2.24 — Класс«цилиндр» (1)Рисунок 2.25 — Класс«цилиндр» (2)Рисунок 2.27 — Примеры временныхрядов класса «цилиндр» без шумаРисунок 2.26 — Класс«цилиндр» (3)Рисунок 2.28 — Примеры временныхрядов класса «цилиндр» с шумомНа рисунках 2.24-2.26 приведены примеры искусственно построенных наосновании вышеприведённых формул временных рядов класса «цилиндр», по2 на каждом графике.
При этом каждый из графиков содержит исходный, незашумленный, временной ряд и соответствующий ему временной ряд с внесеннымв него шумом. Графики выполнены в одном масштабе. На рисунках 2.27 и 2.28для сравнения на одном графике приведены отдельно незашумленные и зашумленные временные ряды.60Рисунок 2.29 — Класс«колокол» (1)Рисунок 2.30 — Класс«колокол» (2)Рисунок 2.32 — Примеры временныхрядов класса «колокол» без шумаРисунок 2.31 — Класс«колокол» (3)Рисунок 2.33 — Примеры временныхрядов класса «колокол» с шумомАналогично приведены примеры для временных рядов, относящихся кклассам «воронка» (рис.
2.29-2.33) и «колокол» (рис. 2.34-2.38).Полученные таким образом наборы временных рядов использовались дляизучения влияния шума на работу алгоритмов обнаружения аномалий и классификации. Для оценки уровня шума в данных следует обратить внимание наформулы, по которым можно генерировать временные ряды каждого класса.В формулах содержится слагаемое () – случайная величина, подчиняющаяся стандартному нормальному распределению (0,1), что является аддитивнымгауссовским шумом.2.5.2Набор данных «контрольные карты»Помимо наборов данных из самого UC Irvine Repository [65], временныеряды для данного набора можно получить по следующим формулам [91]:1. «нормальное значение»: () = + * (), 1 ≤ ≤ ,2.
«цикличность»: () = + * ( * ) + * (), 1 ≤ ≤ ,3. «уменьшение значения»: () = − * + * (), 1 ≤ ≤ ,61Рисунок 2.34 — Класс«воронка» (1)Рисунок 2.35 — Класс«воронка» (2)Рисунок 2.37 — Примеры временныхрядов класса «воронка» без шумаРисунок 2.36 — Класс«воронка» (3)Рисунок 2.38 — Примеры временныхрядов класса «воронка» с шумом4. «увеличение значения»: () = + * + * (), 1 ≤ ≤ ,5. «резкий спад»: () = − () * + * (), 1 ≤ ≤ ,6. «резкое возрастание»: () = + () * + * (), 1 ≤ ≤ ,где1. – длина временного ряда;2.
= 30, = 2;3. () – случайная величина, подчиняющаяся равномерному распределению на отрезке [−3, 3];4. , – случайные величины, подчиняющиеся равномерному распределению на отрезке [10, 15];5. – случайная величина, подчиняющаяся равномерному распределениюна отрезке [0.2, 0.5];6.
– случайная величина, подчиняющаяся равномерному распределениюна отрезке [7.5, 20];62⎧⎨0, < 37. () =⎩0, > 3, где 3 – случайная величина, подчиняющаяся рав-номерному распределению на отрезке [ 3 , 2*3 ].Полученные таким образом наборы временных рядов использовались дляизучения влияния шума на работу алгоритмов обнаружения аномалий и классификации. Для оценки уровня шума в данных следует обратить внимание наформулы, по которым можно генерировать временные ряды каждого класса.В формулах содержится слагаемое () – случайная величина, подчиняющаяся стандартному нормальному распределению (0,1), что является аддитивнымгауссовским шумом.2.6Методы работы с зашумлёнными даннымиНа рис.
2.39 приведён пример временного ряда без шума, на рис. 2.40приведен пример того же временного ряда с шумом. Выбранное представлениедля временных рядов позволяет успешно работать с шумом в данных: за счетсокращения размерности можно «сгладить» крайние значения для временногоряда, сохранив его форму и основные параметры.Рисунок 2.39 — Временной ряд безшумаРисунок 2.40 — Временной ряд сшумомРассмотрим несколько нормализованных представлений исходного временного ряда с различными параметрами. На рис. 2.41–2.44 изображены нормализованные преставления для временного ряда с шумом.
На первом из рисунков (рис. 2.41) одна точка нормализованного временного ряда соответствуетпяти точкам исходного временного ряда, на втором (рис. 2.42) – 10 точкам, на63третьем (рис. 2.43) - 20 точкам и на четвертом (рис. 2.44) - 30 точкам. Как видно,с увеличением числа точек исходного временного ряда, соответствующих однойточке нормализованного ряда, временной ряд «сглаживается» и нормализованный временной ряд становится все больше похожим на исходный временной рядбез шума (рис. 2.39).Рисунок 2.41 — «Сжатие» в 5 разРисунок 2.42 — «Сжатие» в 10 разРисунок 2.43 — «Сжатие» в 20 разРисунок 2.44 — «Сжатие» в 30 раз2.7Постановка задачи обнаружения аномалийЗадача обнаружения аномалий для набора временных рядов ставится следующим образом.
Пусть имеется набор объектов, где каждый объект естьвременной ряд: _ = {_1 , _2 , .., _1 }. Назовем _ обучающей выборкой. Каждый из временных рядов _ , 1 ≤ ≤ 1 в обучающей выборке является примером «нормального» протеканиянекоторого процесса.64Множество _ = {_1 , _2 , .., _2 } назовем экзаменационной выборкой. На основании анализа временных рядов из _ необходимо построить модель, позволяющую относить временные ряды из экзаменационной выборки _ к «нормальным рядам» или к «аномалиям»на основании некоторого критерия.Рассмотрим набор ситуаций из табл.
2.5. Предположим, что данные ситуации описывают нормальное протекание процессов на сложном техническомобъекте и принадлежат одному классу – «норма». На основании этих ситуацийнеобходимо построить такую модель, которая описывала бы «нормальное» протекание процессов и позволяла бы относить ситуации, возникающие на объекте,к «нормальным» или «аномальным». В данном случае перед нами задача обнаружения аномалий в наборах временных рядов, когда в обучающем множествесодержатся примеры единственного класса («норма»).В общем случае для решения задачи определения аномалий в наборах временных рядов с одним классом распространены подходы, основанные на методеопорных векторов (и его модификациях) [92], нейронных сетях [75], использовании дискриминанта Фишера [93], продукционных правилах и др.Рассмотрим данную задачу на простом примере.
Пусть обучающая выборка _ состоит из трех временных рядов - рис. 2.45, рис. 2.46, рис. 2.47.Экзаменационная выборка _ состоит также из трех временных рядов рис. 2.48, рис. 2.49, рис. 2.50.Рисунок 2.45 — Ряд 1обуч. мн-ваРисунок 2.46 — Ряд 2обуч. мн-ваРисунок 2.47 — Ряд 3обуч. мн-ваИсходя из приведенной выше постановки задачи обнаружения аномалий,видно, что временные ряды на рис. 2.49, 2.50 из экзаменационного множествазначительно отличаются (в данном случае – по форме) от временных рядов изобучающего множества и, следовательно, будут являться аномалиями для данного обучающего множества.
При этом можно предположить, что механизм, или65Рисунок 2.48 — Ряд 1 экз. Рисунок 2.49 — Ряд 2 экз. Рисунок 2.50 — Ряд 3 экз.мн-вамн-вамн-вазакон, по которому были получены временные ряды, представленные на этихрисунках, отличается от механизма, с помощью которого были получены временные ряды из обучающего множества. Напротив, временной ряд на рис. 2.48из экзаменационного множества не будет являться аномалией, так как по формеочень «похож» на временные ряды из обучающего множества.Рассмотрим теперь набор ситуаций, представленных в табл. 2.7.
Ситуациив таблице описывают нормальное протекание процессов и идентичны ситуациямиз табл. 2.5, единственным отличием является последний столбец – класс ситуации. Каждая ситуация Сит1-Сит9 теперь относится к одному из классов, взятыхдля примера из описанного ранее набора данных «цилиндр-колокол-воронка».Для краткости обозначим классы , и (cylinder – цилиндр, bell – колокол, funnel – воронка [81]). Аналогично случаю с одним классом на основанииситуаций из табл. 2.7 необходимо построить модель, описывающую «нормальное» протекание процессов и позволяющую для каждой ситуации определить,относится ли она к «нормальным» или «аномальным».
В случае, если ситуация была отнесена к «нормальным», требуется определить, к какому классу онаотносится. Класс обычно соответствует режиму функционирования объекта. Вданном случае перед нами задача обнаружения аномалий в наборах временныхрядов, когда в обучающем множестве содержатся примеры нескольких классов,объявленных «нормальными ситуациями». Это могут быть, например, временные ряды, относящиеся к двум классам: «цилиндр» и «колокол».В общем случае для решения задачи определения аномалий в наборахвременных рядов с несколькими классами распространены байесовский подход [76], подходы, основанные на использовании нейронных сетей [74], продукционных правил.66Таблица 2.7 — Описание ситуаций на объекте для случая 1 датчикаtСит1Сит2Сит3Сит4Сит5Сит6Сит7Сит8Сит90123456789-1.07-0.13 0.85 0.96 0.81 0.84 -0.08-1.01-0.90-1.13-0.72-0.70 1.25 1.23 1.27 0.03 -0.76-0.71-0.71-0.74-0.94-0.84 1.06 0.97 1.01 1.04 -0.35-0.92-0.83-0.80-0.56-0.62-0.19 0.64 1.45 1.39 -0.69-0.61-0.66-0.62-0.98-0.91-0.59-0.53 0.30 0.80 1.25 1.41 -0.98-0.99-0.54-0.44-0.28 0.75 1.61 0.40 -0.45-0.53-0.38-0.61-0.45 1.05 1.25 0.61 -0.35-0.50-0.39-0.27-0.89-0.28-0.68-0.67 1.63 1.07 0.69 0.01 -0.59-0.70-0.64-0.53-1.01 0.50 1.35 0.89 0.33 0.18 -0.34-0.75-0.98-0.65КСCYCYCYBEBEBEFUFUFUРассмотрим данную задачу на простом примере.