Диссертация (Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени), страница 19
Описание файла
Файл "Диссертация" внутри архива находится в папке "Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени". PDF-файл из архива "Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 19 страницы из PDF
Временные ряды как частный случай динамических объектовобобщения были подробно рассмотрены в главе 2.С помощью разработанного программного комплекса был проведен рядэкспериментов по классификации временных рядов с использованием аппарата темпоральных деревьев решений.
Использовались два алгоритма построениятемпоральных деревьев решений: «CPD» и предложенный в работе алгоритм«Темпоральный ID3». Сравнение предложенного алгоритма проводилось как склассическими алгоритмами классификации:– метод K ближайших соседей (Knn);– алгоритм C4_5 [116];– байесовские сети [119] (NB);– многослойный персептрон, логистическая регрессия (MLP);– алгоритм Random Forest (RF) [117];– логистическая регрессия+деревья решений(LMT);– метод опорных векторов (SVM);так и со специализированными алгоритмами, созданными для работы со временными рядами:– метод ближайшего соседа (1-NN ED);– 1-NN Best Warping Window Dynamic Time Warping (r) (1-NN BWW DTW(r)) [120];– 1-NN Dynamic Time Warping, no Warping Window(1-NN DTW noWW) [120].Метод ближайшего соседа считаем специализированным, так как он позволяет без какой-либо предварительной обработки данных работать с временнымирядами как с векторами в N-мерном еквлидовом пространстве.Результаты моделирования и их сравнение со специализированными алгоритмами классификации временных рядов [64] приведены в таблице 4.5.115Таблица 4.5 — Точность классификации динамических объектов (%).
Частныйслучай, динамический объект обобщения – временной ряд. Сравнение соспециализированными алгоритмами.1-NN ED 1-NN BWW DTW (r) 1-NN DTW, no WW TID3wafer99.5099.5098.0098.64Coffee100.00100.00100.0096.43CBF85.2099.6099.7095.67Olive oil86.6086.6083.3093.30Trace76.0099.00100.0088.00CC88.0098.3099.3083.33ECG20088.0088.0077.0079.00Lightning275.4086.9086.9077.05yoga83.0084.5083.6069.56Lightning757.5071.2072.6065.75Beef66.6066.6063.3060.00СРЕДНЕЕ82.35(4)89.11(1)87.61(2)82.43(3)Сравнение показывает, что на рассмотренных наборах данных точностьклассификации с использованием алгоритма Темпоральный ID3 в среднем на5.18-6.68% ниже, чем точность классификации специализированными алгоритмами, созданными для работы с временными рядами, но чуть выше (на 0.07%),чем точность классификации с использованием метода ближайшего соседа. Темне менее на одном из наборов данных – «Olive oil» – алгоритм «ТемпоральныйID3» показал точность классификации выше, чем рассмотренные специализированные алгоритмы.Результаты моделирования и их сравнение с классическими алгоритмами [118] приведено в таблице 4.6.На использованных наборах данных предоженный алгоритм «Темпоральный ID3» показывает точность классификации временных рядов в среднем на0.34-12.76% процентов выше, чем классические алгоритмы классификации.
Приэтом на трех наборах данных – CBF, Olive oil, Trace – «Темпоральный ID3» поточности превосходит все сравниваемые алгоритмы.Также предложенный в работе алгоритм «Темпоральный ID3» показываетрезультаты лучше, чем наиболее близкий к нему алгоритм «CPD» [112].116Таблица 4.6 — Точность классификации динамических объектов (%). Частныйслучай, динамический объект обобщения – временной ряд. Сравнение склассическими алгоритмами.Knnwafer99.40Coffee75.00CBF85.00Olive oil 76.67Trace82.00CC88.00ECG200 89.00Lightning2 80.33yoga83.30Lightning7 63.01Beef60.00NB70.8367.8689.6776.6780.0096.0077.0067.2154.2364.3850.00C4_598.2057.1467.3373.3374.0081.0072.0062.3069.9054.7956.67MLP96.2896.4385.3386.6777.0091.3384.0073.7774.5064.3873.33RFLMT SVM CPD TID399.32 98.09 95.96 97.12 98.6475.00 100.00 96.43 96.43 96.4383.56 77.00 87.67 92.55 95.6786.67 83.33 86.67 56.67 93.3081.00 76.00 73.00 83.00 88.0086.00 92.00 92.33 60.67 83.3381.00 82.00 81.00 73.00 79.0078.69 63.93 72.13 75.41 77.0577.87 71.87 63.07 58.76 69.5656.16 64.38 71.23 47.95 65.7550.00 80.00 66.67 46.67 60.00СРЕДНЕЕ 80.16 72.17 69.67 82.09 77.75(5)(7)(9)(2)(6)4.4.280.78(3)80.56 71.66 82.43(4)(8)(1)Общий случайВ общем случае, как описано в главе 3, динамический объект обобщенияпредставляет собой набор временных рядов.
С помощью разработанного программного комплекса был проведен ряд экспериментов по классификации такихобъектов (ситуаций) для проверки предположения о том, что отнесение ситуацийк различным классам можно провести успешнее, если для описания такой ситуации используется несколько временных рядов. Для сравнения использовалисьдва алгоритма, допускающих работу с динамическими объектами обобщения,содержащими несколько параметров: «CPD» и «Темпоральный ID3». Проверкапроводилась на соответствующих наборах данных, описанных ранее – «ECG»,«wafer», «Activities of daily living», а также на специально сформированных обучающих и экзаменационных выборках, составленных из временных рядов, относящихся к наборам данных «цилиндр-колокол-воронка», «контрольные карты».Сначала были рассмотрены случаи, когда все динамически объекты обобщения относятся точно к двум классам.
С помощью алгоритмов «CPD» и «Темпоральный ID3» мы исследуем, насколько успешно можно различать такие объ-117екты. В обучающей выборке «ECG» каждый объект описан двумя признаками (двумя временными рядами), «Activities of daily living» – тремя признаками,«wafer» – шестью признаками.Результаты классификации для набора данных «Activities of daily living»представлены в таблице 4.7, для набора данных «ECG» – в табл.
4.8 и на графикерис. 4.2, для набора данных «wafer» – в табл. 4.9 и на графике рис. 4.3.Таблица 4.7 — Точность классификации (%), набор данных Activities of dailyliving. Классификация по одному и нескольким признакам. CPD – алгоритм«CPD» [112]; TID3 – алгоритм «Темпоральный ID3»АлгоритмCPDTID3Классы sitdown_chair, standup_chairобучающее множество – 20% исходного набора данных1 (ось X)299.3899.381 (ось Y)256.1761.721 (ось Z)297.5397.53Среднее284.3686.213299.3899.38Классы sitdown_chair, standup_chairобучающее множество – 50% исходного набора данных1 (ось X)299.0199.011 (ось Y)258.4259.411 (ось Z)298.0298.02Среднее285.1585.483299.0199.01Классы getup_bed, liedown_bed1 (ось X)297.0397.031 (ось Y)267.3370.301 (ось Z)291.0993.07Среднее285.1586.803297.0397.03Число признаков Число классовАнализ результатов позволяет сделать вывод, что предложенный в работеалгоритм «Темпоральный ID3» для случая, когда ситуации описываются несколькими временными рядами, показывает результаты классификации лучше, чем«CPD»: на 3% для набора данных «ECG», на 0.49-2.01% для набора данных«wafer».
На наборе данных «Activities of daily living» результаты обоих алгорит-118Таблица 4.8 — Точность классификации (%) - набор данных ECG.Классификация по одному и нескольким признакам.CPD – алгоритм «CPD» [112]; TID3 – алгоритм «Темпоральный ID3»Число признаков Число классов1 (1ый)1 (2ой)Среднее22222АлгоритмCPD TID371.00 70.0075.00 76.0073.00 73.0072.00 75.00Рисунок 4.2 — Точность классификации (%) - набор данных ECG.Классификация по одному и нескольким признакам.
CPD – алгоритм«CPD» [112]; TID3 – алгоритм «Темпоральный ID3»мов одинаковые. Также стоит отметить, что классификация с использованиемнескольких параметров в большинстве случаев более точная, чем классификация в среднем по одному параметру.Однако в рассмотренных наборах данных обычно присутствовал один изпараметров, который являлся наиболее информативным, в связи с чем использование других параметров для классификации являлось избыточным, а иногдаприводило к уменьшению точности класификации. В случае же, если такогопараметра нет или он в ходе изучения предметной области еще не обнаружен,рекомендуется использовать все доступные параметры, так как это позволяет119Таблица 4.9 — Точность классификации (%) - набор данных wafer.Классификация по одному и нескольким признакам.CPD – алгоритм «CPD» [112]; TID3 – алгоритм «Темпоральный ID3»Число признаков Число классов1 (1ый)1 (2ой)1 (3ий)1 (4ый)1 (5ый)1 (6ой)СРЕДНЕЕ26222222222АлгоритмCPD TID381.13 88.1784.26 86.9077.42 83.1994.03 99.0287.78 87.9891.10 92.7785.95 89.6796.09 96.5892.47 96.48Рисунок 4.3 — Точность классификации (%) – набор данных wafer.Классификация по одному и нескольким признакам.
CPD – алгоритм«CPD» [112]; TID3 – алгоритм «Темпоральный ID3»получить точность классификации в среднем большую, чем использование какого-либо одного параметра.В главе 3 был описан принцип, по которому из временных рядов формировались динамические объекты обобщения, представленные несколькими временными рядами (табл. 3.3, 3.4). По такому же принципу были сформированы120другие обучающие и экзаменационные выборки из наборов данных «цилиндрколокол-воронка» и «контрольные карты».
Результаты для этой части эксперимента представлены в таблице 4.10.Таблица 4.10 — Точность классификации динамических объектов (%). Наборыданных «цилиндр-коколол-воронка» (CBF) и «контрольные карты» (CC).Общий случай. Несколько признаков. CPD – алгоритм «CPD» [112]; TID3 –алгоритм «Темпоральный ID3»Набор данных Число признаков Число классовАлгоритмCPD TID3CBF2385.00 89.00CBF2958.11 71.44CC2697.50 99.00CC5698.17 99.00Из таблицы видно, что предложенный в работе алгоритм «ТемпоральныйID3» на рассмотренных наборах данных показывает более высокую точностьклассификации, на 0.83-13.33% выше, чем алгоритм «CPD».