Диссертация (Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени". PDF-файл из архива "Исследование и разработка методов и алгоритмов обобщения знаний для систем поддержки принятия решений реального времени", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
При записи электрокардио-52граммы использовались два электрода, при этом каждый временной ряд соответствует записи сигнала с одного электрода в течение одного сердечного сокращения.Наборы данных «Beef», «Coffee», «Olive oil» – cпектрограммы продуктов[87].Спектрографы для продуктов используются в хемометрике 1 для классификации типов продуктов – задачи, имеющей практическое применение при контроле качества и безопасности продуктов.Спектрограммы для трех видов продуктов приведены на рисункеРисунок 2.19 — Спектрограммы: мясо – кофе – оливковое масло– Beef (мясо): набор данных содержит спектрограммы, соответствующиеразличной степени содержания побочных продуктов в мясе.– Coffee (кофе): набор данных содержит спектрограммы, соответствующие двум классам (двум видам) кофе: арабика и робуста.– Olive oil (оливковое масло): набор данных содержит спектрограммыоливкового масла экстракласса фильтрованного (extra virgin olive oil) изразличных географических регионов.Набор данных «Trace» содержит временные ряды, соответствующие показаниям некоторых датчиков при определенных переходных процессах на атомной электростанции [88; 89].1Хемометрика - раздел аналитической химии, ставящий целью получение химических данных с помощью математических методов обработки и добычи данных; химическая дисциплина, применяющая математические, статистические и другие методы, основанные на формальной логике, для построения или отбора оптимальных методовизмерения и планов эксперимента, а также для извлечения наиболее важной информации при анализе экспериментальных данных53Набор данных «Lightning 7» [90].Fast On-orbit Rapid Recording of Transient Events (FORTE) – легкий спутник,запущенный в 1997 году на круговую низкую околоземную орбиту (800 км отЗемли).
Совместная разработка Сандийских национальных лабораторий (США)и Лос-Аламосской национальной лаборатории (США). Изначально планировалось использовать спутник для обнаружения ядерных взрывов, позднее – дляизучения молний из космоса. Содержит оптические и радиочастотные датчикии «классификатор событий» для наблюдения в том числе и за высокочастотнымиизлучениями молний в ионосфере на высоте от 80 до 966 км.Примеры графиков – power density profile (плотность мощности энергии),соответствующая каждому классу (по три примера на класс).54Таблица 2.6 — КлассыМеткаНазваниеCGPositive Initial Return StrokeIRNegative Initial Return StrokeSRSubsequent Negative Return StrokeIImpulsive EventI2Impulsive Event PairKMGradual Intra-Cloud StrokeOOff-recordНабор данных «Lightning 2» [90] аналогичен «Lightning 7», только всемолнии разделены на два класса: наземные – включают в себя классы CG, IR,SR – и внутриоблачные I, I2, KM.2.4.2Наборы данных из UC Irvine RepositoryНабор данных «Activities of Daily Living Recognition with Wrist-wornAccelerometer Data Set».Акселерометр – прибор, измеряющий проекцию кажущегося ускорения(разности между истинным ускорением объекта и гравитационным ускорением).55Как правило, акселерометр представляет собой чувствительную массу, закреплённую в упругом подвесе.
Отклонение массы от её первоначального положенияпри наличии кажущегося ускорения несёт информацию о величине этого ускорения.Акселерометры реагируют на ускорение или силу, действующую на сенсорный элемент датчика. Ускорение, статическое или динамическое, возникаетпод действием силы, ускоряющей датчик, например, вследствие действия гравитации. Следовательно, акселерометры могут применяться для измерения силы,ускорения, вибрации, движения или перемещения, а также положения и угланаклона (инклинометры).Акселерометры можно использовать в любом устройстве, работа которогосвязана с перемещением, наклоном, вибрацией.По конструктивному исполнению акселерометры подразделяются на однокомпонентные, двухкомпонентные, трёхкомпонентные.
Соответственно, онипозволяют измерять ускорение вдоль одной, двух и трёх осей. Некоторые акселерометры также имеют встроенные системы сбора и обработки данных. Этопозволяет создавать завершённые системы для измерения ускорения и вибрациисо всеми необходимыми элементами.В наборе данных «Activities of Daily Living Recognition with Wrist-wornAccelerometer Data Set» (ADL, набор данных «повседневная активность, записанная с помощью акселерометра») [65] представлены записи с помощью акселерометров выполнения некоторых простых действий, которые обозначены как«примитивы движения человека» (Human Motion Primitives, HMP), и перечислены ниже:1.
чистить зубы;2. подниматься по ступенькам;3. причесываться;4. спускаться по ступенькам;5. пить воду из стакана;6. есть мясо (с вилкой и ножом);7. есть суп (ложкой);8. вставать с кровати;9. ложиться в кровать;10. наливать воду;5611. садиться на стул;12. вставать со стула;13. звонить по телефону;14.
ходить.Спецификация акселерометра– Тип: трёхосный акселерометр.– Пределы измерений: [- 1.5g; + 1.5g].– Чувствительность: 6 бит на ось.– Частота обновления сигнала: 32 Гц.Расположение - прикреплен к запястью, при этом:– ось x : направлена вдоль руки (pointing toward the hand)– ось y: направлена влево (pointing toward the left)– ось z: перпендикулярна плоскости руки (perpendicular to the plane of thehand)Ускорение кодируется по следующим правилам: [0; +63] = [-1.5g; +1.5g].Правило преобразования оцифрованного сигнала в реальное значениеускорения следующее: _ = −1.5 + (_/63) * 3.Показания акселерометра, соответствующие примерам некоторых действий, приведены на рис. 2.20-2.23.Рисунок 2.20 — Пример показанийакселерометра для действия «вставатьсо стула»Рисунок 2.21 — Пример показанийакселерометра для действия«садиться на стул»57Рисунок 2.22 — Пример показанийакселерометра для действия «вставатьс кровати»2.5Рисунок 2.23 — Пример показанийакселерометра для действия«ложиться в кровать»Модель шума в данныхПри изучении вопросов поиска классифицирующих правил [38] неявнопредполагалось, что такие правила существуют.
В частности, предполагалось,что существуют детерминированные классифицирующие правила. Хотя такоепредположение может быть верным для искусственно созданных обучающихмножеств, используемых в машинном обучении, оно наверняка не выполняетсяприменительно к реальным базам данных. Использование базы данных в качестве обучающего множества вызывает следующие трудности. Во-первых, информация в базе данных ограничена, так что не вся информация, необходимаядля определения класса объекта, доступна. Во-вторых, доступная информацияможет быть повреждена или частично отсутствовать.
Наконец, большой размербаз данных и их изменение со временем рождает дополнительные проблемы. Далее если база данных содержит всю информацию, необходимую для корректнойклассификации объектов, некоторые данные могут не соответствовать действительности. Например, значения каких-либо атрибутов могут содержать ошибкив результате измерений или субъективных суждений. Ошибка в значениях предсказываемых атрибутов приводит к тому, что некоторые объекты в обучающеммножестве классифицированы неправильно. Несистематические ошибки такогорода обычно называются шумом.Шум в обучающих примерах может вызываться различными причинами:во-первых, ошибками при описании объектов – это могут быть ошибки приописании предметной области: ошибки в измерениях, погрешности измеряю-58щих приборов, неправильное распределение примеров по классам экспертом ит. п. Второй причиной является то, что сам язык описания предметной областинедостаточен для того, чтобы полностью и корректно описать все возможныеситуации.
Такая ситуация обычно имеет место в медицине – например, когдапо определенному набору симптомов можно поставить несколько диагнозов идля точного диагностирования требуются дальнейшие наблюдения и большееколичество информации. Третья причина – изменение информации со временем: данные могут теряться и искажаться при хранении и пересылке, менятьсясо временем.В работах [5; 6; 13] проводилось исследование влияния шума на работу алгоритмов обобщения понятий при наличии шума во входных данных.
При этомодним из основных параметров исследования являлся уровень шума – величина0 , 0 < 0 < 0.5, которая показывает, что с вероятностью 0 значение признакав обучающем или экзаменационном множестве искажено. Также эта величинапоказывает, что среди всех значений признаков в среднем * 0 значенийпризнаков будет искажено.Для случая признакового описания объектов данная величина была достаточно информативной для оценки степени влияния шума на имеющиеся в распоряжении данные. Однако когда объекты представлены временными рядами илинаборами временных рядов, такая оценка неприменима.2.5.1Набор данных «цилиндр-колокол-воронка»Помимо наборов данных из самого UC Irvine Repository [65], временныеряды для данного набора можно получить искусственно по следующим формулам [91]:1.