Метод оценки развития газодинамических процессов с помощью скрытой марковской модели (1187404), страница 8
Текст из файла (страница 8)
Умножая каждое из этих уравнений на соответствующий параметр θ[i; j] и складывая их, получаем уравнениеJSNXXXXη[j] +p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i]) − Λ[i]θ[i; j] = 0.s=1 {s0 |τ [s0 ]−τ [s]=j} k=2j=1используя условиеJP(2.5.5)θ[i; j] = 1, решаем уравнение (2.5.5) сначала относительноj=1Λ[i], а затем относительно θ[i; j], j = 1, J:Λ[i] =JX(η[j]) +j=1JXSXNXXp (φ[i; k − 1] = s, φ[i; k] = s0 | x[i]) ;s=1 {s0 |τ [s0 ]−τ [s]=j} k=2j=1(2.5.6)SPPNPs=1{s0 |τ [s0 ]−τ [s]=j}k=2η[j] +θ[i; j] =JPj=1(η[j]) +−i∂logT0s, s−p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i])∂(θ[i;j])s=1 s6=s0 k=2NX∂ log Ts,i s00−p (φ[i; k − 1] = s, φ[i; k] = s | x[i])∂ (θ[i; j])k=2∂− Λ[i] =(η[j] log (θ[i; j])) +∂ (θ[i; j])Xη[j]− Λ[i] =+θ[i; j] s=1s6=s0p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i]) log Ts,i s0!p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i])!JPSPj=1s=1 {s0 |τ [s0 ]−τ [s]=j}PPNk=2p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i]) ;(2.5.7)Отметим, что параметры априорных распределений Дирихле служат как псевдоподсчеты (pseudo-counts).
Интуитивно ясно, что приведенная оценка (2.5.7) верна.Производные Lpcomp по параметрам ξ[j], j = 1, 2 аналогичны (2.5.4) и формула дляоценки этих параметров имеет вид41ν[j] +SPNPPp (φ[i; k − 1] = s, φ[i; k] = s0 | x[i])s=1 {s0 ∈H(s,j)} k=2ξ[j] =2P(ν[j]) +j=1JPj=1SPPNPs=1{s0 ∈H(s,1), H(s,0)}k=2!p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i]) ;(2.5.8)где H(s, j) ≡ {s0 | |s0 − s| = j}.2.5.6Глобальный параметр масштабаИз формулы (2.5.1) для ожидаемого полного логарифма правдоподобия Lpcompнаблюдаемых временных рядов x[i; k], k = 1, N следует, что производная Lpcomp поu[i] (параметр глобального масштаба (2.3.3)) имеет видS XNX∂ Lpcomp∂p (φ[i; k] = s | x[i]) ×=log (N (x[i; k] | u[i]z [τ [s]] χ[s], σ[i])) +∂ (u[i])∂ (u[i])s=1 k=1∂1+N (log (u[i] | 0, w)) =∂ (u[i]) u[i]S XNX1log (u[i])z [τ [s]] χ[s] (x[i; k] − u[i]z [τ [s]] χ[s])p (φ[i; k] = s | x[i]) ×=−−.σ[i]u[i]w2 u[i]s=1 k=1(2.5.9)Уравнение∂ hLpcomp i∂(u[i])= 0 дает для наблюдаемого временного ряда оценку параметраглобального масштаба u[i] (2.3.3), которая независима от оценок глобальных масштабов {u[i], i = 1, K} других временных рядов.
При использовании априорногораспределения вероятностей u[i] (2.3.9), для оценки u[i] отсутствует аналитическаяформула. Однако если не используется это априорное распределение, аналитическаяформула для оценки u[i] имеет видSPu[i] =(z [τ [s]] χ[s])s=1SPs=1NPp (φ[i; k] = s | x[i]) x[i; k]k=12(z [τ [s]] χ[s])NP,(2.5.10)p (φ[i; k] = s | x[i])k=1где предельные апостериорные распределения вероятности p (φ[i; k − 1] = s, φ[i; k] = s0 | x[i])представлены формулой (2.2.10). Однако поскольку используется априорное распределение вероятностей u[i] (2.3.9), оценка u[i] получается в результате численнойпроцедуры.422.6Принятие решений при проектировании CPM-моделиПри проектировании CPM-модели делаются предположения относительно генеративного процесса, базового для типа временных рядов, для которых используетсяCPM-модель. Здесь обсуждаются эти предположения, объясняется, почему они сделаны, и рассматриваются другие возможные предположения относительно генеративного процесса.Можно возразить, что априорная гладкость скрытой записи является довольнослабым предположением.
Маловероятно, чтобы при таком предположении можнобыло генерировать тип скрытой записи для произвольных временных рядов. Гауссовпроцесс мог предоставить более подходящее априорное предположение [52], однакоэто приводит к дополнительным вычислительным затратам. В любом случае, придостаточном количестве временных рядов, это слабое априорное предположениеявляется достаточным, т.е.
оно хорошо работает на практике.Вариации эмиссии скрытой Марковской модели σ 2 [i], i = 1, K, независимы отинтенсивности сигнала, который они моделируют (поскольку шум аддитивный) –когда можно ожидать, что вариация становится больше при увеличении сигнала так,что относительный шум остается постоянным (например, мультипликативный шум).Эта проблема решается посредством логарифмического преобразования наблюдаемого временного ряда перед использованием CPM-модели. Такое решение являетсякомпромиссом с другими частями модели (например, мультипликативным масштабированием).С обсужденным выше вопросом до некоторой степени связано, что используемаяштрафная функция гладкости (2.3.8) скрытой записи не учитывает величину сигнала.Таким образом, части скрытой записи, которые являются заметно не гладкими, нолежат в области малых амплитуд, не будут сильно штрафоваться по сравнению ктак же меняющимся сигналом с большими амплитудами.
Следовало бы использоватьразности, которые пропорциональны амплитуде, или, например, использовать суммуточечных вторых производных в конечных разностях по скрытой записи. Это делаетM-шаг более сложным (в случае λ = 0 нет аналитических формул для оценкипараметров, т.е. требуется численное решение).Вероятности переходов между состояниями факторизуются в вероятности переходов между состояниями масштаба и вероятности переходов между состояниямивремени, но можно себе представить, что имеются определенные интервалы времени,43в которых коррекция масштаба меняется более быстро, чем в других интервалахвремени. Связывание этих двух типов состояний вместе не меняет разреженностиматрицы вероятностей переходов, не приводит к дополнительным вычислительнымтрудностям.2.6.1Отношение CPM-модели и Input-Output HMMCPM-модель имеет структурное подобие с Input/Output HMM-моделями (IOHMMмоделями), также называемыми Conditional HMM-моделями, хотя эти модели решаютразличные задачи [53].
IOHMM-модели расширяют стандартные HMM-модели. Онииспользуют условные вероятности переходов и эмиссий на ненаблюдаемой (входной)последовательности [46]. Каждый элемент выходной последовательности соответствует конкретному элементу входной последовательности.
В IOHMM-модели обучениеосуществляется с учителем − определяется отображение наблюдаемой входной последовательности на выходную (целевую) последовательность. Для CPM-моделитакже требуется входная последовательность элементов. Таким образом, CPM-модельявляется разновидностью условной HMM-модели. Однако, эта входная последовательность ненаблюдаемая (буквально она распределяется между всеми ее копиями− наблюдаемыми временными рядами) и, следовательно, обучение в CPM-моделипроисходит без учителя.
Существует альтернативная точка зрения, что CPM-модель− это HMM-модель с дополнительным параметром в виде скрытой записи, котораявлияет на вероятности эмиссии и оценивается посредством CPM-модели.2.6.2Отношение алгоритма DTW и CPM-моделиDTW-алгоритм может рассматриваться, как ограниченная версия CPM-модели.Если DTW-алгоритм применяется для выравнивания временных рядов, один изкоторых используется как ссылка или шаблон, можно получить полностью идентичную процедуру на основе упрощенной CPM-модели без обучения. Принимается, чтоскрытая запись − это один из наблюдаемых временных рядов без добавления в негодополнительных элементов.
Поэтому он не более плотный, чем исходные временныеряды. Затем задается вероятность эмиссии скрытой Марковской модели и все остальные параметры (это аналогично заданию меры подобия в DTW-алгоритме). Еслисостояния скрытого масштаба не используются, а временные ряды выравниваются посредством алгоритма Витерби, результат будет близок к результату DTW-алгоритма.Если используется та же модель шума, то результаты будут идентичны. Становятсяочевидны сильные стороны CPM-модели с EM-алгоритмом:441. Априори не требуется специфицировать ссылку или шаблон для EM-CPMмодели – вместо этого подходящий шаблон в виде скрытой записи обучается извсех наблюдаемых временных рядов одновременно.2.
В EM-CPM-модели не надо отображать друг в друга элементы различных наблюдаемых временных рядов из-за высокой плотности скрытой записи, тогда какDTW-алгоритм всегда отображает элементы одного ряда в элементы другого.3. В EM-CPM-модели не требуется априори полностью специфицировать функциюрасстояния. Можно оценить функции ошибки на основе наблюдаемых временныхрядов, тогда как в DTW-алгоритм должны заранее специфицироваться всепараметры функции стоимости.4. Одновременно с выравниванием, масштабирование временных рядов может бытьестественно инкорпорировано в EM-CPM-модель. Это преимущество четко отделяет EM-CPM-модель от DTW-алгоритма и отражает мощность и элегантность,присущую вероятностным, генеративным моделям.Однако DTW-алгоритм работает на порядок быстрее, чем EM-CPM-модель (если вDTW-алгоритме не используется итеративное обучение ссылки или шаблона).
ТакжеDTW-алгоритм дает превосходную инициализацию для EM-CPM-модели.45Численный экспериментВ настоящей работе обрабатываются результаты контрольного опыта в серииэкспериментов по исследованию горения водородно-воздушных смесей, которые проводятся в ФГБУН Объединённом институте высоких температур РАН на установке«Сфера» (опыт № 84 от 2.02.2012 г.).Установка «Сфера» состоит из испытательной камеры 13Я3 диаметром 12 м и объемом 900 м3 (рис. 6), внутри которой размещается мягкая резиновая оболочка (рис.7),заполняемая водородно-воздушной смесью,и системы регистрации протекающих газодинамических процессов.
На рис. 8, а приведена принципиальная схема установки. НаРис. 8, б показана схема расположения датчиков давления на измерительной планке, установленной в центре сферического объёма дляРис. 6: Взрывная камера 13Я3.Внутренний диаметр – 12 м,объем камеры – 910 м3измерения параметров, определяющих движение ударных волн и их интенсивность.
В экспериментах используются пьезоэлектрические датчики импульсного давления.Исследуемая водородно-воздушная смесьзакачивается в объем 7,06 м3 , ограниченныйтонкой резиновой оболочкой по форме, близкой к сфере. В качестве оболочки используется метеорологический шар-зонд (см. рис.7).Оболочка располагается внутри взрывной камеры 13Я3. Смесь водорода и воздуха, подающаяся в оболочку, содержит 30 % водородаи не содержит ингибиторов.