Метод оценки развития газодинамических процессов с помощью скрытой марковской модели (1187404), страница 5
Текст из файла (страница 5)
Отображение каждого наблюдаемого временного ряда в скрытое время CPM-модели обеспечивает выравнивание всехнаблюдаемых временных рядов. Это отображение выполняется посредствомскрытой Марковской модели.3. При выполнении выравнивания во времени способность одновременного масштабирования наблюдаемого временного ряда (называемая нормализацией).На рис.5 показан генеративный процесс CPM-модели. Скрытая запись (latenttrace) z = z(lt) показана жирной красной линией на верхней части рис.5. Синимпунктиром на нижней части рис.5 показана временная зависимость x = x(t) в наблюдаемом времени t. Временной ряд, показанный знаками «+» на нижней частирис.5, генерируется случайным образом выбирая начальное скрытое время lt.
Первыйэлемент временного ряда такой же элемент скрытой записи, но с Гауссовым шумом.Розовая стрелка между верхней и нижней частью рисунка соединяет обозначенныйсимволом «+» первый элемент временного ряда с аддитивным Гауссовым шумом иотмеченный символом «+» соответствующий ему элемент скрытой записи. Затем,случайным образом, происходит переход к следующему моменту скрытого времени,и опять производится эмиссия элемента временного ряда, являющегося элементомскрытой записи в этот момент скрытого времени с аддитивным Гауссовым шумом.Этот процесс повторяется, пока не будет генерирован весь временной ряд. Однако, поскольку при выравнивании временных рядов происходит также их масштабирование,к состояниям скрытого времени добавляются состояния скрытого масштаба, которыепоказаны прерывистыми красными линиями на верхней части рис.5. Поэтому вместо26эмиссии элемента временного ряда со значением элемента скрытой записи с Гауссовымшумом, на рис.5 периодически производится эмиссия элемента временного ряда созначением элемента скрытой записи, умноженного на фактор масштаба, также саддитивным Гауссовым шумом, что отмечено знаками «+» на прерывистых красныхлиниях масштаба.
То есть вместо перехода из состояния скрытого времени в другоесостояние скрытого времени, происходит переход из состояния (‘скрытое время 1’,‘скрытый масштаб 1’) в другое состояние (‘скрытое время 2’, ‘скрытый масштаб 2’).Рис. 5: Графическое представление генеративного процесса CPM-модели.Отметим, что может возникать вырождение между состояниями скрытого масштаба и состояниями скрытого времени. Для заданного элемента наблюдаемоговременного ряда CPM-модель может делать выбор между сдвигом его в скрытом времени, или изменением его состояния скрытого масштаба. Однако, при регуляризацииCPM-модели и достаточном количестве наблюдаемых временных рядов для обученияскрытой записи это вырождение исчезает.2.3.1Состояния масштаба, времени и скрытая записьПриведем формальное определение CPM-модели.
Пусть имеются K наблюдаемыхвременных рядов со скалярными элементамиx[i] = x[i; k], k = 1, N [i],27где частота дискретизации в пределах каждого x[i] не обязана быть постоянной, какона не обязана быть одинаковой для различных x[i]. Для краткости обозначенийсчитается, что N [i] = N, i = 1, K. Предполагается, что существует каноническоепредставление для набора дублирующих друг друга, наблюдаемых асинхронныхвременных рядов с Гауссовым шумом в виде скрытой записи.
Она является базовойдля этого набора временных рядовz = z[k], k = 1, M .(2.3.1)Каждый наблюдаемый временной ряд x[i] моделируется как неоднородная выборкаэлементов скрытой записи z (2.3.1), к которым применены преобразования масштаба.В идеале M N , чтобы любой элемент наблюдаемого временного ряда x[i] вточности отображался в элемент скрытой записи z. Поскольку разрешение скрытойзаписи z выше, чем у наблюдаемого временного ряда x[i], его наблюдаемое времяможет эффективно ускоряться или замедляться при продвижении вдоль скрытойзаписи, используя для этого большие или меньшие перескоки в скрытом времени,индексируемом скрытой записью.Неоднородность выборки элементов и применение локального масштаба, используемые при генерации каждого наблюдаемого временного ряда на основе скрытойзаписи, определяются соответствующей ему последовательностью скрытых состоянийCPM-модели. Каждое состояние в скрытой последовательности представляет собойпару состояние масштаба/состояние времениφ[i; k] = {τ [i; k], χ[k]} , k = 1, N .(2.3.2)Состояния времени τ [i; k], k = 1, N принадлежат последовательности натуральных чисел 1, M , представляющих скрытое время, которое индексируется скрытойзаписью.
Состояния масштаба χ[k], k = 1, N принадлежат упорядоченному набору1, M . Распределение вероятности эмиссии элементов наблюдаемого временного ряда x[i] = x[i; k], k = 1, N , производимых последовательностью скрытых состоянийφ[i; k], k = 1, N на основе скрытой записи z = z[k], k = 1, M , имеет видp (x[i; k] | z, φ[i; k], u[i], σ[i]) ≡ N (x[i; k] | u[i] · z [τ [i; k]] · χ[k], σ[i]) ,где N (x | z, σ) =√ 12πσ 2(2.3.3)2exp − (x−z)– Гауссово нормальное распределение; σ 2 [i]2σ 2– это вариация шума в наблюдаемом временном ряду; u[i] – глобальный параметрмасштаба, уникальный для наблюдаемого временного ряда, который корректирует28(глобальную) разницу масштаба временного ряда x[i] и скрытой записи z (2.3.1).Чтобы полностью специфицировать CPM-модель, необходимо определить вероятности переходов между скрытыми состояниями.
Вероятности переходов междусостояниями времени и вероятности переходов между состояниями масштаба определяются отдельно, поэтому совместная вероятность переходов между скрытымисостояниями факторизуется следующим образом:iTφ[i;k],φ[i;l] ≡ p(φ[i; k] | φ[i; l]) = p(τ [i; k] | τ [i; l])p(χ[k] | χ[l]).(2.3.4)Накладывается ограничение, что состояния скрытого времени всегда продвигаются вперед, но не могут перескакивать больше чем на J последовательных значенийскрытого времени, индексируемого скрытой записью. Кроме этого, разрешаются переходы только между соседними состояниями масштаба. Поэтому локальный масштабнаблюдаемого временного ряда не может внезапно меняться.
С учетом факторизациираспределения вероятности переходов (2.3.4), число возможных скрытых состояний,из которых могут быть совершены переходы в текущее скрытое состояние, оказываетiся равным 3J. Следовательно, матрица переходов Tφ[i;k],φ[i;l] (2.3.4) сильно разрежена.Каждый наблюдаемый временной ряд имеет свое собственное распределение вероятности переходов между состояниями скрытого времени. Вероятности переходовмежду состояниями скрытого времени и состояниями скрытого масштаба даютсямультиномиальными распределениямиθ[i; 1], если a − b = 1;θ[i; 2], если a − b = 2;p (τ [i; k] = a | τ [i; k − 1] = b) = · · ·θ[i; J], если a − b = J;0 в противном случае;p (χ[k] = a | χ[k − 1] = b) =ξ[1], если d(a, b) = −1;ξ[2], если d(a, b) = 0;(2.3.5)(2.3.6)ξ[1], если d(a, b) = 1;0 в противном случае;где d(a, b) = −1 означает, что a на одно состояние масштаба меньше, чем b, d(a, b) = 0означает, что a = b и d(a, b) = 1 означает, что a на одно состояние масштаба боль-29ше b.
Параметры мультиномиальных распределений (2.3.5) и (2.3.6) удовлетворяютPусловиям нормирования: Jj=1 θ[i; j] = 1 и 2ξ[1] + ξ[2] = 1. Параметр J определяетмаксимально допустимое ускорение одного сегмента временного ряда по отношению кдругому, в пределах одного временного ряда или между разными рядами. Если одинсегмента временного ряда использует только последовательные значения скрытоговремени (которое индексируется скрытой записью), когда он продвигается через последовательность скрытых состояний, в то время, как другой пропускает максимальнодопустимое число значений J, то последний движется со скоростью в J раз быстрее,чем первый. Однако длина интервала скрытого времени, в течение которого сегментвременного ряда может двигаться так быстро, ограничена длиной скрытой записи.Таким образом, максимальное суммарное отношение скоростей, достигаемое модельюмежду двумя полными временными рядами, дается выражением min J, M.NНеобходимы два предположения, которые обеспечивают регуляризацию CPMмодели.
Первое − это априорное предположение о гладкости скрытой записи, а второе− априорные вероятности параметров для распределений вероятностей переходов(2.3.5) и (2.3.6) между скрытыми состояниями, которые гарантируют, что не нулевыевероятности переходов между скрытыми состояниями (2.3.2) остаются ненулевымипри обучении. Чтобы при обучении обеспечить гладкость оцениваемой скрытой записи,к правдоподобию добавляется следующая штрафная функция априорной гладкостискрытой записи:M−1Y1∝p(z) =N z[k + 1] | z[k],2λk=1!M−1M−1YX1 (z[k + 1] − z[k])2∝exp −= exp −λ(z[k + 1] − z[k])2 .122λk=1k=1(2.3.7)Чем больше величина λ, тем сильнее штрафная функция (2.3.7) удерживаетскрытую запись от быстрых изменений на шаге скрытого времени (индексируемогоскрытой записью). Однако при обучении невозможно непосредственно оценить значение λ. Хотя формула (2.3.7) представляет необходимую штрафную функцию, ееокончательный видp(z) = exp −λūM−1X(z[k + 1] − z[k])2!.(2.3.8)k=1где ū =1KM−1P(u[i])2 – средний глобальный масштабный фактор по всем наблюдае-k=1мым временным рядам.