Диссертация (Быстрые алгоритмы оценки параметров полигармонической модели голосового сигнала), страница 9
Описание файла
Файл "Диссертация" внутри архива находится в папке "Быстрые алгоритмы оценки параметров полигармонической модели голосового сигнала". PDF-файл из архива "Быстрые алгоритмы оценки параметров полигармонической модели голосового сигнала", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 9 страницы из PDF
Погрешность в целом обратнопропорциональна N 2 , где N - количество отсчётов во фрейме. Погрешность элементов тёплицевой матрицы убывает обратно пропорционально кубу номера диагонали, что говорит ослабом влиянии этой погрешности на число обусловленности обращаемой матрицы.В дальнейшем зависящие от N матрицы уравнений МНК будут часто заменяться своими предельными значениями, что упрощает формулы и графики и как правило не влияет наb∞ , Bb∞ , составляющие решение предельного уравнениякачественный результат. Векторы AМНК будем называть предельными комплексными оптимальными амплитудами. ВеличинуJmin,∞ назовём предельным минимальным значением функционалом качества.После нормализации матриц и множителей предельное уравнение уравнение МНК описывается следующим утверждением.b∞ =Следствие 1.
Векторы предельных комплексных оптимальных амплитуд A−1 b−1 bMbk,∞)Mbb(Ak=−M и B∞ = (Bk,∞ )k=−M определяются из условий θ = col(γP A∞ , γQ B∞ ), где θ решение уравненияρθ = y,гдеρ=ρPρP QρP QρQ!,y=yAyB!,2 QPQPи ρP = γP2 R∞, ρP Q = γP γQ R∞, ρQ = γQR∞ ,Ay = N/2−1Xn=−N/2Sn p̄0∞ (kF− n)Mk=−M,By = N/2−1Xn=−N/20Sn q̄∞(kF− n)Mk=−M.52Предельное минимальное значение функционалом качества равноJmin,∞N/2−11 X 2 2=wt st − θ∗ y.Nt=−N/2Доказательство.
Введём матрицу нормализацииγ=γP I2M +100γQ I2M +1!.Уравнение R∞ τ∞ = Y∞ равносильно уравнению[γR∞ γ](γ −1 τ∞ ) = γY∞ ,что по определению совпадает с уравнением ρθ = y при θ = γ −1 τ∞ и y = γY∞ .Основное уравнение МНК после нормализации ρθ = y имеет следующую особенность:на главной диагонали матрицы ρ стоят 1, а все остальные элементы меньше по абсолютнойвеличине. В ряде алгоритмов эта особенность упрощает численную реализацию решения иизучение его свойств.2.2Несмещённый критерий оценки периода основного тонаЕстественным критерием качества модели речевого сигнала sbt (P,A,B), зависящей отпериода P и векторов амплитуд A, B, выглядит среднеквадратичная погрешностьN/2−1E(P, A, B) =Xn=−N/2|wt (st − sbt (P, A,B))|2.Минимизацию этой функции можно провести последовательно:min E(P, A, B) = min min E(P, A, B) = min min JP (A, B) ,P,A,BPA,BPA,Bгде JP (A,B) — функционал, минимизация которого изучалась в предыдущем разделе, прификсированном значении периода основного тона P и, соответственно, частоты F = N/P .Однако точка минимума функционала E(P, A, B) в действительности плохо подходитдля оценки параметров данной модели.
В частности, множество моделей с фиксированнымзначением P и произвольными A, B содержится в классе аналогичных моделей с удвоенным периодом 2P . Отсюда минимум E будет всегда достигаться на удвоенном периоде, чтонежелательно.53Эффективный подход к определению периода основного тона был предложен в известной статье [12].
Идея состоит в оценке дисперсии белого шума, входящего в модель сигнала.Результат оценивания традиционно называется несмещённым критерием оценки периода основного тона.Статья [12] написана без строгих доказательств, в ней интегралы многократно заменяются конечными суммами и наоборот, а спектры соседних гармоник считаются непересекающимися. Тем не менее, правильная реализация предложенной идеи эффективна, так какминимизация эмпирической дисперсии белого шума приводит к оценке, часто совпадающейс оценкой максимума правдоподобия.В данном разделе будет точно рассчитана величина эмпирической дисперсии белогошума и тем самым, построена оценка периода основного тона, близкая к максимуму правдоподобия. Как и в несмещённой оценке из [12], эта дисперсия отличается лишь множителемот минимума квадратичного функционала качества Jmin . Этот множитель зависит от количества F периодов на анализируемом фрейме и совпадает с множителем из [12], начинаяпримерно с F ≥ 3.5.
На коротких фреймах, содержащих менее трёх или даже двух периодов,множитель существенно меняется.Наряду со стационарной моделью, изучавшейся в [12], рассмотрена также аффиннаямодель, для которой получены аналогичные результаты.2.2.1Модель измерения с белым шумомПусть измеряемая величина st отличается от идеальной модели только шумовой составляющей:M X2πit 2πi F ktFkt+ vt ,ak e N+ bk e Nst =Nk=−M−N/2 ≤ t ≤ N/2 − 1,Mгде a = (ak )Mk=−M и b = (bk )k=−M — ”истинные” комплексные амплитуды гармоник, а vt —шум, который будем считать белым с дисперсией σ 2 .N/2−1Пусть, как и выше, S = (Sn )n=−N/2 — ДПФ от произведения сигнала s на окноХаннинга w, делённое на N. В оценку параметров модели сигнал входит через величиныB= (YkB )MY = col(Y A , Y B ), где Y A = (YkA )Mk=−M ,k=−M , YN/2−1N/2−1YkA=XSn P̄n (kF ),YkB=XSn Q̄n (kF ).n=−N/2n=−N/2Минимум среднего квадрата невязки сигнала и модели равенJminN/2−11 X 2 2=wt st − Y ∗ R−1 Y,Nt=−N/254причём матрица R не зависит от случайных шумов v.Выделим в векторе Y случайную и детерминированную составляющие.
Для этого введём обозначение для идеальной части сигнала:s0tM X2πit 2πi F ktFktak e N=,+ bk e NNk=−Mтак что измеряемый сигнал распадается на детерминированную и случайную части:st = s0t + vt ,−N/2 ≤ t ≤ N/2 − 1.В силу равенства Парсеваля запишем компоненты вектора Y во временной области и разделим их на детерминированную и случайную части:YkAN/2−1N/2−1N/2−11 X 2 0 − 2πi kF t1 X 2 − 2πi kF t1 X 2 − 2πi kF tNNw t st ew t st ewt vt e N=+=NNNt=−N/2=YkBDkAt=−N/2t=−N/2+ VkA ,N/2−1N/2−1N/2−11 X 2 0 t − 2πi kF t1 X 2 t − 2πi kF t1 X 2 t − 2πi kF tw t st e Nw t st e Nwt vt e N=+=NNNNNNt=−N/2=DkA+t=−N/2t=−N/2VkB .Поскольку среднее значение шума v равно нулю, то среднее значение минимума функционала качества естьEJminN/2−1N/2−1X1 X 2 0 22 1=wt (st ) + σwt2 − D ∗ R−1 D − E(V ∗ R−1 V ),NNt=−N/2t=−N/2гдеD=(DkA )Mk=−M(DkB )Mk=−M!,V =(VkA )Mk=−M(VkB )Mk=−M!.СоставляющаяDJminN/2−11 X 2 0 2wt (st ) − D ∗ R−1 D=Nt=−N/2не зависит от шума v и является минимумом функционала качества J при оценивании параметров идеального сигнала s0 по измерениям без шумов.
При выборе векторов амплитудA = a и B = b получаем, что sb = s0 , и невязка равна нулю. Следовательно,DJmin= 0.55Отсюда среднее значение минимума функционала качества равноEJminN/2−11 X 2=σwt − E(V ∗ R−1 V ).N2t=−N/2Для окна Ханнинга2N/2−1N/2−1 1 X2πt31 X2wt =1 + cos= .N4NN8t=−N/2t=−N/2Из этих рассуждений вытекает заключение следующей леммы:Лемма 5. В введённых обозначениях для аффинной модели с белым шумомEJmin = σ23 E(V ∗ R−1 V )−8σ2.Второе слагаемое в скобках отражает долю шума, скомпенсированного при подстройкемодели по данным измерений.
Эта доля далее будет вычислена аналитически.2.2.2Расчёт подавляемой части шумаДля вычисления второго слагаемого в выражении для EJmin из леммы 5 воспользуемсятождествомE(V ∗ R−1 V ) = E tr(V ∗ R−1 V ) = E tr(R−1 V V ∗ ) = tr(R−1 E(V V ∗ )),где tr — знак следа матрицы. МатрицаNW = 2 E(V V ∗ ) =σWAW AB(W AB )∗WB!имеет компонентыAWkm= NE(VkA (VmA )∗ )N/2−11 X 4 2πi (m−k)F twt e N,=Nt=−N/2ABWkm= NE(VkA (VmB )∗ )N/2−11 X 4 t 2πi (m−k)F t,=wt e NNNt=−N/2BWkm= NE(VkB (VmB )∗ ) 2N/2−12πi1 X 4 t=e N (m−k)F twtNNt=−N/256при −M ≤ k,m ≤ M.
Матрицы W A , W AB , W B — тёплицевы и самосопряжённые.Следующие функции имеют поточечные пределы при N → ∞ при каждом веществен-ном f :AωN(f )Z πN/2−11 X 4 − 2πi f t1AN=w 4 (x) e−if x dx = ω∞(f ),wt e→N2π −πt=−N/2ABωN(f )Z πN/2−111 X 4 t − 2πi f tABw 4 (x) x e−if x dx = ω∞(f ),wt e N→=NN(2π)2 −πt=−N/2 2Z π1 X 4 t1− 2πiBft=e Nw 4 (x) x2 e−if x dx = ω∞(f ),wt→NN(2π)3 −πN/2−1BωN(f )t=−N/2где1w(x) = (1 + cos x).2Из определений следует, чтоAAWkm= ωN((k−m)F ),ABABWkm= ωN((k−m)F ),BBWkm= ωN((k−m)F ).Таким образом, подавляемая часть шума естьE(V ∗ R−1 V ) = σ 2tr(R−1 W ).NAABBПредельные функции ω∞, ω∞, ω∞явно вычисляются в следующем утверждении.Лемма 6.
Предельные функции имеют вид:35 sin(πf ),128 π f (1 − f 2 )(1 − (f /2)2 )(1 − (f /3)2 )(1 − (f /4)2 )iAB(ω A )′ (f ),ω∞(f ) =2π ∞1BA ′′ω∞(f ) = − 2 (ω∞) (f ).4πAω∞(f ) =Скорость сходимости определяется оценкойAAABABBBmax(|ωN(f ) − ω∞(f )|, |ωN(f ) − ω∞(f )|, |ωN(f ) − ω∞(f )|) = O(N −2 (|f |−7 + 1))равномерно по |f | ≤ N/2.Доказательство. По определению, окно Ханнинга есть2πt1 1 2πi1 2πi11 + cos= + e N t + e− N t ,wt =2N2 44−NN≤t≤− 1.2257Отсюдаwt41 35 7 2πit − 2πit 7 4πit − 4πit 1 6πit − 6πit1 8πit − 8πit+ (e N +e N )+ (e N +e N )+ (e N +e N )+ (e N +e N ) .=16 8 24216После вычисления геометрических прогрессий получим, чтоAωN(f )2i sin(πf )135 2i sin(πf ) 7 2i sin(πf )++ − 2πi (1+f )=−f(1−f )16 N8 e− 2πi2 e 2πiNNN−1−1−1 e72i sin(πf )2i sin(πf )1 2i sin(πf )2i sin(πf )+ − 2πi− 2πi++ 2πi(2−f )− N (2+f )(3−f )42 e 2πiNNe−1e−1−1e− N (3+f ) − 12i sin(πf )12i sin(πf )− 2πi (4−f )+− − 2πi (4+f ).16eN−1 e N−1Предел при N → ∞ легко вычисляется:Aω∞(f )7f7fffsin(πf ) 35.+−+−=16π8f1 − f 2 2(4 − f 2 ) 9 − f 2 8(16 − f 2 )После приведения к общему знаменателю получаем формулу в заключении леммы.ABBФормулы для ω∞(f ) и ω∞(f ) следуют из их определений.Для доказательства скорости сходимости приведём к общему знаменателю полученноеAвыражение для ωN(f ).
Это рациональная функция, содержащая синусы, аргументы которыхопределяются дробью f /N. Предельная функция имеет порядок малости O(|f |−9 ) при f →∞. Поэтому можно применить рассуждение из доказательства леммы 1, которое котороепонижает степень |f | на 2 и добавляет N −2 .Подавляемая часть шума определяется величиной tr R−1 W/N, где обе матрицы имеютразмер 2(2M + 1). По лемме 6 первые столбцы тёплицевых подматриц матрицы W имеютконечные пределы при N → ∞. Матрица R аппроксимируется матрицей R∞ в обозначенияхтеоремы 1. Определим аналогичную аппроксимацию для матрицы W :W∞ =AW∞ABW∞ABW∞BW∞!,AABBгде W∞, W∞, W∞- тёплицевы матрицы, первые столбцы которых есть, соответственно,A(ω∞({kF }N ))2Mk=0 ,AB(ω∞({kF }N ))2Mk=0 ,B(ω∞({kF }N ))2Mk=0 ,где операция проектирования {·}N определена перед теоремой 1.Для перехода к вычислению предельных значений в дальнейшем потребуется следую-щее предположение.58Предположение 1.
При заданной функции M = M(N) и фиксированном F существуютпределы11−1tr(R−1 W ) = limtr(R∞W∞ ).N →∞ 2M + 1N →∞ 2M + 1limВ разделе 2.1.3 были введены нормализующие множители γP , γQ . По ним определяетсяматрица γ = diag{γP I2M +1 , γQ I2M +1 }, и в следствии 1 определена нормализованная матрицаρ = γR∞ γ с 1 на главной диагонали.Введём нормализованную матрицуκ = γW∞ γ =AγP2 W∞ABγP γQ W∞ABγP γQ W∞2BγQW∞!=κAκABκABκB!.Подматрицы κA , κAB и κB тёплицевы и самосопряжённые. Их первые столбцы состоят иззначений κ0 (kF ), κ1 (kF ) и κ2 (kF ), соответственно, при 0 ≤ k ≤ 2M, где√8 8πABκ1 (f ) = pω∞(f ),23(2π − 15)8 A(f ),κ0 (f ) = ω∞3κ2 (f ) =64π 2ω B (f ).2π 2 − 15 ∞Графики функций κ0 , κ1 и κ2 приведены на рис.
2.5. Значения в центре:κ0 (0) =35≈ 0.73,48κ2 (0) =35 24π 2 − 205≈ 0.41.576 2π 2 − 15Лемма 7. Пусть M = M(N) - асимптотически линейная функция от N, M(N)/N → dпри N → ∞ и выполнено предположение 1. Определим функциюh(F,M) =8 tr(ρ−1 κ).3 2M + 1Тогда усреднённое значение среднеквадратичной невязки оптимальной аффинной модели для сигнала с белым шумом равноEJmin3 22M + 1= σ 1−h(F,M) + o(1)8N(N → ∞).Доказательство.