Диссертация (1149280), страница 11
Текст из файла (страница 11)
Поэтому в этом разделе будем считать, чтовсе оптимизируемые функции зависят от P .b2 (P ) для фиксированТеорема 2 и следствие 2 указывают способ расчёта показателя σного значения P . Функция σb2 (·) может иметь большое количество локальных минимумов,поэтому необходимо провести перебор по некоторой сетке значений P .В качестве такой сетки в первоначальной статье [12] для стационарной модели былиудачно выбраны все целые значения P . Был предложен алгоритм одновременного вычисления всех показателей Jmin(P ) для всех целых P со сложностью порядка N log2 N. В данномразделе показано, что этот алгоритм применим только при относительно больших значенияхF = N/P , формула несмещённого критерия строго доказана, результат обобщён на произвольные значения F , а также на аффинные модели.В первых двух подразделах рассмотрена задача с относительно большими значениямиF , в которой можно обойтись алгоритмом сложности N log2 N.
Общий случай целого значения периода рассматривается в третьем подразделе, где получены новые явные формулыдля минимума функционала качества.662.3.1Аффинная модель с целым периодом основного тонаПусть число P целое, ему соответствует частота F = N/P и подбирается аффиннаямодель сигналаM2 X2πit 2πi F ktF ktNN,+ Bk eAk esbt =Nk=M−N/2 ≤ t ≤ N/2 − 1,1Если P нечётное, P = 2M + 1, то в пределах суммирования M1 = −M и M2 = M. Если Pчётное, P = 2M, то M1 = −M и M2 = M − 1.
В обоих случаях количество элементов в суммеравно M2 − M1 + 1 = P .Пусть F достаточно большое, чтобы при ненулевых krP0 (kF ) ≈ 0,rP0 Q (kF ) ≈ 0,0rQ(kF ) ≈ 0,k = ±1, ±2, . . .Если на анализируемом сегменте речевого сигнала укладывается более 5 периодов, то аппроксимация применима, но даже если укладывается 3.5 периода, то погрешность всё ещёдопустима. Подстановка данных приближений означает только, что все внедиагональныеэлементы матрицы ρ в следствии 1 обнуляются. В результате матрица ρ становится единичной.Будем считать в этом разделе, что внедиагональные элементы информационной матрицы МНК R также заменены нулями.Теорема 3. Пусть P — целое число и выполнены указанные замены нулями внедиагональных элементов матриц R и ρ.
ТогдаJmin =1 NN/2−1Xt=−N/2(wt st )2 −1 2γPF[F ]Xp2rnP+ γQn=−[F ][F ]Xn=−[F ]где rkp и rkq — корреляционные функции последовательностей p и q:rkp=∞Xrkqpt pt+k ,=t=−∞apt =(|t| ≥qt qt+k ,N,2N2− 1,qt =(wt2st Nt , − N2 ≤ t ≤0,Оценка дисперсии шума в модели измерений имеет видσb2 =8 Jmin,3 1 − Fλq ,rnPk = 0, ±1, ±2, . . .t=−∞wt2 st , − N2 ≤ t ≤0,∞X|t| ≥N.2N2− 1,67гдеλ=35 48π 2 − 385≈ 3.034.216 2π 2 − 15Доказательство.
При сделанных предположениях информационная матрица МНК есть−2R = diag{γP−2 IP , γQIP }, а оптимальные оценки комплексных амплитуд равныN/2−1A0k=XγP2Sn P̄n (kF ) =γP2N/2−1=2γQXM1 ≤ k ≤ M2 ,t=−N/2n=−N/2Bk0N/2−11 X 2 − 2πi ktw t st e P ,NSn Q̄n (kF ) =2γQn=−N/2N/2−11 X 2 t − 2πi ktw t st e P ,NNM1 ≤ k ≤ M2 .t=−N/2Минимум функционала качества равенN/2−1N/2−11 X1 X2∗=(wt st ) − θ y =(wt st )2NNt=−N/2t=−N/222N/2−1N/2−1M2 P−1 XXXX11t − 2πi kF t 2− 2πi22kFt2w t st e Nw t st e N−γP − γQ .NNNJmink=M1k=0t=−N/2t=−N/2Поскольку число P целое, то функция2πie− NkF t= e−2πiktPимеет период P по каждому аргументу — t и k. Заменяя отрицательные k на k + P , получим,чтоJminN/2−1N/2−11 X1 X2∗(wt st ) − θ y =(wt st )2=NNt=−N/2t=−N/222N/2−1N/2−1P−1 P−1 XXXX2πi2πi1t12ktkt2−2−2 −γ .PPwsewse−γPttQttNNNk=0k=0t=−N/2t=−N/2∞Подставим обозначения для последовательностей p = (pt )∞t=−∞ и q = (qt )t=−∞ из фор-мулировки теоремы.
В силу периодичности экспоненты при всех k = 0,1, . . . , P − 1:N/2−1Xwt2 st e−2πiktP=Xt=−N/2wt2 stpt e−2πiktP=t=−∞t=−N/2N/2−1∞Xt − 2πi kt=e PNгдеcℓ =∞Xj=−∞∞X∞Xpℓ+P j e−2πikℓP=ℓ=0 j=−∞− 2πiktPqt et=−∞pℓ+P j ,P−1X=P−1X∞Xdℓ =j=−∞cℓ e−2πikℓPdℓ e−2πikℓP= Ck ,ℓ=0− 2πikℓPqℓ+P j eℓ=0 j=−∞∞XP−1Xqℓ+P j ,=P−1Xℓ=00 ≤ ℓ ≤ P − 1.= Dk ,68−1−1Поскольку векторы C = (Ck )Pk=0и D = (Dk )Pk=0являются результатами ДПФ от векторов−1−1c = (ck )Pk=0и d = (dk )Pk=0, соответственно, то2P−1P−1XX2πikt2−2Psew=|C|=Pc2ℓ ,kt tk=0 t=−N/2k=0ℓ=02P −1 N/2−1P−1P−1XXX X 2 t − 2πi kt 2Pd2ℓ .|Dk | = Pw t st e=Nk=0 t=−N/2ℓ=0k=0P−1 N/2−1XXЭта формула уже даёт удобный способ вычисления Jmin :Jmin =1 NN/2−1Xt=−N/2(wt st )2 − γP2PNP−1Xℓ=02c2ℓ − γQPNP−1Xℓ=0d2ℓ .Объём вычислений можно ещё сократить, применив ДПФ следующим образом. Введёмкорреляционные функции последовательностей p и q:rkp∞X=rkqpt pt+k ,=∞Xqt qt+k ,t=−∞t=−∞k = 0, ±1, ±2, .
. .Очевидно, что rkp = 0 и rkq = 0 при |k| ≥ N. Далее,P−1Xc2ℓ=ℓ=0∞X∞Xpℓ+jP pℓ+mP =d2ℓ=P−1X∞X∞X∞∞XXpt pt+P n =t=−∞ n=−∞ℓ=0 j=−∞ m=−∞ℓ=0P−1XP−1Xqℓ+jP qℓ+mP =ℓ=0 j=−∞ m=−∞∞∞XX[F ]XprnP,n=−[F ]qt qt+P n =t=−∞ n=−∞[F ]XqrnP,n=−[F ]где [F ] — целая часть величины F = N/P . После подстановки получаем формулу для Jmin вутверждении теоремы.Оценка дисперсии шума в модели измерений имеет видσb2 =83 1−Jmin.tr(ρ−1 κ)8 13 NПоскольку матрица ρ заменяется на единичную, тоtr(ρ−1 κ) = tr(κ) = P (κ0 (0) + κ2 (0)) = PОтсюдаσb2 =где числоλ=35 48π 2 − 385≈ 1.1378 P.576 2π 2 − 158 Jmin,3 1 − Fλ35 48π 2 − 385≈ 3.034216 2π 2 − 1569является горизонтальной асимптотой функции h∞ (F ), причём в рассматриваемом диапазонеF ≥ 3.5 аппроксимация этой функции асимптотой достаточно точная.Смысл применения теоремы 3 состоит в том, что она понижает сложность вычисленийпоказателя σb2 (P ) при всех допустимых целых P с N 2 операций до N log2 N операций, чтовесьма существенно в практических расчётах.Действительно, количество целых значений P пропорционально N, а для расчёта каж-дого значения Jmin (P ) по определению требуется порядка N операций.С другой стороны, корреляционные функции rkp и rkq рассчитываются один раз одновременно для всех значений P .
Стандартным способом сначала вычисляется ДПФ двойнойразмерности при помощи дополнения массивов p и q нулями:N/2−1Snp=XN/2−12πiwt2 st e− 2N nt ,SnqX=t=−N/2wt2 stt=−N/2t − 2πi nte 2N ,N0 ≤ n ≤ 2N − 1.Затем вычисляются обратные ДПФ от квадрата модуля:rkp =2N −11 X p 2 2πi kn|S | e 2N ,2N n=0 nrkq =2N −11 X q 2 2πi kn|S | e 2N ,2N n=0 n−N ≤ k ≤ N − 1.Сложность ДПФ имеет порядок N log2 N. Количество операций суммирования в формуледля расчёта Jmin(P ) в теореме 3 обратно пропорционально P , поэтому после суммированияснова получаем порядка N log2 N операций.2.3.2Стационарная модель с целым периодом основного тонаРассмотрим класс стационарных моделей голосовых сигналов, в которых отсутствуетлинейный дрейф комплексных амплитуд.Пусть число P целое, ему соответствует частота F = N/P и подбирается стационарнаямодель сигналаsbt =M2Xk=M12πiAk e NF kt,−N/2 ≤ t ≤ N/2 − 1.Если P нечётное, P = 2M + 1, то в пределах суммирования M1 = −M и M2 = M.
Если Pчётное, P = 2M, то M1 = −M и M2 = M − 1. В обоих случаях количество элементов в суммеравно M2 − M1 + 1 = P .В работе [12] приведена формула расчёта целой оценки периода основного тона.Формально эту формулу можно вывести из оптимальной стационарной оценки периодаосновного тона при условии N → ∞ и F → ∞. Её погрешность становится пренебрежимо ма-70лой при N ≥ 128 и F ≥ 3.
Другими словами, если анализируемый сегмент сигнала содержитне менее трёх периодов, то формулой можно пользоваться, что было известно и ранее.Предположим, что F ≥ 3 или, что то же самое, P ≤ N/3. Тогда из графика на рис. 2.3следует, что rP0 (kF ) ≈ 0 при всех k 6= 0. Это значит, что предельная матрица ρP единичнаяиAAy →θ =Оценка комплексных амплитуд имеет видA0k8 1=3 N2N/2−1Xn=−N/2r3 0A.8N/2−18 1 X 2 − 2πi kF t,w t st e NSn P̄n (kF ) =3Nt=−N/2M1 ≤ k ≤ M2 ,а минимум функционала качества —sJmin=1NN/2−1Xt=−N/2(wt st )2 − (θA )∗ · y A =1NN/2−1Xt=−N/22N/2−1M2 XX1822− 2πikFt .(wt st ) −w t st e N3Nk=M1t=−N/2Далее повторяются те же рассуждения, что и для аффинной модели, в отношении ρPи κA .Минимум функционала качества можно привести к видуsJmin=где1 N∞Xcℓ =N/2−1Xt=−N/2(wt st )2 −pℓ+P j ,pt =(wt2 st , − N2 ≤ t ≤0,ℓ=0c2ℓ ,0 ≤ ℓ ≤ P − 1,j=−∞иP 8N 3P−1X|t| ≥N.2N2− 1,В терминах корреляционной функцииrkp =∞Xpt pt+k ,t=−∞k = 0, ±1, ±2, .
. .значение минимума функционала вычисляется какsJmin=1 NN/2−1Xt=−N/2[F ]X1 8p (wt st )2 −rnP.F 3n=−[F ]71Корреляционная функция rkp вычисляется при помощи двух ДПФ на 2N отсчётов:N/2−1Snp=X2πiwt2 st e− 2N nt ,0 ≤ n ≤ 2N − 1,t=−N/2rkp2N −11 X p 2 2πi kn|S | e 2N ,=2N n=0 n−N ≤ k ≤ N − 1.Корреляционная функция rkp не зависит от P и вычисляется один раз при сравнении показателей качества моделей с разными кандидатами на период основного тона P .Оценка дисперсии шума в модели измерений имеет видσbs2 =83 1−8 13 NsJmin.tr((ρP )−1 κA )Поскольку матрица ρP заменяется на единичную, то358P.tr((ρP )−1 κA ) = tr(κA ) = P W0N (0) =348Отсюдаσbs2 =где коэффициентs8 Jmin,3 1 − λFs35≈ 1.944418является горизонтальной асимптотой функции hs∞ (F ), причём в рассматриваемом диапазонеλs =F ≥ 3 аппроксимация этой функции асимптотой практически достаточно точная.В упомянутой статье [12] окно Ханнинга дополнительно нормируется:wt0=r8wt ,3−NN≤t≤− 1,22так чтобы сумма квадратов всех компонент окна была равна N.
Соответственно, корреляционная функция rk0 последовательности (wt0 )2 st приобретает множительrk0 28=rkp .3Оценка дисперсии шума получается равнойσbs2 (P )=PN/2−102t=−N/2 (wt st )−N−что совпадает с несмещённым критерием из [12].3518PNPP[F ]0n=−[F ] rP n,722.3.3Большой целый периодПусть число P целое, ему соответствует частота F = N/P и подбирается аффиннаямодель сигналаM2 X2πit 2πi F ktF ktNN,+ Bk eAk esbt =Nk=M−N/2 ≤ t ≤ N/2 − 1,1Если P нечётное, P = 2M + 1, то в пределах суммирования M1 = −M и M2 = M.















