Диссертация (Быстрые алгоритмы оценки параметров полигармонической модели голосового сигнала), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Быстрые алгоритмы оценки параметров полигармонической модели голосового сигнала". PDF-файл из архива "Быстрые алгоритмы оценки параметров полигармонической модели голосового сигнала", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Под знаком следа матрицы можно циклически переставлять. Поэтому−1tr(ρ−1 κ) = tr((γR∞ γ)−1 γW∞ γ) = tr(R∞W∞ ).Предел из предположения 1 обозначим S. Тогда ввиду асимптотической линейностифункции M(N)lim tr(R−1 W ) = 2dS,N →∞По лемме 5EJmin = σ23+ tr(R−1 W )8lim h(F,M) =N →∞8S.33 2= σ 1 − (2d)h(F,M) + o(1)8при N → ∞, что соответствует заключению леммы.59Noise gain functions1κ0Im(κ1)0.8κ20.60.40.20−0.2−0.4−5−4−3−2−10f12345Рисунок 2.5 — Функции первых столбцов тёплицевых подматриц матрицы κ.2.2.3Критерий оценки периода основного тона по эмпирическойдисперсии шумаСогласно лемме 7, усреднённый показатель точности оптимальной по МНК моделиопределяется функцией h(F, M), зависящей от частоты основного тона F , выраженной вколичестве периодов модели голосового сигнала на анализируемом отрезке времени, и отколичества M гармоник в этой модели.Функция h(F,M) слабо зависит от M. На рис.
2.6 показаны графики этой функции отF при фиксированных M = 10 и M = 100. При M > 100 различия на графиках в данноммасштабе не видны.Предположение 2. При заданной функции M = M(N) для каждого F , для которого определена функция h(F,M), существует пределlim h(F, M) = h∞ (F ).N →∞При выполнении предположений 1 и 2EJmin3 22M + 1= σ 1−h∞ (F ) + o(1)8N(N → ∞).Коэффициент (2M + 1)/N равен отношению количества гармоник в модели к общемуколичеству измерений, по которым идёт настройка.
Если в модель входят все гармоники,вплоть до частоты Найквиста, то M есть целая часть от P/2, где P — период основного60Function of noise attenuation3.2M=10M=1003.13h(F, M)2.92.82.72.62.52.533.544.55Fundamental frequency, in samples of spectrum5.56Рисунок 2.6 — Функция h(F, M) при M = 10 и при M = 100.тона. Поэтому 2M+1 ≈ P .
Поскольку F P = N, то2M + 1P1≈= ,NNFи при фиксированном F величина M асимптотически линейно зависит от N и выполненоусловие леммы 7. Практически это означает фиксированный промежуток времени, но различную, сколь угодно большую частоту дискретизации.Теорема 2. Пусть заданы числа N — количество отсчётов измеряемого сигнала и вещественное число P из промежутка от 2 до 2N/5.N/2−1Рассмотрим голосовой сигнал s = (st )t=−N/2 , имеющий видM X2πit 2πi F ktFktak e Nst =+ vt ,+ bk e NNk=−M−N/2 ≤ t ≤ N/2 − 1,где F > 2 - количество периодов сигнала на выбранном промежутке времени, N - количество отсчётов, на этом промежутке времени, записанных с некоторой выбранной частотой дискретизации, P = N/F - количество отсчётов в одном периоде, M = [P/2] целаячасть от P/2, равная количеству вещественных гармоник в сигнале вплоть до частотыMНайквиста, a = (ak )Mk=−M и b = (bk )k=−M - комплексные амплитуды гармоник с учётомлинейного дрейфа, а vt — белый шум с дисперсией σ 2 .Амплитуды гармоник оцениваются по МНК с функционалом качестваN/2−11 XJ(A, B) =|wt (st − sbt )|2 ,Nt=−N/261где (wt ) — окно Ханнинга, оценка сигнала задаётся формулойM X2πit 2πi F ktFktAk e N,+ Bk e Nsbt =Nk=−M−N/2 ≤ t ≤ N/2 − 1,Mс настраиваемыми векторами коэффициентов A = (Ak )Mk=−M и B = (Bk )k=−M .Пусть выполнены предположения 1 и 2.
Тогда математическое ожидание минимумафункционала качества асимптотически равноEJmin3 2h∞ (F )+ o(1)= σ 1−8F(N → ∞).Данное утверждение можно использовать для сравнения качества различных моделей,отличающихся только количеством F периодов в выбранном промежутке времени.Следствие 2. Пусть выполнены условия теоремы 2, в частности, фиксировано число F вуравнениях сигнала и модели. Тогда величинаσb2 =8Jmin3 1 − h∞ (F )Fявляется асимптотически несмещённой оценкой дисперсии белого шума в сигнале.Рассмотрим следующую стандартную статистическую задачу. Задан набор чисел(ck )nk=1 .
Требуется найти гауссовское распределение, для которого плотность вероятностив этом наборе чисел при независимых испытаниях максимальна. По методу максимума правдоподобия ответом является плотность, у которой эмпирическая дисперсия минимальна.По аналогии с этой статистической задачей определим оценку периода основного тонаиз условия минимума показателя σb2 (P ). Полученное аналитическое выражение для σb2 позво-ляет применять градиентные методы минимизации функционала, например, метод Ньютона.График множителяH(F ) =приведён на рис. 2.7.11−h∞ (F )FИз этого графика видно, что значения частоты основного тона, близкие к 2.5, имеютслишком большой весовой множитель и поэтому могут быть исключены в процессе оптимизации величины σb.На интервале F ∈ [2.8, 3.6] функцию h∞ (F ) можно приблизить многочленомh∞ (F ) ≈ −2.1967 + 2.8434 · F − 0.3863 · F 2 ,2.8 ≤ F ≤ 3.6.При F ≥ 3.6 достаточно хорошим приближением является константа h∞ (F ) = 3.034.623503002502001501005002.533.544.555.56FРисунок 2.7 — Множитель при Jmin (F ).2.2.4Стационарная аппроксимацияСтационарная модель является упрощением аффинной модели с Bk = 0 при всех k.
Прификсированной длине сигнала N и периоде основного тона P гипотезой является уравнениеst =MX2πiak e NF kt+ vt ,−N/2 ≤ t ≤ N/2 − 1,k=−Mгде M есть целая часть от P/2, F = N/P — частота основного тона в отсчётах спектра,2a = (ak )Mk=−M — вектор комплексных амплитуд гармоник, vt — белый шум с дисперсией σ .Вектор a оценивается по МНК с функционалом качестваN/2−11 XJ (A) =|wt (st − sbt )|2 ,Nst=−N/2где (wt ) — окно Ханнинга, а оценка сигнала задаётся формулойsbt =MX2πiAk e NF kt,k=−M−N/2 ≤ t ≤ N/2 − 1,с настраиваемым вектором коэффициентов A = (Ak )Mk=−M .В прежних обозначениях оптимальный вектор параметров A0 определяется следующимобразом:0A =r8 Aθ ,3θA = (ρP )−1 y A ,63Function of noise attenuation.
Stationary model.1.95M=10M=1001.91.851.8hs(F, M)1.751.71.651.61.551.51.522.53Fundamental frequency, in samples of spectrum3.54Рисунок 2.8 — Функция hs (F, M) при M = 10 и при M = 100.где ρP = (ρPkm )Mk,m=−M — симметричная тёплицева матрица с элементамиρPkm =8 0r ((m−k)F ),3 Pа вектор y A = (ykA )Mk=−M определяется равенствомN/2−1ykA=Xn=−N/2Sn p̄0∞ (kF − n).Минимальное значение функционала качества равноsJminN/2−11 X 2 2wt st − (θA )∗ y A .=Nt=−N/2В рамках принятой гипотезы с белым шумом измерения vt математическое ожиданиеминимума функционала качества асимптотически равноsEJmin3 2hs∞ (F )= σ 1−.8FФункция hs∞ (F ) является предельным значением функцииhs (F,M) =8 tr((ρP )−1 κA ).32M + 1Графики функций hs (F, M) при фиксированных M = 10 и M = 100 показаны на рис.2.8.
Они близки к предельной функции hs∞ (F ).647060504030201001.522.533.54FsРисунок 2.9 — Множитель при Jmin(F ).На интервале F ∈ [1.6, 3.0] функцию hs∞ (F ) можно приблизить многочленомhs∞ (F ) ≈ −1.2635 + 3.0399 · F − 0.9621 · F 2 + 0.1018 · F 3 ,1.6 ≤ F ≤ 3.При F ≥ 3 достаточно хорошим приближением является константа hs∞ (F ) = 1.9444.Оценка дисперсии шума измерения определяется какГрафик множителяσbs2 =sJmin8.3 1 − hs∞ (F )FH s (F ) =представлен на рис. 2.9.11−hs∞ (F )FИз этого графика видно, что значения частоты основного тона, близкие к 1.5, имеютслишком большой весовой множитель и поэтому могут быть исключены в процессе оптимизации величины σbs .Отметим, что стационарные оценки можно эффективно вычислять на коротких отрез-ках голосового сигнала, содержащих немного более 1.5 периодов.Для иллюстрации рассмотрим сигнал на нижнем графике рис. 2.10.
На верхнем графи-ке показаны функции α Jmin (F ) и σb2 (F ), где α — масштабирующий коэффициент. Миниму-мы этих функций достигаются при разных F и значение F0 = 2.08 правильное. Из нижнегографика видно, что множитель Hs (F ) играет существенную роль при переходе от критерияМНК α Jmin(F ) к ”несмещённому критерию оценки периода основного тона” по функционалуσb2 (F ).654×10 -432σ2 (F)Jmin (F)101.522.53F=N/P0.10.050-0.05-0.10200400600800100012001400Рисунок 2.10 — Нижний график: сигнал, содержащий F0 = 2.08 периода. Верхний график:2.3sнормированная функция Jmin(F ) и функция σb2 (F ).Вычисление показателей качества для целых значений периодаПри решении задач оптимизации вычислений число N отсчётов сигнала фиксировано.Поэтому величины F и P = N/F связаны однозначно. Традиционно перебор производитсяна сетке отсчётов периодов основного тона P .