Диссертация (1149825), страница 8
Текст из файла (страница 8)
Возможными сужениямиширины носителя для первого обертона будут 3T , 2T , T . Полностью соответствует идее (2.37) связывания длины носителя с частотой величина 2T .Для второго обертона возможно 2T и T . Однако T чересчур сильное сокращение (в 4 раза вместо 3). Поэтому останавливаемся на 2T .Для третьего и оставшихся обертонов — T .Требование последовательного включения носителей еще не окончательнофиксирует их расположение. Для фиксации места расположения носителей потребуем совпадение их середин, поскольку именно средней точки будет касаться48вся получаемая информация.Для построения носителя Se0 и единого носителя Sej для пары пробников синдексами 2j − 1 и 2j используем мультипликаторы Ξ(j):∩Sej = [−Ξ(j)T, Ξ(j)T − 1] Z,j = 0, ..., P.(2.38)Здесь Z — кольцо целых чисел.Обеспечение ортогональности пробников положим в основу выбора мультипликаторов:ПробникМультипликаторКонстантаΞ(0) = 2Основная гармоникаΞ(1) = 2Первый обертонΞ(2) = 1Второй обертонΞ(3) = 11Ξ(j) =2j = 4, ..., PТретий и последующие обертоныТабл.6.
Мультипликаторы пробников.Нетрудно заметить, что при таком выборе ширины и расположения носителей имеет место включение Sei ⊇ Sej∀i ≤ j и ширина каждого носителякратна периоду основной гармоники T .Введем обозначениеSe := (Se0 , ..., SeP ).(2.39)Определение 2.3. Под скалярным произведением пробников (2.10) будем пониматьvi (T, ·) · vj (T, ·) :=∑k=Sei∩eSjvi (T, k)vj (T, k).(2.40)Теорема 2.5. Пробники (2.10) на носителях (2.38) с мультипликаторами изтаблицы 6 взаимно ортогональны в смысле скалярного произведения (2.40),когдапериод() T основной гармоники является натуральным числом, большем 12πω1 =.
Скалярные квадраты пробников вычисляются по формуле (2.44).T49Д о к а з а т е л ь с т в о. По определению скалярного произведения (2.40)∑v0 · vi (T, ·) =vi (T, k) =k=Se0Ξ([ i+12 ])T −1∑=∩eSiл.2.1vi (T, k) = 0.(2.41)k=−Ξ([ i+12 ])TЗдесь для получения в последнем равенстве нуля использовалась лемма 2.1:) κT∑)((+m−1κT∑+m−12πµk2πµk+η =+η =0sincosTTk=mk=m[]i+1после придания ее параметрам следующих значений: µ =,2([])])([i+1i+1T, κ = 2Ξ(2.42)η = 0, m = −Ξ22Пусть j > i > 0, тогдаvi (T, ·) · vj (T, ·) =∑∩k=Sei Sejvi (T, k)vj (T, k) =Ξ([ j+12 ])T −1=∑vi (T, k)vj (T, k),(2.43)k=−Ξ([ j+12 ])Tгде под знаком суммы стоят либо смешанные произведения синусов на косинусы, либо только синусы или только косинусы, но с несовпадающими частотами. Поэтому возможно применить формулы (2.15, 2.16, 2.17), переводящиепроизведение в сумму синусов либо косинусов с частотами(i ± j)ω1 .
Ме-няем порядок суммирования.][ После] чего для одной суммы используем лем[j+1i+1−, а для другой используем лемму 2.1 сму 2.1 с µ =22[] []i+1j+1µ=+. Остальные соответствия параметров — согласно (2.42).22В итоге заключительное выражение в (2.43) равно 0, то есть vi ортогональноvj , если i ̸= j.Вычислим скалярные квадраты пробников:∑vi (T, ·) · vi (T, ·) =vi (T, k)vi (T, k) =k∈Sei50 4T,∑i = 0;2=vi (T, k) = Ξ ([ i+1 ]) T, i = 1, ..., 2P.i+12k=−Ξ([ 2 ])TΞ([ i+12 ])T −1(2.44)2В силу этого теоремы 2.1, 2.2, 2.3 и 2.4 можно переформулировать следующим образом.e v), где qbm из (2.19), Se изТеорема 2.6.
Для того, чтобы критерий qbm (z, T, S,(2.39), при фиксированном целочисленном периоде T основной гармоники и собертонами из (1.5) был строго выпуклым для всех m и имел единственныйминимум по z (см. (2.7)) независимо от входного сигнала W , достаточно,чтобы 2K = Ξ(0)T , где Ξ(0) из таблицы 6.Доказательство аналогично доказательству теоремы 2.1.Теорема 2.7. Условий теоремы 2.6 достаточно, чтобы решение системыe v) = 0gradz qbm (z, T, S,было минимайзером по z критерия qbm из (2.19) при втором аргументе из(2.39).Теорема 2.8. Для того, чтобы решение δ ∗ системыe =0gradδ gm (δ, S)было минимайзером по δ критерия gm с учетом (2.24), (2.38), (2.10) при фиксированной фундаментальной частоте ω1 и с обертонами из (1.5), достаточно, чтобы 2K = Ξ(0)T , где Ξ(0) из таблицы 6. При этом минимайзерe v) (bz ∗ критерия qbm (z, T, S,qm из (2.19), Se из (2.39)) доставляется формулойz ∗ := T (δ ∗ ) (см.
2.22).Теорема 2.9. Пусть входной сигнал имеет вид (2.23), аппроксиматор имеет вид (2.24), критерием качества аппроксимации выбрана целевая функция51(2.25), взяты пробники (2.10) на носителях (2.38) и пусть при фиксированных ω в (2.24) и K в (2.25) для каждого m найден минимайзер δ ∗ (m) целевойфункции. Тогда для того, чтобы его составляющие δ0∗ и ρ∗i (m), i = 1, ..., P ,не зависели от m, достаточно, чтобы периоды основных гармоник входногосигнала и аппроксиматора совпадали: T = T ′ и 2K = Ξ(0)T , где Ξ(0) изтаблицы 6.
Причем фазовые компоненты минимайзера имеют зависимостьот m вида θi∗ = Ωi m + Θi , i = 1, ..., P .§2.4. Последовательная оптимизацияПусть входной сигнал, аппроксиматор и критерий качества описаны, соответственно, формулами (2.23), (2.24), (2.25). Минимизация выбранного критериякачества в последовательные моменты m осуществляется по 3P +1 переменной:фундаментальной частоте ω1 (m), обертонам ω2 (m), ..., ω (m),Pпостоянной составляющей δ0 (m),амплитудным составляющим ρ1 (m), ..., ρ (m)Pфазовым составляющим θ1 (m), ..., θ (m).PСвязь (2.33) фундаментальной частоты с обертонами снижает количествопеременных оптимизации до 2P + 2.
Таким образом, для каждого m-го сэмплавходного цифрового сигнала требуется найти фундаментальную частоту ω1 (m)и компоненты вектораδ(m) = (δ0 (m), ρ1 (m), θ1 (m), ..., ρ (m), θ (m)).PPВ монозвуке человек не различает фаз гармоник, а также постоянную составляющую звукового давления, как уже говорилось в §1.2. Поэтому в набореδ(m) для дальнейшего синтеза потребуется только составляющие с нечетнымииндексами (ρ1 (m), ..., ρ (m)).
Однако для построения полноценной аппроксимаPции и фазы, и постоянную составляющую придется вычислять.Классический градиентный спуск сразу по 2P + 2 переменным плохо под-52ходит для минимизации критерия (2.25). В частности, по той причине, что окно просмотра должно быть кратно периоду основной гармоники T (m). И, сдругой стороны, при фиксированной частоте основной гармоники вычислениеусловного многомерного минимума по переменным z производится элементарно и неитеративно. Поэтому здесь для оптимизации предлагается своего родасинтез градиентного (по z) и покоординатного (по T ) спусков.2.4.1.
Переход к оптимизации по периодамС точки зрения чистой математики, оптимизация по частотам эквивалентна оптимизации по соответствующим периодам. Однако в программной реализациипоявляется некоторая разница в пользу периодов, вызванная возможностью вести поиск оптимума на целочисленной сетке.А именно. В [3] говорится, что человек не замечает разницы в частотах,если они отличаются менее чем на 4%. Относительная чувствительность частотного восприятия возрастает по мере увеличения частоты, достигая на 1000Гц 0,3% и сохраняя такое отношение на всем частотном диапазоне слышимости[8]. Таким образом, при итеративной поиске оптимума по частотам минимальный шаг смещения можно назначить равным 3 Гц.
И какую бы начальнуючастоту ни взять, сетка частот не отобразится взаимнооднозначно на целочисленную сетку периодов. Поэтому условие кратности количества узлов в окнепросмотра периоду основной гармоники, требуемое в теореме 2.4, не будет выполнено. Что приведет к вредной зависимости амплитуд гармоник от текущихфаз.
Оптимизация по периодам на целочисленной сетке таким недостатком необладает.Для конкретной частоты дискретизации ωdiscr (она в явном виде задаетсяв WAV-файле) легко рассчитать по диапазону [ωmin , ωmax ] фундаментальныхчастот соответствующий диапазон целочисленных периодов [Tmin , Tmax ]:⌊⌋⌈⌉ωdiscrωdiscrTmin =, Tmax =(2.45)ωmaxωmin53и искать период основной гармоники T (n) в нем.Здесь “⌊·⌋” и “⌈·⌉” — операции выделения целой части вещественногочисла.
Так, если γ — вещественное число, zγ — такое целое число, чтоzγ < γ < zγ + 1, то⌊γ⌋ = zγ ,⌈γ⌉ = zγ + 1,⌊zγ ⌋ = ⌈zγ ⌉ = zγ .На стр. 16 указывались диапазоны фундаментальных частот мужского иженского голосов — 85 ÷ 155 Гц и 165 ÷ 255 Гц, соответственно. На наиболеераспространенной частоте дискретизации 44100 Гц соответствующие диапазоныпериодов будут от 280 до 520 отсечек и от 140 до 260 отсечек. Наибольшее44100частотное изменение при переходе от одной отсечки к соседней составит−14044100≈ 2.234 Гц. Следовательно, частотное изменение при изменении периода141на 1 будет не воспринято человеком.2.4.2.
Градиентный спуск для фиксированного периодаВозьмем пробники (2.10) на носителях (2.38), в которых мультипликаторыΞ(j), j = 0, ..., P , взяты из таблицы 6. Согласно теореме 2.5 такой выбор обеспечивает взаимную ортогональность пробников. А это означает, что в критеe v) матрица квадратичной формы fb 2 положительно определенарии qbm (z, T, S,и имеет диагональный вид (см. доказательство теоремы 2.1). В силу теоремы2.6 данный выбор дает единственный минимайзер z ∗ .
Его компоненты легковычисляются:zi∗=Ξ1([ i+1 ])2∑TW (m + k)vi (T, k),i = 0, ..., 2P.(2.46)k∈Se[ i+12 ]Затем вычисляется значение критерия для этого минимайзера:e v).qbm (z ∗ , T, S,542.4.3. Минимизация вычислительной погрешности при градиентнойоптимизации для фиксированного периодаРасчет синусно-косинусных амплитуд непосредственно по формуле (2.46) может приводить к большим вычислительным погрешностям. Это обнаруживается легкозамечаемой взаимосвязью между частотой и амплитудой: низкочастотная составляющая имеет большую амплитуду, а высокочастотная — малую.Такое же вредное влияние оказывает на точность в определении амплитуд гармоник постоянная составляющая.Указанное осложнение можно ослабить следующим образом.1. После нахождения постоянной составляющей согласно формуле (2.46)она вычитается из входного сигнала:c1 (k) = W (m + k) − z0 ∗ 1,Wk ∈ Se1 .2.