Автореферат (1149824), страница 2
Текст из файла (страница 2)
При этом функции xi (t), yi (t) должныиметь относительную скорость изменения значительно меньшую, чем частоты гармоник ωi (t): ẋ0 (t) ẋi (t) ẏi (t) x0 (t) ≪ ω1 (t), xi (t) ≪ ωi (t), yi (t) ≪ ωi (t).При подходящем выборе критерия качества аппроксимации оптимизация по нему аппроксиматора (3) приведет к√√22ωi (t) ≈ Ωi (t), ρi (t) := xi (t) + yi (t) ≈ a2i (t) + b2i (t), i = 1, P , x0 (t) ≈ a0 (t).В работе используется существенно облегчающее анализ входного аудиопотока свойствочеловеческой речи. А именно связь частот в (1): Ωi = iΩ1 ,i = 2, P1 , где P1 ≤ P и Ω1является фундаментальной частотой. Соответственно, для аппроксиматора (3)ωi = iω1 ,i = 2, P1 .(4)Далее приводятся два преобразования, распространенных в цифровой обработке сигналов, — преобразование Фурье и вейвлетное преобразование — и показывается, почему они неподходят для решения исходной задачи.В главе 2 описывается новый алгоритм анализа цифрового аудиопотока.
Для этогоразработаны частотно-амплитудный детектор и критерий качества оптимизации по периодам.Медленно меняющиеся величины a0 (t) и x0 (t) не различимы человеком. То же верно идля фаз Φi (t). Поэтому в (3) фазовые отклонения отсутствуют, а x0 (t) вводится для улучшениякачества аппроксимации.6Знание параметров-функций xi , yi , ωi в аппроксиматоре (3) позволяет решать поставленную задачу изменения темпа воспроизведения с сохранением исходного тембра.Введение глобального критерия качества на всем входном цифровом потоке для аппроксиматора (3), например, по методу наименьших квадратов приводит к неоправданно сложнойв вычислительном плане задаче его минимизации по функциям x, y, ω.
Поэтому вместо этого предлагается перейти к минимизации последовательности локальных критериев качестваqm , m = K, ..., N − K − 1, в прямоугольных окнах ширины 2K, центрированных относительнотекущего m-го сэмпла с фиксированными в каждом таком окне фундаментальной частотой икосинусно-синусными амплитудами обертонов в аппроксиматореfe(x, y, ω, m, k) = x0 (m) +P∑xi (m) cos(ωi (m)k) + yi (m) sin(ωi (m)k),(5)i=1qm (x, y, ω, K) :=K−11 ∑(W (m + k) − fe(x, y, ω, m, k))2 ,K k=−K(6)где k = −K, K − 1, x0 (m), ..., xP (m), y1 (m), ..., yP (m), ω1 (m), ..., ωP (m) — переменные в задаче минимизации локального критерия качества на m-м шаге.
Алгоритм, решающий задачу(5)+(6), является частотно-амплитудным детектором для сигнала (1) в отсечках m = 1, 2, ...В диссертации вводятся определения 1, 2.2π. Назовем пробниками (частоты ω) нижеследующие функцииωс конечными носителями Sj ⊂ Z (Z — кольцо целых чисел):v0 (T, k) ≡ 1, k ∈ S0v2j−1 (T, k) = cos(jωk)(7)k ∈ Sj , j = 1, ..., Pv2j (T, k) = sin(jωk) v (T, k) = 0,k∈/ S , j = 0, ..., P Определение 1. Пусть T =jjпри этом целые числа в Sj расположены без пропусков, то есть(k ′ , k ′′ ∈ Sj∧k ′ ≤ k ≤ k ′′ ) =⇒ k ∈ Sj .Из пробников (7) составим вектор пробников v = (v0 , v1 , ..., v2P )T .Самый простой способ задания носителей пробников — с постоянной длиной:Sj (T ) = {−K(T ), ..., K(T ) − 1},j = 0, ..., P,K(T ) = const.(8)Определение 2.
Зададим скалярное произведение на пространстве FZ вещественных функций,∑заданных на множестве целых чисел, следующим образом: v·w = ∞k=−∞ v(k)w(k) ∀v, w ∈ FZ .72π, тоω1пробники из определения 1 с носителями (8) взаимно ортогональны и их скалярные квадратыДоказано, что если K(T ) := KTкратно периоду основной гармоники T =легко вычислимы:vi · vj = 0,v0 · v0 = 2KT ,v i · vi = K T ,i, j = 1, ..., 2P,i ̸= j.(9)Если все носители пробников одинаковы и выбраны согласно (8), то упрощение аппроксиматора (5) принимает видfb(z, k, T, v) =2P∑zi vi (T, k) = z · v(T, k), k ∈ {−K(T ), ..., K(T ) − 1},(10)i=0гдеz = (x0 , x1 , y1 , ..., xP , yP )T ,(11)а локальный критерий качества (6) —b v) :=qbm (z, T, S,1K(T )∑K(T )−1(W (m + k) − fb 2 (z, k, T, v)).(12)k=−K(T )В диссертации доказанаТеорема 1. Для того, чтобы критерий qbm из (12) с учетом (10), (8), (7) при фиксированномцелочисленном периоде T основной гармоники и с обертонами из (4) был строго выпуклымдля всех m и имел единственный минимум по z (см.
(11)) независимо от входного сигналаW , достаточно, чтобы 2K(T ) было кратно T .Проведем исследование натурального звукоряда, то есть сигнала видаW (m) = a0 +P∑ai cos(Ωi m) + bi sin(Ωi m).(13)i=1С этой целью выразим скомпонованные в переменные z (см. (11)) переменные x, y функции fe в (5) через переменные δ = (δ0 , ρ1 , θ1 , ..., ρP , θP ) преобразованием T :z2i−1 = xi = ρi cos θi , i = 1, P , z0 = x0 = δ0 .z = T (δ) ⇐⇒z = y = ρ sin θ2iii(14)iЭтим же преобразованием перейдем от параметров Z = (a0 , a1 , b1 , ..., aP , bP ) входногосигнала (13) к параметрам Υ = (Υ0 , r1 , Θ1 , ..., rP , ΘP ):a0 = Υ0 , ai = ri cos Θi , bi = ri sin Θi , i = 1, ..., P,то есть Z = T (Υ).8Тогда натуральный звукоряд (13), аппроксиматор (5) и критерий качества (6) станут,соответственно, такими:W (m) = Υ0 +P∑ri sin(Ωi m + Θi ),(15)i=1h(δ, m) = δ0 +P∑ρi sin(ωi m + θi ),(16)(W (m + k) − h(δ, k))2 ,(17)i=1b := 1gm (δ, S)KK−1∑k=−K′где Ωi = 2πi/T, ωi = 2πi/T , i = 1, ..., P, T — целочисленный период основной гармоникивходного сигнала, T ′ — целочисленный период основной гармоники аппроксиматора.В диссертации доказаны теоремы 2, 3.b = 0 было минимайзеромТеорема 2.
Для того, чтобы решение δ ∗ системы gradδ gm (δ, S)по δ критерия gm с учетом (16), (15), (8), (7) при фиксированной фундаментальной частотеω1 и с обертонами из (4), достаточно, чтобы 2K было кратно периоду основной гармоники.При этом минимайзер z ∗ критерия qbm доставляется формулой z ∗ := T (δ ∗ ).Теорема 3. Пусть входной сигнал является натуральным звукорядом вида (15), аппроксиматор имеет вид (16), критерием качества аппроксимации выбрана целевая функция (17), взяты пробники (7) на носителях (8) и пусть при фиксированных ω, K для каждого m найден ееминимайзер δ ∗ (m). Тогда для того, чтобы его составляющие δ0∗ и ρ∗i (m), i = 1, ..., P , не зависели от m, достаточно, чтобы периоды основных гармоник входного сигнала и аппроксиматорасовпадали: T = T ′ и 2K — ширина окна — была кратна периоду основной гармоники.
Причемфазовые компоненты минимайзера имеют зависимость от m вида θi∗ = Ωi m+Θi , i = 1, ..., P .Характерной чертой речи является увеличение скорости изменения амплитуд гармоникс ростом их частот. Поэтому качество частотно-амплитудного детектора улучшается укорачиванием носителя пробника пропорционально увеличению частоты. Для построения носителяSe0 и единого носителя Sej для пары пробников с индексами 2j − 1 и 2j используем мультипликаторы Ξ(j):∩Sej = [−Ξ(j)T, Ξ(j)T − 1] Z,9j = 0, ..., P,(18)ПробникМультипликаторКонстантаΞ(0) = 2Основная гармоникаΞ(1) = 2Первый обертонΞ(2) = 1Второй обертонΞ(3) = 11Ξ(j) =2j = 4, ..., PТретий и последующие обертоныТабл.1.
Мультипликаторы пробников.Введем обозначениеSe := (Se0 , ..., SeP ).(19)В диссертации вводитсяОпределение 3. Под скалярным произведением пробников (7) будем пониматьvi (T, ·) · vj (T, ·) :=∑ejei ∩ Sk=Svi (T, k)vj (T, k).(20)В диссертации доказаны теоремы 4-8.Теорема 4. Пробники (7) на носителях (18) с мультипликаторами из таблицы 1 взаимно ортогональны в смысле скалярного произведения(20),() когда период T основной гармоники2πявляется натуральным числом, большем 1 ω1 =.
Скалярные квадраты пробников выTчисляются по формулеΞ([ i+1T −12 ]) 4T,∑∑i = 0;2vi (T, k) =vi (T, ·) · vi (T, ·) =vi (T, k)vi (T, k) =([]) Ξ i+1 T, i = 1, ..., 2P.ei2k∈Sk=−Ξ([ i+1T2 ])Здесь “[·]” — операция выделения целой части вещественного числа. Так, если γ — вещественное число, zγ — такое целое число, что zγ < γ < zγ + 1, то [γ] = zγ .e v), где qbm из (12), Se из (19), при фиксиТеорема 5. Для того, чтобы критерий qbm (z, T, S,рованном целочисленном периоде T основной гармоники и с обертонами из (4) был строговыпуклым для всех m и имел единственный минимум по z (см. (11)) независимо от входногосигнала W , достаточно, чтобы 2K = Ξ(0)T , где Ξ(0) из таблицы 1.e v) = 0Теорема 6.
Условий теоремы 5 достаточно, чтобы решение системы gradz qbm (z, T, S,было минимайзером по z критерия qbm из (12) при втором аргументе из (19).10e = 0 было минимайзеромТеорема 7. Для того, чтобы решение δ ∗ системы gradδ gm (δ, S)по δ критерия gm с учетом (16), (18), (7) при фиксированной фундаментальной частотеω1 и с обертонами из (4), достаточно, чтобы 2K = Ξ(0)T , где Ξ(0) из таблицы 1. Приe v) (bэтом минимайзер z ∗ критерия qbm (z, T, S,qm из (12), Se из (19)) доставляется формулойz ∗ := T (δ ∗ ) (см. 14).Теорема 8.
Пусть натуральный звукоряд имеет вид (15), аппроксиматор имеет вид (16),критерием качества аппроксимации выбрана целевая функция (17), взяты пробники (7) на носителях (18) и пусть при фиксированных ω в (16) и K в (17) для каждого m найден минимайзер δ ∗ (m) целевой функции. Тогда для того, чтобы его составляющие δ0∗ и ρ∗i (m), i = 1, ..., P ,не зависели от m, достаточно, чтобы периоды основных гармоник входного сигнала и аппроксиматора совпадали: T = T ′ и 2K = Ξ(0)T , где Ξ(0) из таблицы 1. Причем фазовыекомпоненты минимайзера имеют зависимость от m вида θi∗ = Ωi m + Θi , i = 1, ..., P .Для конкретной частоты дискретизации ωdiscr (она в явном виде задается в WAV-файле)легко рассчитать по диапазону [ωmin , ωmax ] фундаментальных частот соответствующий диапа⌊⌋⌈⌉ωdiscrзон целочисленных периодов [Tmin , Tmax ]: Tmin = ωωdiscr,T=и искать периодmaxωminmaxосновной гармоники T (n) в нем.Здесь “⌊·⌋” и “⌈·⌉” — операции выделения целой части вещественного числа.