Маковеева М.М., Шинаков Ю.С. Системы связи с подвижными объектами (2002) (1151874), страница 9
Текст из файла (страница 9)
Поэтому в дальнейшем будем обозначать речевой сигнал У((). Го < ( < (з + Т, если речь идет о речевом сигнале как о случайном процессе. Подчеркнем, что три разных обозначения, введенные выше, в дальнейшем будут активно использоваться. Итак, мы вынуждены признать, что речевой сигнал математически можно описать только как случайный процесс. Математическое описание или математическая модель этого сигнала необходимы дпя того, чтобы наилучшим способом (с максимально необходимым качеством при минимально возможных требованиях к оборудованию передачи) передавать зти сигналы в системах и сетях связи с подвижными объектами. Мы полагаем, что общие способы описания случайного процесса читателю знакомы, например, в объемах учебников «1, 2).
В [1] также можно найти некоторые начальные сведения о речевом сигнале как о случайном процессе. В этом параграфе приведем дополнительные сведения о вероятностных х рактеристиках речевых сигналов, которые являются необходимым для правильного понимания принципов передачи этого одного з важнейших сигналов в системах связи с подвижными объекта На рис.2.1,а и б соответственно приведены типичные реализации речевого сигнала дпя двух частных случаев: при произнесении гласного звука Я (вокапизованная речь, гласный звук, для этого фрагмента примем обозначение Г) и при произнесении шипящего звука Ш (невокализованная речь, согласный звук, для этого фрагмента принимаем обозначение С).
Масштаб времени по оси абсцисс на этих рисунках одинаков, длительность интервала наблюдения составляет 20 мс. Визуальное сравнение этих реализаций позволяет сделать следующий вывод: разные звуки представляются реализациями речевого сигнала, скорость изменения мгновенных значений которых может существенно различаться. шипящие звуки представляются реализациями с быстрыми изменениями мгновенных значений, гласные звуки — более гладкими реализациями.
4? 1 э) Рис. 2.1. Реализации речевого сигнала дпя гласных и согласных звуков: э — фрагмент реализации звука Я; б- фрагмент реализации звука Ш На рис. 2.2 приведена реализация речевого сигнала при произнесении фразы ««На трех китах». Длительность интервала наблюдения здесь составляет 1044 мс. Этот рисунок иллюстрирует еще одну особенность речевого сигнала — наличие пауз в разговоре представляется нулевыми отрезками в реализации речевого сигнала.
6 действительности обычно речевой сигнал формируется при наличии фонового акустического шума, который также приходится описывать как случайный процесс, дисперсия которого, однако; значительно меньше дисперсии речевого сигнала. Реализация фразы <На трех китах» произнесена при наличии окружающего акустического шума.
Таким образом, на интервалах наблюдения достаточно большой длительности реализации речевого сигнала состоят из сегментов (отрезков) активной речи и пауз или фонового шума. Отмеченные три особенности реализаций речевого сигнала оказываются важными для экономного и эффективного представления речевого сигнала при его передаче по современным цифровым системам и сетям передачи. Практическое использование этих особенностей будет проиллюстрировано в этой главе далее. Описание речевого сигнала как случайного процесса фактически означает построение вероятностной модели этого процесса.
Рис.2.2. Реализации речевого сигнала при наличии сегментов активной речи и пауз Задача построения данной модели является очень важной как дпя теории, так и для техники передачи таких сигналов по цифровым системам передачи. Несмотря на то, что к настоящему времени имеется много вариантов решений, эта задача остается актуальной и в настоящее время. Здесь мы ограничимся только некоторыми полезными результатами, которые будут использованы в последующих разделах книги. Для читателя, желающего более глубоко ознакомиться с имеющимися результатами и их использованием в технике систем связи с подвижными обьектами можно рекомендовать ~З1. Наиболее точной математической моделью речевого сигнала является нестационарный случайный гроцесс с меняющимися во времени дисперсией и формой спектральной плотности мощности.
Такая модель обеспечивает возможность построения наиболее эффективных систем передачи этих сигналов. Однако и эта модель и получающиеся наилучшие системы передачи оказывакл.ся технически достаточно сложными даже для современных возможностей цифровой микропроцессорной техники.
Поэто у современные системы передачи построены на основе более и стой и менее точной вероятностной модели речевого сигнала ка стационарного случайного сигнала. В этом случае приходится граничиваться вероятностными характеристиками сигнала, которые являются фактически усредненными характеристиками нестационарной модели. Второе существенное упрощение модели речевого сигнала состоит в том, что стационарный процесс, выбираемый в качестве модели этого сигнала, принимается гауссовским, хотя на самом деле это не так. Зто вынужденное решение принято потому, что только для гауссовских процессов удалось найти эффективные решения многих задач экономного цифрового представления и передачи.
Известно (1, 2), что вероятностная модель стационарного гауссовского процесса Ц~) полностью определяется его математическим ожиданием лг~ = ')эРЧпг,Ыэ, = ~ФФ4 и ковариационной функцией (2.1] ~ [и~ — гпд[пм — ггЧ)ИI(или~~,!,(+ т)г[игг(пм, — о я[т), Здесь введено несколько важных обсоначений, на которые обязательно следует обратить внимание: Щи,т) — одномерная плотность вероятности случайного процесса У([) для момента времени [; Иг(ць и„;, б [+т) -двумерная плотность вероятности значений этого процесса для двух моментов времени ( и [+ т; Я(т) — коэффициент корреляции или нормированная ковариационная функция этого процесса; о~ — дисперсия процесса. Для стационарного процесса зти функции не зависят от времени, т.е.
и'( гч) г з ехр~ ~ ~ игМ) 1 Г(О, Ю,)23 у2ко~ 2о (2.3) ИГ(ипи„;,б[+т)= --...... ех - к 1 „1 1 2„, „г[1 [~г(,)) [,2о'[1-)т'(т)1 к[(иг-гпг) -йт)М-М(ц„-гпз)1.М,.-пь) к. г 3)[ (2.4) Совместная плотность вероятности гауссовского процесса для трех, четырех и так далее моментов времени также может быть записана в виде формулы, аналогичной (2.4), если известны математическое ожидание м, и ковариационная функция К(т). Последовательность таких многомерных распределений и является полной вероятностной моделью процесса.
Зная эти распределения (любой размерности[), можно решить любую задачу, в которой приходится рассматривать этот случайный процесс. Для речевого сигнала практически всегда можно принять, что математическое ожидание равно нулю, поскольку полезная информация речи содержится в отклонениях разного знака акустического давления от его среднего значения, так что электрический сигнал, получаемый в результате преобразования этого давления, обычно имеет среднее значение, равное нулю. Поэтому для процесса (ф) в дальнейшем будем полагать, что м, =— О на всем интервале наблюдения.
Тогда единственной функцией, которая полностью определяет математическую модель речевого сигнала, является ковариационная функция К(т). Ковариационная функция характеризует скорость изменения мгновенных значений процесса во времени. Поэтому эта функция дает описание процесса во временной области. В теории и технике передачи сообщений широко используется описание сигналов и в частотной области. Основной характеристикой любого случайного процесса в частотной области является спектральная плотность мощности, которую можно определить как прямое преобразование Фурье ковариационной функции.
+й + Э Я(и» = ~к(т)е 1з<пгтт = п~ ~й(т)е тз~'г(п -<э < Г <+со. (2.5) Справедливо и обратное преобразование Фурье дпя этой пары функций: +'Ф К(т) = ~5(Г)ея"ег)Г, - о <Г <+со. (2.6) И/(а) = ' ехр — ' + '; ех (2. 7) а = 1,56а, ад = 0,15а, 51 Ыз последних двух равенств спедует, что спектрапьная плотность мощности также дает полное вероятностное описание гауссовского случайного процесса, поскольку позволяет найти ковариационную функцию и, следовательно, распределение любой размерности. Эти две функции являются важнейшими вероятностными характеристиками речевого сигнала. В математической статистике разработаны разпичные способы экспериментального измерения вероятностных характеристик случайных процессов, если имеется возможност~ записывать и обрабатывать реапизации этих процессов на интервалах наблюдения достаточно большой длительности.
Эти сабы могут быть успешно применены для речевого сигнала, в результате обработки реализаций которага находят оценки одномерной плотности вероятности, ковариационной функции и спектральной ппотности мощности. Оценки затем обычно аппраксимируют подходящими математическими выражениями, получая в результате математические модели, которые могут быль использованы при решении любых задач. Для речевого сигнала таких оценок и аппроксимирующих их функций построено очень много. Здесь приведены пишь наибопее часто используемые модели (3): ° для одномерной плотности вероятности где а,, а„— среднее квадратическое значение речевого сигнала дпя сегмента речи и сегмента паузы соответственно; ° дпя коэффициента корреляции Гт(т) = е сов2итрт, а а 1200 с 1, Го = 500 Гц; -И ° для спектральной плотности мощности (2.6) а(со) = 2аа + г 1 1 аз+ 4кз(тч-Га)з аз+4ке(Г Го)з к (2.9) а = 1200 с ~, Ро =5ООГц.