Оппенгейм - Применение цифровой обработки сигналов (1044221), страница 65
Текст из файла (страница 65)
Ятал д Ьлал1 Лгал 3 Рис. 5.17. Блок-схема алг оритма 8-точечного БПФ с прореживанием по вРемени и прямым порядком исходных данных. Прииенение ЦОС в радиолокации 299 Глава 5 298 нии, что обе эти величины примерно равны (так как основная доля времени тратится на комплексное умножение), получаем следующее приближенное выражение для времени вычисления свертки: Т = У(1+1од,У) Т„. (5.28) Условие, что вычисление свертки должно проводиться в пределах одного периода повторения зондирующих импульсов, накладывает ограничение на минимальную скорость выполнения комплексного умножения.
Предположим, например, что частота повторения импульсов составляет 1 кГц (т. е. период их следования равен 1 мс), а размер преобразования равен 4096=2". Для проведения обработки в реальном времени необходимо, чтобы комплексное умножение выполнялось менее чем за 20 нс. Этому требованию в настоящее время трудно удовлетворить при использовании существующих цифровых умножителей. В действительности оно оказывается еще более жестким, если учесть все дополнительные операции, необходимые для обеспечения обработки. Из приведенного примера может даже показаться, что существует определенный предел аппаратурной реализации высокоскоростной свертки, но на самом деле это1 не так. В приведенных выше рассуждениях предполагалось, что все операции выполняются последовательно.
Такая структура вычислений характерна для универсальной вычислительной машины с одним процессором. Положение, однако, улучшается при использовании методов параллельной обработки. В частности, скорость обработки можно существенно увеличить, применив поточное устройство для выполнения БПФ 118, 29], причем аппаратура управления в такой структуре довольно простая. Ниже поточная структура рассматривается более детально.
5.5.3. Поточная структура При разработке поточной структуры БПФ был учтен тот факт, что еще до окончания всех базовых операций на данном этапе можно начинать вычисления на последующих этапах. Так, из блок-схемы 8-точечного БПФ по основанию 2 (см. рис. 5.17) видно, что верхнюю базовую операцию на этапе 1 можно начать сразу после окончания выполнения первых трех (сверху) базовых операций этапа О. Аналогично верхнюю базовую операцию на этапе 2 можно выполнить сразу после завершения первых двух (сверху) базовых операций этапа 1. Таким образом, при использовании алгоритма БПФ по основанию 2 можно построить более эффективную структуру, содержащую 1о~гХ параллельно работающих арифметических устройств (АУ) . Следует отметить, что на каждое АУ данные должны поступать в определенном порядке, поэтому между всеми АУ необходимо ввести блоки памяти для перестановки данных.
Более подробно особенности построения поточной структуры будут рассмотрены ниже, а сейчас оценим сокращение времени выполнения БПФ по основанию 2, которое обеспечивается при переходе к этому виду параллельного выполнения операций. Рассмотрим реализацию одного ДПФ в поточной структуре БПФ. В лучшем случае можно ожидать сокращения времени преобразования в 1од~Х раз.
Однако поскольку выполнение базовых Лтгругл. г таблицы Рис. 5.18. Блок-схема цифровой фильтрации с каскадно соединенными поточными блоками БПФ, работающими по основанию ~. (о.30) операций нельзя начать на всех этапах одновременно, то, как будет показано ниже, время преобразования уменьшится всего в '/~ 1одгЛ' раз. Но при многократном вычислении ДПФ задержка вычислений будет иметь место только в начале, так что преобразования будут выполняться приблизительно в 1од~л' раз быстрее (см. разд. 5.6.6). Итак, общее время получения высокоскоростной свертки при использовании Л'-точечных преобразований составит т,,1ж!од,н ~( — 1оц,к)) т„.~. ют„.
~5.29) Предположив снова, что Тн= Тхт, получим Т =ЖТ Применительно к рассмотренному выше примеру это означает, что комплексное умножение должно быть выполнено за 83 нс, т. е. за время, которое может быть обеспечено на быстродействующих сериях существующих микросхем.
Об бщая структура поточного свертывателя, работающего по основанию г (алгоритм БПФ с прореживанием по времени) да ) на рис. 5.18. Исходные отсчеты поступают в первый поточный блок Глава 5 300 Применение ЦОС в радиолокации 301 'Управление Управление Управление Управление преобразователя по г входам (на каждый вход поступает Л/г отсчетов) . В поточном блоке прямого преобразования выполняется Л'-точечное БПФ по основанию г над отсчетами, следующими в прямом порядке.
После преобразования их в частотную область каждая группа из Л'/г чисел умножается на соответствующие отсчеты частотной характеристики фильтра, а образующиеся произведения поступают во второй поточный блок, где выполняется обратное БПФ. Порядок поступления данных в блок обратного преобразования разрядно-инверсный (система счисления номеров г-ичная), а выходные отсчеты следуют в прямом порядке. Таким образом,, разрядная инверсия номеров отсчетов, возникшая после прямого преобразования, устраняется на этапе обратного преобр аз ов ани я. 5.6. Пример системы цифровой обработки радиолокатора При проектировании системы цифровой обработки радиолокатора приходится учитывать характеристики и возможности изготовления многих подсистем.
В данном разделе будет описана си- Рис. 5.19. Блок-схема поточного устройства для выполнения прямого БПФ по основанию 4. Рис. 5.20. Блок-схема поточного устройства для выполнения обратного БПФ по основанию 4. стема, разработанная за последние несколько лет в лаборатории Линкольна Массачусетского технологического института. Основной ее частью является поточный согласованный фильтр с алгоритмом БПФ по основанию 4. Рассмотрим сначала особенности этой системы. На рис. 5.19 и 5.20 изображены блок-схемын поточных устройств для выполнения соответственно прямого и обратного 4096- точечных БПФ по основанию 4. Оба устройства включают шесть каскадов, каждый из которых состоит из модулей памяти на регистрах задержки, обеспечивающих неодинаковую временную задержку, АУ и постоянного запоминающего устройства (ПЗУ) поворачивающих коэффициентов.
В свою очередь каждое АУ содержит три устройства поворота векторов и один четырехточечный матричный Фурье-преобразователь. Каскады устройств прямого и и В > В настоящее время на основе этих устройств фирмой бепега1 Е!ес1г1с по техническому заданию лаборатории Линкольна разрабатывается система цифровой обработки данных со следующими характеристиками: размер преобразования 16 384, основание алгоритма 4, тактовая частота 30 МГц.
Следовательно, круговая свертка 16384-точечных массивов может быть вычислена за 136 мкс. Применение ЯОС в радиолокации Глава 5 302 обратного БПФ отличаются лишь порядком, в котором хранятся поворачивающие коэффициенты, и в некоторой степени внутренними связями в матричных Фурье-преобразователях. Регистры памяти, обеспечивающие неодинаковую временную задержку, содержат групповой переключатель и набор сдвиговых регистров, длина которых зависит от номера каскада (опа указана на рис.
5.19 и 5.20). Эти регистры предназначены для упорядочения данных в процессе выполнения преобразований с тем, чтобы в каждый момент времени на входы АУ поступали соответствующие отсчеты. Хранящаяся в табличной памяти частотная характеристика определяет вид реализуемого фильтра. Адресация табличной памяти должна быть разрядно-инверсной в соответствии с разрядно- инверсным порядком следования результатов прямого БПФ. 5.6.1. Формат данных (т,-~ 1'т,.) 2', где т и т — мантиссы действительной и мнимой частеи соответ т ственно.
Для представления обеих мантисс используется одинаковое число разрядов. Общий порядок Ь является положительным целым числом, начальное значение которого, соответствующее Способ представления данных в цифровом согласованном фильтре во многом определяет сложность устройства и точность обработки, поэтому он должен быть выбран на начальном этапе проектирования системы обработки. Возможны различные способы представления данных: с фиксированной запятой, со стандартной плавающей запятой и с гибридной плавающей запятой, а также в дополнительном, обратном или прямом кодах. Если в согласованном фильтре, предназначенном для сжатия импульсов, используется представление чисел с фиксированной запятой, то разрядность чисел должна быть большой, так как уровень сигнала в процессе фильтрации возрастает в Т% раз.
В этом смысле более подходящим является представление чисел с плавающей запятой, хотя в действительности можно ограничиться некоторым приближением к нему, а именно гибридной плавающей запятой, поскольку порядок чисел имеет тенденцию к росту только в положительном направлении. Эта форма представления считается наиболее удачной, так как структурно она реализуется сравнительно просто, а соответствующая ей точность фильтрации, как показали результаты моделирования, достаточно высока. Все арифметические операции при использовании формата данных с гибридной плавающей запятой выполняются над правильными дробями в дополнительном коде. Комплексные операнды прелставляются двумя дробными мантиссами, с общим порядком следующим образом: (5.31) входному сигналу, равно нулю.
Учитывая возможное усиление сигнала в процессе БПФ, можно показать, что для представления порядка Ь достаточно нескольких бит (например, 5 бит при размере преобразования, равном 1б К). Выбор же разрядности мантисс достаточно трудоемок; для решения этой задачи лучше всего воспользоваться моделированием. Ниже будут рассмотрены некоторые результаты обработки с помощью системы, в которой мантиссы представляются 9- или 11-разрядным кодом. 5.6.2. Структура арифметического устройства дь А Анализ поряд- ков Коррениия поряд- ков управление выравниванием Контроль переполнения дыяавниг воющий длок сдвига Поворачиваю- исая сзема ыравниоаюигии длок сдви а четырехточечный матричный рурье лреодразователь (разрядность слов увеличивается на с дата) дыраони оаюигии длок сдвига дыравнис ваюисии деон сдвига Позора чиоаюисие коэр~риииенты г.ис.