Диссертация (1090497), страница 25
Текст из файла (страница 25)
Вопрос реализации системы сиспользованием этой ЭБ в данной работе не рассматривается, поскольку еёприменение окупает себя только при крупносерийном производстве.Таким образом, стоит актуальный вопрос: какую применить ЭБ дляпостроения систем корреляционной обработки и при этом минимизироватьзатраты? Сравним варианты построения аппаратной реализации ЦОС наразличных типах ЭБ по параметрам: производительность по основнымматематическимоперациям,конструктивныеособенностиисложностьпрограммирования.В настоящее время имеется ряд публикаций, как например [88-90], вкоторых проводится сравнение производительности УП и различных СП привыполнении конкретных математических операций (реализации фильтров, БПФ,корреляционных функций и т.п.). Результатом таких сравнений является вывод о180том, что УП например, фирмы Intel незначительно уступает СП.
Так как данныеизложенные в [88-90] достаточно давно были опубликованы, то цельюнастоящего раздела является проведение сравнения производительности ивозможностей последних поколений СП, ПЛИС, УП, ГП в рамках решения имиодинаковых задач обработки.Следует оговорить, что при оценке производительности ЭБ были полученыпараметры без учёта накладных расходов, связанных с временем приёма ипередачи из памяти, передачи по шине, тактами ожидания и т.д.К основным параметрам для оценки быстродействия и производительностиаппаратуры ЦОС относятся:1. Тактовая частота и время командного цикла.
Для аппаратуры ЦОС,тактовая частота работы может и не характеризовать частоту работы ЭБ (ПЛИС,процессора), так как внешние и внутренние частоты могут и не совпадать. Времякомандного цикла- это время выбора из памяти и выполнение одной команды.Так как команды могут исполняться за разное количество циклов, а также сучётом возможности одновременного исполнения нескольких команд, этотпараметр может характеризовать быстродействие ЭБ приближённо.2. Количество выполняемых операций за единицу времени (мипс)- единицаизмерения быстродействия равная одному миллиону инструкций в секунду.Данный параметр учитывает одновременную обработку нескольких команд иналичие параллельных вычислительных модулей, поэтому достаточно хорошоможет указывать на быстродействие ЭБ.
Некоторой проблемой здесь остаётся то,что понятие “операции” чётко не формализовано.3. Количество выполняемых операций с плавающей точкой за единицувремени (флопс). Параметр аналогичен предыдущему и используется длявычислений с плавающей точкой.4. Количество выполняемых операций MAC за единицу времени. ОперацияМАС (операция умножения с накоплением), с одной стороны является базовойдля многих вычислений, а с другой стороны достаточно проста. Поэтому время её181исполненияможноиспользовать,втомчислеидляоценкиобщейпроизводительности ЭБ.5.
Вид и объём внутренней и внешней памяти. Объём внутреннего ОЗУпоказывает, сколько данных может обрабатываться без обращения к внешней(глобальной) памяти, что может характеризовать общее быстродействие ЭБ, атакже возможность работать в реальном времени. Важным параметром являетсятактовая частота и пропускная способность при обращении к внешней памяти.6. Количество и параметры портов ввода/вывода (I/O). Данный параметрпоказывает возможности ЭБ по взаимодействию с внешними устройствами.К основным параметрам для оценки эксплуатационных возможностей ипрограммной реализации ЦОС относятся:1.Напряжениепитания,потребляемаямощностьиудельнаяпроизводительность.
Данная характеристика особенно важна для ЭБ, так какобъём и мощность аппаратуры ограничена.2.Допустимыепараметрыокружающейсреды.Механическиеиклиматические воздействия, которые соответствуют определенной группеэксплуатации.3. Состав и функциональность средств разработки и поддержки. Переченьязыков программирования, для которых есть компиляторы под данную систему,наличие и возможности средств отладки программ, переносимость кода,доступность документации и технической поддержки: наличие библиотекстандартных подпрограмм, IР ядер и математических функций.182П.4.1 Тесты для оценки и сравнения производительности ЭБКак отмечено ранее, отдельные характеристики, такие как тактовая частотаработы кристалла, количество выполняемых МАС и флопс операций позволяютоценить быстродействие аппаратуры ЦОС (или ЭБ) неоднозначно.
Оценкапроизводительности встроенных умножителей- это простейший и наиболее частоиспользуемый метод, однако обладает рядом недостатков. Во-первых, не всеархитектуры ЭБ имеют встроенные аппаратные умножители, а во-вторых, хотяумножение и является основной операцией ЦОС, тем не менее, комплекснооценитьпроизводительностьнепозволяет,посколькуфактическаяпроизводительность определяется также скоростью обмена данными и другимифакторами.Математическаяреализацияфлопсоперацийтакжедаётдвоякоепредставление о возможностях ЭБ. Так, например, УП (AMD Athlon 64 X2) имеетпроизводительность около 10 Гфлопс, а СП около 4 Гфлопс, но при решениизадач ЦОС УП может уступать СП по времени обработки некоторыхматематических операций: БПФ, фильтрация.
Так как при оценке не учитываютсямногиефакторытакие,какоптимальностьалгоритмов,параллельностьобработки, загрузка процессора.Поэтому для решения задач измерения и сравнения характеристик ЭБиспользуютспециальныераспространенныезадачинаборыЦОС,тестов,которыеимитирующиедаютболеенекоторыеточнуюоценкупроизводительности ЭБ. Существуют два вида тестов:1 вид. В этом виде теста можно выделить два метода. Первый методпроведение анализа характеристик вычислительных блоков (количество тех илииных низкоуровневых операций, выполняемых за единицу времени) в такназываемых синтетических тестах (Everest [168], Sandra [169], Rightmark [170]).Второй метод- это тестирование на основе пакетов, имитирующих алгоритмы,содержащиеся в реальных программах ЦОС или построенных на фрагментахтаких программ. В этих тестах PCMark [171], SYSMark [172], Design Technology183Inc.
(BDTI) [173] включена также оценка использования внешней памяти,пропускной способности шин.Совершенноинформативнымочевидно,сточкичтозренияпервыйподходиспользования,выглядитпосколькунаименеесопоставитьсинтетические результаты с какими-либо реальными возможностями ЭБ крайнесложно. Второй метод теоретически кажется оптимальным, исходя из затратвремени и даёт возможность судить о средней производительности в некоторомспектре решаемых задач.Основной недостаток выше перечисленных тестов: не оптимизированностьпод конкретную архитектуру ЭБ. Эти тесты разработаны в основном для УП и ГПи совершенно не подходят для СП и ПЛИС. Например, тест SPEC CPU2006позволяет сделать оценку производительности УП по объёмному показателю,который отражает пропускную способность при одновременном выполнениинескольких задач ЦОС (несколько копий одного и того же теста и фрагмента).Написаниеи применение подобной программыдля другихтипов ЭБзатруднительно и затратно.2 вид.
Тесты на основе этого вида состоят из математических операцийЦОС. Эти тесты могут включать стандартную реализацию: фильтры КИХ и БИХ,корреляцию, перемножение векторов, декодеры Витерби, БПФ, функции Уошла,Гаусса, Рисса, Хемминга, Пуассона, Блекмана.Тест пишется на языке ассемблера или Си, оптимизируется под заданнуюархитектуру ЭБ и является стандартным для этой архитектуры. В большинствеслучаев для оценки производительности ЭБ достаточно знать производительностьпри реализации БПФ, которая является основной операцией ЦОС. Таким образом,этот вид тестов наиболее подходит для задач оценки ЭБ.184П.4.2 Исследование, тестирование и сравнительный анализ ЭБ при решениизадач ЦОСЧтобы исключить вопросы, связанные с оптимальностью реализации кода,для той или иной ЭБ при тестировании производительности остановимся наалгоритмах, которые, с одной стороны целиком реализованы в виде готовыхбиблиотек функций оптимизированных под конкретную архитектуру, а с другойстороны вполне могут быть использованы, как самостоятельные алгоритмы ЦОС,для решения конкретных задач обработки.
В качестве таких основных алгоритмоввыбрана библиотека оптимальной фильтрации с использованием спектральногоанализа с помощью БПФ при различных количествах точек (1024 и 65536), КИХфильтра с 40 отводами. Т.е. задача состоит в организации, исследовании исравнении процессов обработки для четырех возможных вариантов построенияаппаратуры ЦОС на основе: СП, ПЛИС, УП, ГП.Стоит отметить, что в первом и во втором вариантах построенияаппаратуры ЦОС (на СП и ПЛИС), исследование проводилось в симулятореSimulink в среде специализированного ПО ЭБ, в третьем и четвёртом вариантахисследование проводилось на реальных аппаратных устройствах. Причёмфункции,реализующиеперечисленныевышеоперации,взятыизспециализированных библиотек ЭБ. Для реализации БПФ (32-разрядныекомплексные числа) и КИХ-фильтра (40 отводов): FFT_FIP32 и FIR дляпроцессора СП; FFT и FIR для ПЛИС; функции из DSPLIB, Intel IntegratedPerformance Primitives 3.0 и среды моделирования Matlab для УП, CUFFT [15] иCUFIR фирмы Nvidia для ГП.П.4.2.1 Реализация аппаратуры ЦОС на основе СПБольшинство разработчиков выбирают в качестве средства реализацииалгоритмов и систем ЦОС сигнальные процессоры (СП).
Лидерами по разработкеи производству СП являются фирмы Texas Instruments и Analog Devices.185Последняя, наилучшим образом соответствует реализации широкого круга задачЦОС, для радиотехнических приложений, так как использует различные видыинтерфейсов. В качестве первого образца для исследования рассмотримвысокопроизводительную архитектуру: Tiger SHARC фирмы Analog Devices сплавающей точкой. Процессор ADSP-TS201S является одним из представителейэтого семейства с тактовой частотой ядра 600 МГц и объёмом встроенного ОЗУ24 Мбит.ADSP-TS201S [139] имеет 128-разрядную статическую суперскалярнуюархитектуру, обеспечивающую общую пропускную способность 38,4 ГБ/с.Поддерживает различные форматы представления чисел с фиксированной иплавающей точкой, параллельно выполняет до 4 операций умножения 32разрядных чисел с плавающей точкой и характеризуется наивысшими в своёмклассе показателями.Главными преимуществами СП при применении в средствах ЦОСявляются:- высокая скорость выполнения операций, таких как умножение снакоплением, по сравнению с УП;- гибкость системы, возможность реализации сложных, адаптивных иобучающихся алгоритмов;- отладочные средства начального уровня недороги, имеется достаточнаяинформационная поддержка, выпущена документация по применению на русскомязыке;- широкая номенклатура программно полностью совместимых устройств сразличным быстродействием и дополнительными периферийными элементами;- низкая стоимость;- диапазон исполнений: коммерческое и индустриальное, которое доступнодля приобретения в России.Вместе с тем, СП имеет ряд недостатков:-применениеСПсвязанаспециализированной ячейки обработки;спотребностьювизготовлении186- необходим специализированный программист-аппаратчик, от котороготребуется хорошее знание архитектуры, т.е.