Диссертация (1090497), страница 26
Текст из файла (страница 26)
квалификация разработчика ПОдолжна быть достаточно высокой;-СПимеетспециализированнуюсложнуюсистемукоманд,ориентированную на специфические операции, при этом одна команда задаётнесколько операций и отсюда низкая ортогональность (под которой понимаютколичество выполненных операций одной командой);- каждое семейство СП имеет собственные коды команд, что делаетпрактически невозможным перенос реализованного алгоритма на процессорыдругих семейств или создание универсальных библиотек алгоритмов. Устаревшиесемейства СП периодически снимаются с производства, что усложняетвозможность поддержания (ремонта) аппаратуры во время всего требуемого срокаэксплуатации (15…20 лет);- тактовая частота портов обмена данными не превышает 250 МГц, чтоограничивает область применения в системах с всё более возрастающимизапросами в части скорости передачи данных;- производительности, даже последних поколений СП, как правило, нехватает для однокристальной реализации алгоритмов обработки и, как следствие,возникает необходимость построения параллельных, многопроцессорных системна базе однокристальных процессоров с присущей сложностью сопряжения исинхронизации, отладкой их функционирования в реальном времени.
Стоимостьконечной реализации подобной системы получается очень высокой.Для тестирования производительности СП ADSP-TS201S применяласьпрограмма Simulink среды программирования VisualDSP++ 5.0 с опцией LinearProfiling. Показатели производительности, основные характеристики и результатытестирования приведены в таблице П4.1. В таблице П4.2 представлены показателивремени выполнения одномерного комплексного БПФ одинарной точности (32разряда) на процессоре ADSP-TS201S. На рисунке П4.1 показана зависимостьширины полосы сигнала от количества точек, которая может быть обработана в187реальном времени данным процессором при выполнении операции комплексногоБПФ при условии, что канал ввода имеет неограниченную скорость.Рисунок П4.1 − Пропускная способность ADSP-TS201SП.4.2.2 Реализация аппаратуры ЦОС на основе ПЛИСВторой по степени распространённости ЭБ после СП является ПЛИС типаFPGA структуры фирмы Xilinx (Virtex и Spartan).
В качестве второго образца длясравнительного анализа возьмём Virtex VI (XC6VSX315T) [140]. Это семейство,специально предназначенное для ЦОС, где применена новая архитектура сблоками XtremeDSP (DSP48E1). Блоки способны работать с 18 и 25 битнымичислами. Увеличенная разрядность одного из операндов улучшает динамическийдиапазон представления чисел и помогает выполнять перемножение чисел сплавающей точкой с одинарной точностью. Получение максимальной отдачи отПЛИС возможно при глубоком распараллеливании процессов обработки.Основными преимуществами ПЛИС при применении в средствах ЦОСявляются:- возможность реализации сложных параллельных алгоритмов;- наличие средств САПР, позволяющих провести полное моделированиесистемы;- совместимость при переводе алгоритмов на уровень языков описанияаппаратуры (VHDL, AHDL, Verilog и др.);- совместимость по уровням и возможностям реализации стандартныхинтерфейсов.
За счёт высокой скорости межкристального обмена в ПЛИС188возможен многоканальный I/O данных на предельных частотах, вплоть дочастоты работы кристалла;- наличие библиотек мегафункций (IP ядер), описывающих сложныеалгоритмы обработки различных функциональных узлов, такие как FFT, FIR и т.д.Архитектурные особенности ПЛИС хорошо приспособлены для реализации такихопераций как умножение, свертка и т.д.;- встроенные специализированные СП, обеспечивают прямую аппаратнуюреализацию операции умножения с накоплением, с тактовой частотой работыПЛИС;- возможность перевода топологии ПЛИС на заказные схемы;- большой диапазон исполнений: коммерческое, индустриальное, военное икосмическое, которое доступно для приобретения в России.Вместе с тем ПЛИС имеет ряд недостатков:-применениеПЛИСсвязаноспотребностьювизготовленииспециализированной ячейки обработки;- высокая стоимость кристалла зависит от емкости и серии ПЛИС;-необходимспециализированныйпрограммист-аппаратчик.Отпрограммиста требуется хорошее знание архитектуры и языков описанияаппаратуры (VHDL, AHDL, Verilog и др.), т.е.
квалификация персонала должнабыть достаточно высокой;- невозможность реализации сложных, адаптивных, обучающихся, сильноветвящихся алгоритмов;- при применении ПЛИС с большой емкостью вентилей выделяетсябольшая мощность (10-25 Вт), которую необходимо отвести от кристалла.Тестирование производительности ПЛИС осуществлялось программой ISEFoundation с использованием готовых IP ядер. При получении выходнойреализацииБПФрассчитывалосьвремяпреобразования.Показателипроизводительности, основные характеристики и результаты тестированияприведены в таблице П4.1.189П.4.2.3 Реализация аппаратуры ЦОС на основе УПСамой распространенной и общедоступной, но малоосвоенной ЭБ для задачЦОС, является УП на основе персональной ЭВМ.
В качестве третьего образцаисследования рассмотрим процессор общего применения типа Intel Core i5 2400 (4ядра) 3,1 ГГц, ОЗУ 4 Гб, шина 64 разряда [141]. Этот процессор составляет основуодноплатныхЭВМиндустриальногоисполнения,например,типаVR11производства GE Intelligent Platforms [155], CP600x производства Kontron [151] ит.д. Одноплатная ЭВМ является готовым и законченным изделием, что являетсяпривлекательным для её применения.Основными преимуществами УП при применении в средствах ЦОСявляются:- общедоступность, гибкость системы, возможность реализации сложных,адаптивныхалгоритмов,широкаяноменклатурапрограммнополностьюсовместимых устройств;- недорогие средства отладки и информационная поддержка;-стандартныеархитектуры(RISC,x86),которыеобеспечиваютпереносимость кода не только внутри семейств, а также преемственность ПО, припереходе на новые поколения УП;- команды общего назначения, одна команда- одна операция, хорошаяортогональность;- разработка программ для УП имеет небольшую трудоемкость, при этомтребуется программист среднего уровня, без специальных знаний;- стандартные порты I/O и готовое ПО к ним;- за счёт массового производства УП стоимость аппаратной составляющейсистемы низкая и зависит от реализации;- диапазон исполнений: коммерческое, индустриальное, которое доступнодля приобретения в России.Вместе с тем УП имеет ряд недостатков:- ограниченное количество портов I/O: Ethernet, UART, USB, RS;190- низкая частота обмена портов I/O (Ethernet –максимум 1000 Мбит/с), чтоограничивает область применения в системах ЦОС при всё более возрастающейскоростью I/O;- потребность в разработке и изготовлении интерфейсной ячейки приёмаданных;- большая мощность потребления и, как следствие, мощность рассеивания;наличие-“фон-неймановскогоузкогоместа”-ограничениепроизводительности последовательного потока вычислений при обращении кглобальной памяти.Тестирование производительности УП, при вычислении комплексногоБПФ,производилосьпрограммойнаписаннойнаязыкеСивсредепрограммирования Visual Studio с помощью библиотеки FFT_W и в средемоделирования Matlab 2010 с помощью библиотеки FFT.
Эти библиотекиявляются стандартными для УП и оптимизированы под многопроцессорныесистемы.Взависимостипроизводительностьможетотиспользуемыхварьироваться.библиотек,БиблиотекаотносительнаяFFT_Wбольшеоптимизирована для работы с небольшим количеством точек. В таблице П4.3представлены данные о времени выполнения одномерного комплексного БПФ наУП типа Intel i5 2400 для различных количества точек. Условие: ОС Window 7,среда программирования Visual Studio, библиотека FFT_W, одинарная точность.Четыре ядра УП загружены равномерно (одно ядро на 10% больше остальных).При определении времени выполнения операции БПФ большую точностьполучить невозможно, особенно при малых значениях времени, так как ОСWindow является многозадачной системой.Библиотека FFT напротив лучше работает с большим количеством точек.
Втаблице П4.3 представлены данные о времени выполнения одномерногокомплексного БПФ одинарной точности на УП Intel i5 2400 для различногоколичества точек с библиотекой FFT, ОС Window 7, среда моделирования Matlab2010, вызов функции FFT. Основные характеристики и результаты тестированияпредставлены в таблице П4.1.191На рисунке П4.2 показана зависимость ширины полосы сигнала отколичества точек, которая может быть обработана в реальном времени даннымУП при выполнении операции комплексного БПФ.Рисунок П4.2 − Пропускная способность УП Intel i5 2400 3,1 ГГцП.4.2.4 Реализация аппаратуры ЦОС на основе ГПНовой и малоосвоенной ЭБ является ГП.Основа вычислительноймощности ГП- высокоспециализированная архитектура, сформированная впоследние годы для извлечения максимальной производительности при решениизадач компьютерной графики с присущей ей высокой степенью параллелизмаобработки.