Меркулов В.И., Дрогалин В.В. Авиационные системы радиоуправления. Том 2 (2003) (1151998), страница 25
Текст из файла (страница 25)
Каждый порт может быть преобразован в интерфейс, который обеспечивает возможность простой интеграции процессора в мультипроцессорную систему. В микропроцессоре используются: устройство умножения с накоплением (разрядностью 32х32); специализированный набор команд; аппаратная поддержка выполнения программных циклов и быстрого возврата иэ прерываний; расширенная до 1 К слов кэш-память команд; пять 32-разрядных адресных шин — внутренних однонаправленных шин адреса Х и У, программной адресной шины и двух внешних адресных шин; семь 32-разрядных шин данных — внутренних двунаправленных шин данных Х и У, внутренней двунаправленной глобальной шины данных, внутренней двунаправленной шины данных ПДП, внутренней двунаправленной программной шины данных и двух внешних шин данных; внутрикристалльная память микропроцессора, включающая 1024 слова программной памяти (КАМ), две независимых памяти данных по 5!2 слов каждая (КАМ), два независимых ПЗУ емкостью 1024 слова и ПЗУ начальной загрузки емкостью 64 слова; эз внешняя память процессора 2х25 32-разрядных слов для команд и данных.
При этом производительность микропроцессора на тактовой частоте 40 МГц составляет около 20 М1РБ и 60 МР).ОРБ. Аналог микропроцессора 1)БР 96002 — микропроцессор 1В577— используется в отечественных вычислительных средствах семейства «Багет» (в программируемых процессорах обработки сигналов). 9.3.4. БАЛАНС ПРОИЗВОДИТЕЛЬНОСТИ КОМПОНЕНТОВ В то время как быстродействие новых моделей процессоров (микропроцессоров) возрастает очень быстро, темпы роста производительности других компонентов компьютера несколько отстают от них.
В качестве примера на рис. 9.6 показан график изменения характеристик компонентов в процессе совершенствования технологии их производства в 1980-1995 годах [71]. В результате перед разработчиком системы всегда стоит задача выбора такого варианта архитектуры и структурной организации, который обеспечит оптимальный баланс характеристик ком- 5 — 5806 !29 мо 50 9 ао наш н. н»н н 10 1990 1985 нао 1995 Рис. 9.6 понентов и позволит устранить несоответствие между их функциональными возможностями. Проблема несогласованности характеристик острее всего проявляется на стыке процессора с памятью. В то время как быстродействие микропроцессоров и объем памяти в корпусе микросхемы возрастали очень быстро, быстродействие памяти (параметр, от которого зависит интенсивность потока информации) росло значительно более медленными темпами.
В результате, если не предпринимать специальных мер, современный быстродействующий микропроцессор будет часто простаивать, поскольку система не сможет достаточно быстро предоставлять ему команды и данные для обработки. Решение этой проблемы может быть осуществлено разными путями. Примеры таких решений можно найти в современных компьютерах. К этим решениям относятся: увеличение разрядности данных, извлекаемых из памяти в одном цикле обращения; совершенствование интерфейса обращения к памяти - включение в интерфейс промежуточной буферной памяти; уменьшение частоты обращения к основной памяти посредством внедрения сложных кэш-структур между процессором и оперативной памятью.
При этом один или несколько блоков кэш-памяти размещается в микропроцессоре или в отдельной микросхеме в непосредственной близости от микропроцессора; повышение пропускной способности канала связи между процессором и памятью — использование более скоростной магистрали или иерархии магистралей с буферизацией потока данных. 130 Нужно не забывать и об устройствах ввода-вывода, как правило осуществляющих интенсивный обмен с периферийными устройствами, что потребует так же соответствующих решений. В качестве примера на рис. 9.7 показана структурная схема персонального компьютера, на которой цифрами 1 — 9 показаны «узкие места» в его архитектуре [57].
На рисунке показаны значения теоретически достижимой пиковой пропускной способности различных интерфейсов и устройств, а так же указаны реальные значения этих величин, полученные в ходе замеров на разных системных платах. Швв 1ИЕЕ1394-50 Мьс Рнс. 9.7 Из рисунка видно, что скорость работы встроенной в микропроцессор КЭШ-памяти 600-3200 Мбайт!с (т. 1) не ограничивает общей эффективности системы. Совсем другое наблюдается при обмене данными с внешними КЭШ-памятями (второго и третьего) уровня (т. 2), расположенными на сис- 13! темной плате. Для этой памяти показатели падают до 130-230 Мбайт/с (соответственно для операций записи и чтения).
Это будет заметно только в системе, остальные компоненты которой (особеино видеокарта и оперативная память) работают с более высокой скоростью. Реальная скорость обмена с оперативной памятью (т. 7) далека от теоретически достижимого значения 800 Мбайт/с (т. 4) и зависит в основном от модели чипсета, установленного на системной плате.
Таким образом, сегодня низкая скорость работы с оперативной памятью становится серьезным «тормозом» в повышении эффективности компонентов. Решение проблемы возможно либо с появлением новых чипсетов, более корректно работающих с памятью, либо с внедрением новых видов памяти, либо переходом на другую архитектуру системной шины. Теоретически достижимая пропускная способность шины РС! (т. 5) до 132 Мбайт/с умее сегодня не удовлетворяет требованиям пересылки огромных объемов графической информации.
Поэтому видеоконтроллеры перемещаются на интерфейс АСР (Ассе)егагед Сгар)йсз Рог! — ускоренный графический порт). Этот интерфейс (т. 3) предназначен исключительно для подключения видеоадаптеров к отдельной (не связанной с системной шиной) магистрали АОР, имеющей выход непосредственно на системную память. Внедрение нового протокола РС1, предусматривающего частоту шины 66 МГц и скорость до 528 Мбайт/с (при ширине шины 64 бита), требует новых системных плат с 64-битными разъемами и чипсетов, поддерживающих этот протокол. Однако, самое главное состоит в том, что реальная пропускная способность РС! (т. 8) гораздо ниже предельно допустимой. По интерфейсу ЕПЗЕ (т.
6) можно передать максимум 16 Мбайт/с. Реальные замеры (т. Я) показали, что данные пересылаются со скоростью от 8 до 13 Мбайт/с. Поэтому неизбем<ен переход на интерфейс !ЕЕЕ1394 (!па!йоге оГ Е1ес!пса! апс) Е!ее!гоп)с Епй(пеега 1394 — стандарт института инженеров по электротехнике и электронике №1394). Это последовательный интерфейс с пиковой пропускной способностью сегодня 50 Мбайт/с. Разрабатываются модификации интерфейса, способные передать 200 Мбайт/с и даже 800 Мбайт/с.
Таким образом, необходимо все время помнить об обеспечении оптимального соответствия между функциональными возможностями применяемого процессора (микропроцессора), памяти, устройств ввода- вывода и связывающих их магистралей (интерфейсов). 9.3.5. ПАРАЛЛЕЛИЗМ ПРОЦЕССОВ ОБРАБОТКИ ИНФОРМАЦИИ В ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ Повышение производительности ВС за счет увеличения производительности элементной базы (повышение частоты работы элементов) 132 практически исчеяппало свои возможности, натолкнувшись на теоретический предел 1О -10~~ оперйс.
Дальнейшее повышение в этом направлении потребует поиска новых физических принципов обработки информации. Весьма перспективным является направление, в основе которого лежит распараллеливание процессов обработки информации на всех уровнях решения задачи и которое широко использовалось на всех этапах развития вычислительных средств. Это направление включает: переход от последовательного счета к параллельному; параллельную работу основных устройств ЭВМ; мультипрограммный режим обработки данных; конвейерный режим; многопроцессорные и многомашинные архитектуры; режим управления потоками данных и др.
Обобщенная концепция конвейера включает в качестве частных случаев, как параллельную обработку, так и собственно конвейер. Обобщенный конвейер позволяет использовать устройства, которые при последовательном решении были не загружены. В случае динамического многомерного конвейера устройства можно в ходе вычисления конфигурировать в подходящий конвейер, что повышает эффективность их использования. Возможность повышения надежности является еще одним преимуществом обобщенного конвейера. Реконфигурируемость и дублирование сегментов (подсистем, систем) в обобщенном конвейере дают возможность организовывать диагностику сбоев и восстановление после сбоя. В конвейерном методе параллелизм обработки достигается за счет разбиения процесса обработки на последовательность независимых операций, выполняемых сегментами.