Меркулов В.И., Дрогалин В.В. Авиационные системы радиоуправления. Том 2 (2003) (1151998), страница 27
Текст из файла (страница 27)
Особый случай представляют граничные элементы, число связей у которых может быть разным. Такой тип коммуникационной сети не подходит для создания многопроцессорных конфигураций с большим числом процессоров, поскольку максиРис. 9.14 мальная задержка передачи сообщений от одного из Х процессоров к другому пропорциональна 4Х и быстро растет с увеличением числа процессоров, Двумерная решетка показана на рис. 9.14. Двумерная решетка обеспечивает хорошее быстродействие.
Для решеппч данных между ПЭ необходимо определить маршруг передачи данных, при этом для решетки размером пхп требуется максиРнс. 9.15 мум 2(п-1) промежуточных узлов. В топологии «звезда» есть один центральный узел, с которы единяются все остальные ПЭ. Таким образом, у каждого ПЭ вЂ” Х- единение (рис. 9.! 5). м со- 1 со- 139 В такой топологии слабым звеном оказывается центральный узел, поэтому она тоже не подходит для больших систем. В сети с полносвязиой топологией (рис. 9.16) все ПЭ связаны друг с другом. Пересылки могут выполняться одновременно между любыми парами ПЭ. В такой системе легко могут быть реализованы широковещательные и многоадресные пересылки. Как быстродействие, так и стоимость системы высоки, причем стоимость существенно возрастает с увеличением числа ПЭ.
Существуют и другие топоРис. 9.16 логии (например, «Гиперкуб»). Во всех топологиях имеет значение маршрутизация сообщений (или части сообщений — пакетов). В решетчатых топологиях в каждый момент времени выполняется пересылка пакетов данных вдоль одного определенного измерения. Маршрутизация в топологиях «звезда» простая. Путь сообщения всегда проходит через центральный узел.
Динамические топологии. Основным представителем этого класса является перекрестное соединение (рис. 9.17). Оно обеспечивает полную связность, т.е. каждый ПЭ может связаться с любым другим процессором или модулем памяти. Пропускная способность сети при этом ие уменьшается.
Схемы с перекрестными переключениями могут использоваться и для организации межпроцессорных соединений. В этом случае каждый процессор имеет собственный модуль памяти (системы с расширенной памятью). 140 Рис. 9.17 Для соединения и-процессоров с и модулями памяти требуется и~ переключателей. Такая зависимость ограничивает масштабируемость системы (обычно не более 256 узлов).
Мноеокаскадиые сепш основаны на использовании 2х2 перекрестных переключателей — коммутаторов (рис. 9.18). На рис. 9.18,а изображен переключатель без широковещательной рассылки, а на рис. 9.18,б — с широковещательной. Вход Выход Выход Вход Выход Вход Вход Выход б) а) Рис. 9.18 В этом случае на одном конце соединения находятся процессоры; а на другом — процессоры или другие узлы. Между ними располагаются переключатели. При передаче данных от узла к узлу переключатели устанавливаются таким образом, чтобы обеспечить требуемое соединение. Однако, для этого требуется некоторое время — время установки.
В зависимости от способа соединения имеются разные топологии динамических многоканальных сетей (куб, «омега», и др.). На рис. 9.19 приведена схема соединения «омега». Выход Вход Рис. 9.19 14! Важнейшими атрибутами системы коммуникаций являются стратегии управления, коммутации и синхронизации. При централизованном управлении имеется единый модуль управления. Распределенное управление применяется в многокаскадных соединениях, где кахгдый узел принимает решения, как действовать с поступившим сообщением— оставить его себе или передать соседу.
Другой вариант используется в соединении типа «звезда», где каждое сообщение пересылается в контроллер, который и определяет его дальнейшую судьбу. Синхронизация может быть глобальной, когда синхронизирующая последовательность импульсов передается всем вычислительным системам, но может быль и локальной, когда каждый узел имеет свой собственный генератор. Зтот вариант соответствует асинхронной работе. Глобальная синхронизация характерна для 81МР-компьютеров и имеет более простую аппаратную и программную реализацию. М1МР- системы чаще всего имеют более гибкую асинхронную систему.
Методы кохм~утации (переключения), Важнейшим в организации работы коммуникационной сети является метод переключения, определяющий способ передачи сообщений от узла-источника к узлу-приемнику. Сообщением называют логически завершенную порцию данных— пересылаемый файл, запрос на пересылку файла и т.д. Сообщения могут иметь любую длину. Пакет представляет собой часть сообщения, его длина ограничена, хотя и может варьироваться.
Пакеты перемещаются по сети независимо друг от друга. Каждый пакет содержит заголовок с информацией об адресе получателя и его номер, что необходимо для правильной «сборки» пакетов в единое сообщение. Выделяют три основных метода коммутации в сетях параллельных вычислительных систем: коммутация с промежуточным хранением; коммутация цепей (коммугация каналов); метод виртуальных каналов.
Исторически, одним из первых методов коммутации был метод с промежуточным хранением (метод коммутации пакетов). В этом случае сообщения полностью принимаются на каждом промежуточном узле и только после этого отправляются дальше. Промежуточная буферизация пакетов требует дополнительной памяти и затрат времени. Задержка передачи пропорциональна расстоянию между источником и адресатом. Данный метод применяется в ситуациях, когда время отклика не имеет значения. При коммутации цепей (коммутации каналов) между источником и получателем сообщения устанавливается непрерывная цепь, состоящая из отдельных каналов связи, проходящих через промежуточные уз- 142 лы. После этого выполняется передача данных.
Коммутируемый канал устанавливается только на время соединения отправителя и адресата. Уменьшить задержки при передаче данных позволяет метод виртуальных каналов. В этом случае пакеты накапливаются в промежуточных узлах только тогда, когда недоступен очередной канал связи. В противном случае, пересылка выполняется немедленно и без буферизации. 9.4. ПРОИЗВОДИТЕЛЬНОСТЬ МИКРОПРОЦЕССОРОВ 9.4.1. ПИКОВАЯ И РЕАЛЬНАЯ ПРОИЗВОДИТЕЛЬНОСТИ Одним из основных показателей эффективности БВС является ее производип|ельность, под которой обычно понимают скорость выполнения програльи или обьем вычислительной работы, которую способна выполнить система за заданный промежуток времени. Объем этой вычислительной работы связан непосредственно с производительностью микропроцессоров, для которых существуют две оценки — пиковая производительность и реальная производительность.
Пиковая (техническая) производительность предстивляет собой теоретический максимул~ быстродействия компьютера при идеальных усювиях [3!). Она достигается при обработке бесконечной последовательности не связанных между собой и не конфликтующих при доступе в память команд. При этом предполагается, что все операнды выбираются из внутрикристалльной кэш-памяти данных, а команды — из кэшпамяти команд. Практически, ни одна вычислительная система не в состоянии работать с пиковой производительностью.
Для определения пиковой производительности нужно знать только тактовую частоту процессора и число арифметических конвейеров. При тактовой частоте 1 МГц пиковая производительность одного арифметического конвейера при выполнении операций с плавающей точкой соответствует ! МР1.0РБ (Мй!юп Ноас Орегаболз Рег Бесопд) или 1 М1РБ (М!!1!оп 1пзггпсйоп Рег Зесопд) при выполнении операций с фиксированной точкой (если за такт получается один результат).
При выполнении реальных прикладных программ эффективная (реальная) производительность микропроцессора может существенно (до нескольких раз) быть меньше пиковой, так как характеристики функционирования микропроцессора зависят от программы и обрабатываемых данных. Для оценки производительности различных вычислительных средств в мировой практике наибольшее распространение получило использование наборов характеристик длятой или иной области применения вычислительной техники задач. Время выполнения каждой из задач набора составляет основу для расчета индекса производительности оцениваемого вычислительного средства. 143 Индекс пришводительлослш является относительной оценкой, показывающей, на сколько быстрее или медленнее исследуемое вычислительное средство выполняет подобные задачи по сравнению с некоторой широко распространенной базовой (эталонной) ЭВМ.
9.4.2. ИЗМЕРЕНИЕ РЕАЛЬНОЙ ПРОИЗВОДИТЕЛЬНОСТИ МИКРОПРОЦЕССОРА При измерении реальной производительности используются два вида тестов: тесты компаний — производителей компьютеров для собственного применения и тесты, создаваемые усилиями групп пользователей. Последние специально предназначены для выбора компьютеров и ПО, наиболее подходящих для определенных прикладных задач. Такой подход позволяет получить наиболее точные оценки производительности для конкретного класса приложений. Наиболее часто оценка производительности универсальных микропроцессоров выполняется по результатам выполнения контрольных задач, при решении которых используется набор группы тестов 8РЕС (йапдагд Рег(оппапсе Еча1иапоп Сотрогабоп), например 8РЕС (89, 92, 95) [31]. Пакет 8РЕС 89 включает в себя два тестовых набора: Снп 89, состоящий из четырех программ целочисленной обработки, и Срр 89, объединяющий шесть программ со значительным объемом операций над числами с плавающей точкой двойной точности.
Все десять модулей представляют собой достаточно сложные программы на языках С и ГОЙТЙАЫ с широким спектром решаемых задач — от оптимизации матриц булевой логики до моделирования замещения атомов в квантовой химии. За базовую ЭВМ, по отношению которой вычисляется индекс производительности, взята известная ЭВМ 1)ЕС ЧАХ 11/780. В пакеты тестовых программ 8РЕС 92 в показатели 8РЕС 1ш 92 и 8РЕС Гр 92 включены дополнительные тесты, в том числе для мультипроцессорной работы. При этом методика расчета индексов производительности осталась такой же, как и в 8РЕС 89. Появление следующего набора тестовых программ 8РЕС 95 обусловлено развитием микропроцессоров (повышением производительности и увеличением объема внутрикристалльной памяти), совершенствованием компиляторов, стремлением учесть требования стандартов открытых систем, а также скорректированным после появления ПРЕС 92 представлением об актуальности различных областей приложений.
Современные микропроцессоры выполняют тесты ПРЕС 92 в течение интервалов времени от долей секунды до нескольких секунд, что вносит в измерения достаточно большую погрешность. Объем кода программ и данных ПРЕС 92 таков, что программы и данные могут разместиться в кэш-памяти процессора. Это не позволяет получить сколько- 144 нибудь достоверные оценки производительности, поэтому появился набор тестовых программ БРЕС 95. Индексы производительности в БРЕС 95 в отличие от ПРЕС (89, 92) даются по отношению к эталонной машине ЯРАКС-з!а!!оп 10/40 в конфигурации с кэш-памятью второго уровня.
Причем используются два тестовых набора С!и! 95 и Сур 95, состоящих из 8 и 1О программ соответственно. В качестве примера в табл. 9.3 приведены сравнительные оценки производительностей некоторых известных микропроцессоров Реп!шщ на пакете ЯРЕС95 при выполнении тестов целочисленной обработки (!п1) и набора тестов вычислений над числами в формате с плавающей точкой (Гр). Таблица 9.3 Микропроцессор Репбпт, совместимый с семейством микропроцессоров Х86, использует предсказание переходов в программах и обеспечивает когерентность (согласованносгь) данных в КЭШах процессоров и в основной памяти при работе в мультипроцессорной системе. Микропроцессор Репбшп ММХ (1997 г.) ориентирован на эффективное выполнение типичных мультимедийных алгоритмов, к числу которых относятся многие алгоритмы, характерные для цифровой обработки сигналов (операции над векторами, свертка, преобразование Фурье и т.п.).