Автореферат (1090010), страница 6
Текст из файла (страница 6)
Эти сокеты реализованы на основе эластомера и разработаны сучетом особенностей стенда тестирования и разбраковки. Предлагаетсяприменять отработанные типовые блоки процессоров в многопроцессорноммодуле с пайкой всех микросхем. Выполнение требований по установке сокетовпозволяет обеспечить возможную замену микросхем процессоров в случаеремонта. Проработка в рамках стенда сразу нескольких типовых блоковпозволяетопределитьособенностиприменениякомпонентовмногопроцессорного модуля в условиях внешних воздействующих факторов.Ошибки применения этих компонентов при разработке стендов с учетомтехнологических ограничений некритичны, но снижают надежность стенда исроки его эксплуатации.Экспериментальныеметодыкомпоновкисоставныхчастеймногопроцессорного модуля позволили обеспечить снижение сроков разработкимногопроцессорных модулей путем проработки для них проектных решений дозавершения испытаний микросхемы процессора.
Допускаются многократныеуточнения принятых решений на более ранних этапах проектирования взависимости от результатов выполнения последующих этапов.Пятая глава посвящена проектам и достигнутым техническим иэксплуатационным характеристикам корпусов микросхем процессоров имногопроцессорных модулей на их основе с применением разработанныхтехнических решений для процесса проектирования.
Представлены конструкциимикросхем процессоров и контроллеров российской разработки с достигнутымитехническими характеристиками типовых блоков процессора. Предложенаэффективная компоновка модулей унифицированной конструкции с выводомканалов межпроцессорного обмена для возможности масштабированиявычислительного комплекса по количеству многоядерных процессоров,оперативной памяти и периферийных интерфейсов.При участии автора в разработке коммутационных плат корпусовмикросхем осуществлено изготовление процессора R1000 (1891ВМ6Я) сархитектурой «SPARC v9» и трех поколений процессоров с архитектурой«Эльбрус»: Эльбрус-2С+ (1891ВМ7Я), Эльбрус-4С (1891ВМ8Я), Эльбрус-8С(1891ВМ10Я).Этимикросхемыпроцессоровимеюттриканаламежпроцессорного обмена для создания модулей с неоднородным доступом кобщей памяти процессоров с кэш когерентностью (ccNUMA — Non-Uniformmemory access).
Многопроцессорные модули могут иметь до четырех такихмикросхем процессоров, которые связанны между собой одинаковымиканалами межпроцессорного обмена. Для обеспечения ввода-вывода микросхемпроцессоров разработаны корпуса с 1156 выводами для двух контроллеровпериферийных интерфейсов КПИ (1991ВГ1Я) и КПИ-2(1991ВГ2Я). Каждый28такой контроллер с относительно небольшим энергопотреблением около 5 Втимеет интерфейс с процессором и набор современных интерфейсов вводавывода.Конструкции микросхем процессоров Эльбрус-2С+, Эльбрус-4С, КПИ иКПИ-2 выполнены на основе неоднородной полимерной платы корпуса,изготовленной с применением технологии HDBU (ф.ASE, Тайвань) со слоемжесткости и структурами слоев 3-2-3, 4-2-4, 3-2-3, и 5-2-5 соответственно.Отмечены особенности разработки корпуса процессора при условии выпускамалой серии микросхем.Конструкция микросхемы процессора Эльбрус-8С с 2028 выводамивыполнена на основе 28 слоев коммутационной платы из керамики HITCE®(ф.
Kyocera, Япония) и других передовых материалов. Отмечено, что путемприменения такой керамики при частотах передаваемых сигналов по каналаммежпроцессорного обмена более 5 ГГц снижены потери в уровне полезногосигнала.Представлена разработка 4-х процессорного модуля и вычислительныйкомплекс (сервер) Эльбрус-4.4 общего применения на основе микросхемыпроцессора Эльбрус-4С. Четырехпроцессорный модуль на основе микросхемыпроцессора «Эльбрус-4С» имеет высокие показатели унификации и показан всоставе вычислительного комплекса на рисунке 7.Рис 7.
Многопроцессорный модуль вычислительного комплекса Эльбрус-4.4.Этот комплекс выпускается в корпусах под установку в стойку (высотой1U/2U/3U). При этом достигнуты следующие характеристики типового блокапроцессора с сокращением на 15% срока реализации многопроцессорногомодуля после внедрения предложенных в диссертационной работе методовразработки:- скорость передачи данных между микросхемами процессоров – 128 Гб/с(дуплекс) на канал межпроцессорного обмена;29- отвод тепла при максимальной мощности потребления каждой микросхемыпроцессора в 45-55 Вт с пиковой производительностью в 50-60 Гфлопс;- до 3 слотов памяти типа DDR3 у каждой микросхемы процессора с тремяканалами памяти или 12 слотов памяти у модуля;- пропускная способность по каждому каналу памяти составляет 1333 МТ/с;- печатная плата с 12 слоями на основе доступного и широко используемогофольгированного стеклотекстолита, и прокладочной стеклоткани типа FR-4(ф.
Isola, Германия).Представлена разработка 4-х процессорного модуля и вычислительныйкомплекс Эльбрус-8.4 общего применения на основе микросхемы процессораЭльбрус-8С. Четырехпроцессорный модуль на основе микросхемы процессора«Эльбрус-8С» имеет высокие показатели унификации и показан в составевычислительного комплекса на рисунке 8.Рис 8.
Многопроцессорный модуль вычислительного комплекса Эльбрус-8.4.Этот комплекс также выпускается в корпусах под установку в стойку (высотой1U/2U/3U). При этом достигнуты следующие характеристики типового блокапроцессора с сокращением на 25% срока реализации многопроцессорногомодуля после внедрения предложенных в диссертационной работе методовразработки:- скорость передачи данных между микросхемами процессоров – 192 Гб/с(дуплекс) на канал межпроцессорного обмена;- отвод тепла при максимальной мощности потребления каждой микросхемыпроцессора в 75-90 Вт с пиковой производительностью в 250 Гфлопс;- до 8 слотов памяти типа DDR3 у каждой микросхемы процессора с четырьмяканалами памяти или 32 слота памяти у модуля;- пропускная способность по каждому каналу памяти составляет 1600 МТ/с;30- печатная плата с 14 слоями на основе доступного и широко используемогофольгированного стеклотекстолита, и прокладочной стеклоткани типа IT150DA (ф.
Iteq, Тайвань).Предложена компоновка модулей унифицированной конструкции с выводомканалов межпроцессорного обмена. С применением этой компоновкиразработаныоднопроцессорныемодулидлямногопроцессорныхвычислительных комплексов специального применения, на основе несколькихмодулей (blade servers), устанавливаемых в специализированные корпуса иликрейты. В условиях выпуска небольших серий предлагается реализациямногопроцессорного вычислительного комплекса с применением несколькихмодулей. В настоящее время широко представлены процессорные модули двухтипов: первые с набором периферийных интерфейсов и без вывода каналовмежпроцессорного обмена; вторые с выводом каналов межпроцессорного обменаи без набора периферийных интерфейсов. Модули первого типа дляпромышленныхсистемпредлагаютсяразличнымипроизводителямителекоммуникационного оборудования. Модули же второго типа длявоспроизводительных вычислений предлагаются несколькими производителямисуперкомпьютеров.Новизна предлагаемого вычислительного комплекса заключается в наличиинескольких одинаковых однопроцессорных модулей, которые не относятся кизвестным типам.
Предложенный однопроцессорный модуль являетсякомпьютером на плате с выводом каналов межпроцессорного обмена и можетбыть исполнен под конвективный или кондуктивный тип охлаждения. В составетакого модуля имеется микросхема процессора, оперативная память, контроллерпериферийных интерфейсов (южный мост), соединители и разъемыпользователя, носитель данных и другие компоненты.
Несколько таких модулей вкорпусе образуют систему на общей памяти. Этим предлагаемыйвычислительный комплекс отличается от распространенных комплексов с однимпроцессорным модулем в корпусе (типа крейт), которые соответствуютсовременным стандартам для вычислительных устройств.Различные реализации предлагаемого типа вычислительного комплексапредставлены на рисунке 9. Предлагаемые унифицированные однопроцессорныемодули обеспечивают постоянное соотношение количества вычислительныхядер, объема когерентной памяти и пользовательских интерфейсов. Посколькумодули полностью идентичны, то высока масштабируемость и проста настройкас диагностикой неисправности в процессе эксплуатации сервера.
Унификацияпозволила в два раза сократить номенклатуру вычислительных модулей иснизить на 20% их себестоимость. Основным недостатком предлагаемого типавычислительного комплекса является повышенная себестоимость по сравнениюс комплексами других типов. Повышенная себестоимость обусловленаиспользованием соединителей для передачи данных по каждому каналумежпроцессорного обмена, а также возможной избыточностью контроллеровпериферийных интерфейсов.31Рис 9. Унифицированные однопроцессорные модули в составемногопроцессорных вычислительных комплексов специального применения.В заключении приведены основные результаты диссертационной работы иперспективыразвитиятехническихрешенийдляконструкторскотехнологической разработки многопроцессорных модулей вычислительныхкомплексов.Приложения к диссертационной работе содержат:Приложение А – используемые технические средства для разработанныхпрограмм ЭВМ.Приложение Б – перечень основных актов о внедрении результатовдиссертационной работы;Приложение В – перечень ОКР и НИР, в которых были использованырезультаты диссертационной работы;Приложение Г – перечень организаций, использующих вычислительныекомплексы с разработанными многопроцессорными модулями.ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ РАБОТЫ1.Проведено исследование выполненных разработок многопроцессорныхмодулей и определены их основные технические и эксплуатационныехарактеристики с целью улучшения:- пиковая производительность;- пропускная способность каналов обмена с оперативной памятью;- пропускная способность каналов межпроцессорного обмена- масштабируемостьпоколичествумикросхемпроцессоров,оперативной памяти и периферийных интерфейсов.- уровень унификации.322.3.4.5.6.7.Проведен критический анализ существующих методологических подходовразработки модулей на основе сложно-функциональных микросхем дляускоренной реализации многопроцессорных модулей доверенныхвычислительных комплексов и предложены пути решения следующихвзаимосвязанных задач:- выполнение многокритериальной оптимизации;- выполнение планирования трассировки;- обеспечение итеративной отработки проектных решений;- определение эффективной компоновки модуля.Улучшение характеристик многопроцессорных модулей сопряжено срешением основных проблем их конструкторско-технологическойразработки и учетом создания микросхем процессоров:- обеспечение стабильности напряжений в сетях питания микросхемыпроцессора при повышении ее производительности;- обеспечение целостности сигналов каналов обмена с оперативнойпамятью и каналов межпроцессорного обмена при повышении ихпропускной способности;- обеспечение надежности и ремонтопригодности при увеличенииколичества микросхем процессоров, оперативной памяти ипериферийных интерфейсов;- снижение стоимости подготовки к производству и себестоимостисерийного изготовления при повышении уровня унификации.Сформулирована и решена задача многокритериальной оптимизации приприменении структур многопроцессорного модуля в условиях сквознойразработки его составных частей с учетом современных технологий ихизготовления и критериев проектирования.Для обеспечения целостности сигналов и стабильности напряжений всетяхпитанияразработанырасчетно-аналитическиеметодыпроектирования корпуса микросхемы процессора с учетом планированияпериферии ее кристалла и многопроцессорного модуля.С целью обеспечения целостности сигналов разработаны топологическиеметоды проектирования для периферии кристалла микросхемыпроцессора с учетом планирования ее корпуса, автоматизацияприменения которых реализована в средствах проектированиясобственной разработки.Для обеспечения надежности и ремонтопригодности вычислительногомодуля разработаны экспериментальные методы компоновки составныхчастей вычислительного модуля при создании вспомогательногооборудования на этапах проектирования микросхемы процессора,позволяющие проводить итеративный выбор проектных решений.33Предложена оригинальная компоновка унифицированных модулей подустановку в корпус (типа крейт) масштабируемого многопроцессорноговычислительного комплекса, которая за счет исполнений модуля более чемв два раза позволила сократить номенклатуру модулей и в среднем на 25%снизить их себестоимость.9.