Диссертация (1090013), страница 15
Текст из файла (страница 15)
Критериямиоптимизации являлись целевые габариты кристалла и нормы проектированиядля корпусирования.Основной особенностью таблицы выводов микросхемы процессораЭльбрус-4C является гибридное распределение выводов основного питания иземли кристалла. С одной стороны, эти выводы распределены средисигнальных выводов каналов межпроцессорного обмена и ввода-вывода, как втаблице выводов микросхемы процессора AMD Opteron™ 6100. С другойстороны, эти выводы размещаются в нулевой зоне и от границы микросхемы дограницы нулевой зоны имеются ряды неиспользуемых выводов, не требующихсквозных переходных отверстий печатной платы вычислительного модуля.
Ихотсутствиепозволяетуменьшитьомическоесопротивлениесегментовметаллизации, используемых для сети питания процессора.Другаяособенность—этоназначениесигналовтрехканаловмежпроцессорного обмена А и В второй зоны и канала С третьей зоны с цельюих трассировки уходом от микросхемы в двух слоях печатной платы модуля.Это является отличием от таблиц выводов процессоров Opteron™ и Xeon®, гдеэто возможно для такого количества каналов лишь в четырех слоях. Такаяособенность назначения сигналов каналов межпроцессорного обмена позволяетиспользовать только внешние слои печатной платной платы в случаедвухпроцессорных модулей с соединением процессоров всеми тремя каналами.Использование для каналов межпроцессорного обмена лишь внешнихслоев позволяет увеличить скорость передачи данных по данным каналам приусловиииспользованиядляпечатнойплатывычислительногомодулятрадиционных и недорогих материалов.
Это объясняется тем, что на внешнихслоях меньше диэлектрические потери при высокочастотной передачесигналов, например, LVDS (Low-voltage differential signaling). На рисунке 2.2.5представленатопологиямежпроцессорных84каналовреализациичетырехпроцессорного вычислительного модуля с указанием слоев для трасс иих длинны.Рис. 2.2.5. Каналы межпроцессорного обмена многопроцессорного модуля.Первый и четырнадцатый слои являются внешними слоями печатной платывычислительногомодулянаосноветрадиционногофольгированногостеклотекстолита группы FR-4 и прокладочной стеклоткани.
Примером такихматериалов является DURAVER®-E-Cu-117 и Prepreg 1080 фирмы Isola(Германия). На внешних слоях максимально возможная скорость передачиданных по одной дифференциальной паре составила 5 Гб/с, тогда как навнутренних слоях она была равна всего 3 Гб/с.Квадратная матрица выводов процессора Эльбрус-4C со стандартнымшагом между выводами не содержит пустых позиций без выводов.
Такаяматрица позволила минимизировать стоимость подготовки к производствуэлементов корпуса (NRE, non-recurring engineering). При этом значительноснижена себестоимость процессора при выпуске небольших партий, посколькув отличие от процессоров Xeon® или Opteron™ серверные процессорыЭльбрус-4C востребованы на ограниченном рынке доверенной вычислительнойтехники.85Зоны выводов микросхемы и секторы на слоях корпуса процессораЭльбрус-4C допускают использование для коммутационной платы корпусаобщепринятой неоднородной структуры слоев со слоем жесткости. Такаяструктураизготавливаетсясприменениемтрадиционныхполимерныхматериалов.
Эти материалы обеспечивают необходимые уровни стойкости квоздействующимфакторамиширокоприменяютсядлясовременныхмикросхем, включая процессоры Xeon® или Opteron™.2.2.5 Оценка метода для определения параметров таблицы выводовПредложенный метод определения параметров таблицы выводов успешноприменен в различных проектах совместного проектирования перифериикристалла, корпуса микросхемы и вычислительного модуля.
Показано, что длясерверного процессора целесообразно рассматривать таблицу выводов какограничение для совместного проектирования коммутационной платы корпусаи периферии кристалла.Квадратная матрица выводов процессора Эльбрус-4C со стандартнымшагом между смежными выводами по вертикали и горизонтали в 1 мм несодержит пустых позиций без выводов. Выбор такой матрицы позволилминимизировать стоимость подготовки производства и изготовления элементовкорпуса.
При этом значительно снижена себестоимость процессора привыпуске небольших партий, поскольку в отличие от процессоров Xeon® илиOpteron™ серверные процессоры Эльбрус-4C востребованы на ограниченномрынке доверенной вычислительной техники. Практика показала, что стоимостьподготовки к производству корпуса микросхемы со стандартной квадратнойматрицей в 1,5 раза меньше, чем нестандартной прямоугольной.Зоны выводов микросхемы и секторы на слоях коммутационной платыкорпуса процессора Эльбрус-4C допускают использование для корпусаобщепринятой неоднородной структуры слоев со слоем жесткости. Такаяструктураизготавливаетсясприменением86традиционныхполимерныхматериалов.
Эти материалы обеспечивают необходимые уровни стойкости квоздействующимфакторамиширокоприменяютсядлясовременныхмикросхем, включая процессоры Xeon® или Opteron™.Назначение выводов процессора Эльбрус-4C допускает выполнениетрассировки памяти, межпроцессорных каналов, каналов ввода-вывода,сигналов управления, синхронизации и диагностики при использовании пятогокласса точности по ГОСТ 23751-86 и количества слоев печатной платывычислительного модуля, не превышающего числа каналов оперативнойпамяти.2.3 Конденсаторы сети питания серверного процессораВ данном разделе рассмотрены процессы в распределённой сети питаниямикросхемы процессора с общим потреблением более 100 Вт.
Предложенаметодикаучетаиндуктивностейвстроенныхконденсаторов,котораяобуславливает новизну метода определения высокочастотных конденсаторов.Проведена сравнительная оценка падений напряжения питания ядра враспределённой сети питания для варианта микросхемы в корпусе BGA иварианта в корпусе LGA.2.3.1 Целевой импеданс сети питанияСовременные микросхемы многоядерных процессоров с предельнойпроизводительностью имеют потребляемую мощность более 120 Вт. Согласнодорожной карте развития полупроводниковых технологий потребляемаямощность микропроцессоров стационарного применения будет нелинейнорасти, и это несмотря на развитие технологий энергосбережения [39].Сложность построения распределенной сети питания (PDN – power distributionnetwork) микросхемы с таким высоким энергопотребления определяется тем,что необходимо не превысить требуемый целевой импеданс в широкомдиапазоне частот.
Целевой импеданс распределенной сети питания ядра87микропроцессора можно определить, как отношение отклонения напряжения впять процентов от номинала питания V к изменению тока, равному половинымаксимального тока потребления I :V 0,05.(11)I 0.5Для микропроцессора с напряжением питания ядра 0.9 В и максимальным токомZ ЦЕЛЬ потребления в 120 А целевой импеданс равен 0.75 мОм. Требование целевогоимпеданса для всего диапазона частот интуитивно понятное и разумное.Присозданиимикропроцессораоптимальнойнеобходимораспределеннойиспользованиесетипитаниянесколькихуровнейконденсаторов [40]. Эти уровни конденсаторов эффективны на разныхчастотах, как это показано на рисунке 2.3.1а. На тех диапазонах частот, гдеконденсаторы эффективны распределенная сеть будет почти без реактивногосопротивления [41]. На диапазонах частот (1-3) конденсаторы неэффективны,что может привести к значительному падению напряжения из-за превышенияцелевого импеданса.
Для оценки отклонений напряжения на диапазонах (1-2)целесообразнорассмотретьконтурыобщейсхемысетипитания,представленные на рисунке 2.3.1б. Эти контуры учитывают эквивалентнуюпоследовательнуюиндуктивностьисопротивлениеразвязывающихконденсаторов.Наиболее высокочастотные конденсаторы расположены на кристалле иэффективны на частотах от 100 МГц. Для кристалла, изготовленного потехнологии 65 нм и площадью 400 мм 2 , оценка суммарной емкости этихконденсаторов равна 1 мкФ.
Высокочастотные конденсаторы корпуса и зоны внепосредственной близости от нее эффективны в диапазоне от 10 МГц до 60МГц. Среднечастотные конденсаторы на плате эффективны в диапазоне от 1МГц до 10 МГц. Конденсаторы в составе источников питания или большойемкости являются низкочастотными и эффективны в диапазоне от 1 кГц до1 МГц.88Одним из путей улучшения распределенной сети питания являетсяреализация как можно большего числа уровней конденсаторов для различныхдиапазонов частот. Однако такой подход невозможно реализовать из-затехнологических и конструкторских ограничений. Поскольку прогнозируетсялишьпонижениецелевогоимпедансадлябудущихпоколениймикропроцессоров, то необходимо учитывать процессы в представленныхчастотных контурах при толчке тока потребления.Рисунок 2.3.1.
Распределенная сеть питания:а) импеданс на разных частотах;б) общая схема сети питания.2.3.2 Процессы в частотных контурахОбщееизменениенапряжениясостоитизIR-измененияиdidt-изменения [42]. При заряженных конденсаторах каждого частотного контурападение напряжения V при меняющемся токе потребления I определяется89характеристическимимпедансомконтура,которыйзависитотобщейиндуктивности LК и емкости C К контура:V I Z K .(12)LK.(13)CKВ случае самого высокочастотного диапазона (1) происходит падениеZK напряжения V из-за самоиндукции контура с общей индуктивностью LК притолчке тока потребления dI dt :V LКdI,dt(14)Толчок тока микропроцессора с тактовой частотой 1.8 ГГц вследствие выхода изспящего режима может достигать 2А/нс, хотя типичные толчки тока вполностью активном состоянии 0.5 А/нс [43]. При допустимом уровнеотклонения напряжения в 50 мВ оценка требуемой индуктивности для толчков в2 A/нс и 0.5 А/нс будет соответственно 25 пГн и 100 пГн.