Диссертация (1150736), страница 29
Текст из файла (страница 29)
Цель заключается в увеличении напряжения питания вентиля . Дляэтого напряжение противоположного знака прикладывается к подложке транзистора. Эксперименты с транзисторами в 65 нм КМОП технологии показали,что сдвиг потенциала подложки уменьшает ток утечки на 20%-30% при номинальном напряжении питания. Недостатком подхода является необходимостьдополнительного напряжения питания, что усложняет схему питания устройства.A.5Несколько сигналов тактированияРазработка специализированных полупроводниковых схем часто включаетинтеграцию готовых компонент, кроме компонент, разработанных специальнопод требования производительности разрабатываемой схемы.
При этом готовые блоки могут иметь избыточную или недостаточную производительность.Для достижения необходимой производительности требуется повышение частоты и напряжения питания критических компонент. Для других компонентможет использоваться пониженная частота тактирования. Кроме того, можетиспользоваться пониженное напряжение питания. Наличие нескольких генераторов тактовой частоты усложняет схему и требует синхронизации между модулями с различной частотой тактирования. Частным случаем являетсякратная частота тактирования.
Например, память может работать с удвоеннойили половиннойчастотой по сравнению с вычислительной логикой. Кратнаячастота не требует сложной синхронизации.A.6Отключение тактированияОтключение тактирования часто используется на практике для экономииэнергии. Оно применяется, если часть схемы простаивает в течение длительного времени. Экономия энергии достигается в результате отключения схемыраспространения тактовых импульсов и исключения переходных процессов.182Отключение тактирования не влияет на токи утечки и не уменьшает статическую мощность.A.7Уменьшение переходных процессовДо установления выходного сигнала вентиля в нем происходят переходныепроцессы вызванные задержкой между установлением входных сигналов.
Переходные процессы завершаются при установлении устойчивого уровня входных сигналов для вентиля или группы вентилей. Эти переходные процессыприводят к перезарядке емкостей и увеличению активной мощности схемы.Если входные сигналы устанавливаются одновременно, то это приводит куменьшению переходных процессов. Для этого длины путей в схеме должныбыть сбалансированы. Древовидные схемы имеют более короткие и сбалансированные пути по сравнению с цепочками. Использование конвейера такжеприводит к балансировке и укорачиванию путей, поскольку ложные значенияне распространяютсячерез буферные регистры.A.8Стекирование транзисторовПри использовании этого метода транзисторы соединяются цепочкой между питанием и землей.
Это приводит к росту напряжения в точках сочленениямежду транзисторами, что приводит к росту порогового напряжения транзисторов, не подключенных к земле напрямую. Повышение порогового напряжения приводит к уменьшению тока утечки и, таким образом, статическогоэнергопотребления.A.9Вентили с различными пороговыми напряжениямиДля уменьшения мощности могут использоваться вентили с различным пороговым напряжением. Стандартные библиотечные вентили обычно доступныв трех вариантах: со стандартным, высоким и низким пороговым напряже183нием. Вентили с высоким пороговым напряжением имеют токи утечки напорядок меньшие, чем вентили с низким пороговым напряжением, однакоих задержка переключения существенно больше.
Таким образом, на критическом пути можно использовать вентили со стандартным или низким пороговым напряжением, а в остальной части схемы вентили с высоким пороговым напряжением. Этот метод в основном уменьшает статическую мощностьустройства, поскольку вентили, не находящиеся на критическом пути имеютменьшую задержку. Напрактике 98% всех вентилей в малопотребляющей схеме могут иметь высокое пороговое напряжение. Может также наблюдатьсянебольшое уменьшение активной мощности за счет уменьшения переключаемой емкости и размаха сигнала во внутренних точках вентиля.A.10Дупликация блоковОдним из методов распараллеливания на аппаратном уровне является дупликация аппаратных блоков, например умножителей, сумматоров или процессоров соединенных в параллель. В этом случае блоки могут работать наболее низкой частоте, сохраняя требуемую производительность, что позволяетуменьшить напряжение питания по сравнению с последовательными вычислениями.
При увеличении количества блоков переключаемая емкость и токиутечки возрастают быстрее, чем линейно. Дополнительные накладные расходы вызываются необходимостью мультиплексирования данных, синхронизации и увеличения длины соединений. Дупликация блоков приводит к росту площади и может потенциально увеличить стоимость изготовления кристалла. Для низкомикронных технологических процессов площадь логическихсхем не является ограничивающим фактором для схем средней сложности, поскольку минимальная площадь кристалла определяется плотностью контактных площадок для внешних соединений.
Дупликация блоков имеет смыслтолько при использовании векторных и параллельных алгоритмов, которыемогут их задействовать.184A.11КонвейеризацияДругим подходом к распараллеливанию вычислений является конвейеризация. Целью конвейеризации является выравнивание и ограничение критических путей, что позволяет снизить тактовую частоту и напряжение питания.Использование конвейера приводит к дополнительным расходам на регистрыдля буферизации данных между стадиями.A.12Распределение ресурсовРаспределение ресурсов может приводить к существенному уменьшениючастоты переключения транзисторов, что уменьшает активную мощность.Мультиплексирование ресурсов приводит к уменьшению площади, но частота переключения может возрасти из-за некореллированности мультиплексированных данных и привести к росту энергопотребления.
Использование независимых схем обработки для коррелированных данных может привести к уменьшению активной мощности за счет роста статической мощности при увеличении площади схемы.A.13Оптимизация представления данныхДля представления числовых данных может использоваться формат чиселс фиксированной и плавающей точкой. Битовая ширина чисел с плавающейточкой как правило кратна 8. Ширина чисел с фиксированной точкой можетбыть произвольной.
Промежуточные данные обычно хранятся в формате сфиксированной точкой. Уменьшение ширины данных ведет к экономии энергии, увеличение ведет к увеличению точности. Точность входных и выходныхданных обычно задается внешними требованиями. Точность промежуточныхданных следует минимизировать для уменьшения сложности схемы, при ограничениях на точность выходных данных. Поскольку округление и насыщение- нелинейные операции, их следует по возможности избегать, для выполнения линейных арифметических оптимизаций и упрощения анализа точности.Например, суммматору требуется + 1 бит результата для сложения 2 чисел185длины в арифметике дополнения 2 без переполнения. Рассмотрим реализацию по определению КИХ фильтра длины .
Для нее требуется −1 сумматоров, соединенных цепочкой. Первый сумматор имеет 2 входа длины бит.Последний сумматор в цепочке без оптимизации ширин будет иметь ширинувыхода + . При древовидном переписывании формулы КИХ фильтра видим, что без потери точности можно сократить ширину выхода до +⌈2 ⌉без переполнения и потери точности. Во многих случаях вероятность возникновения переполнения или недополнения на реальных данных очень мала. Вэтом случае можно использовать насыщение и округление для уменьшенияширины промежуточных данных при сохранении точности в среднем. Уменьшение ширины данных приводит к упрощению схемы и экономии энергии.A.14Арифметические оптимизацииК арифметическим оптимизациям относится изменение архитектуры с целью уменьшения частоты переключения транзисторов для вычисления результата. Также к ним относится уменьшение стоимости используемых элементарных операций.
Элементарные целочисленные операции могут быть упорядочены по сложности в порядке убывания: деление, умножение, сложение,сдвиги, побитовые операции. Для примера рассмотрим КИХ фильтр с известными константными коэффициентами. В этом случае умножение может бытьзаменено на набор сдвигов и сложений, которые имеют меньшую стоимостьвычисления чем умножитель. Такая замена уменьшает площадь, задержку иэнергопотребление схемы.A.15Мультиплексирование ресурсов по времениТоки утечки, определяющие статическую мощность, зависят от количествавентилей в схеме.
Таким образом, уменьшение количества вентилей в схемеприводит к уменьшению статической мощности. Для этого различные функциональные блоки внутри схемы могут переиспользоваться в алгоритме вычислений. При этом если требуемый ресурс занят, то промежуточные данныевыгружаются в память до освобождения ресурса.186По сравнению с прямым отображением графа потока данных алгоритма ввычислительную схему, для мультиплексирования ресурсов требуется дополнительная управляющая логика и регистровый файл или адресуемая памятьдля промежуточных данных. Если ресурсы простаивают, то мультиплексирование приводит к существенной экономии энергии, несмотря на накладныерасходы.