Лекция №2. Узлы современного компьютера (1244996), страница 5
Текст из файла (страница 5)
Например, Opteron 8435 по цене $2649. 2.6 ГГц, 75 Вт, частота шины достигает 4,8 ГГц. На каждоеядро приходится по 128 Кб кэша первого уровня и по 512 Кб кэша второго уровня, кэш третьего уровняобъѐмом 6 Мб делится между шестью ядрами. Напряжение 1.3 В. Цены на другие шестиядерные процессорыниже, например, Opteron 2427 (2.2 ГГц) — $455.По технологии 45 нм выпускаются также четырехядерные процессоры серий Phenom II X4 800 и 900 (Deneb) итрехядерные Phenom II X3 700 (Heka).Разработан ряд процессоров для настольных компьютеров. Примером двухядерного процессора служитAthlon II X2 250, 2 х 1 Мб кэша второго уровня, частота 3.0 ГГц, мощность 65 Вт, 45 нм проектные нормы, цена$87.
По цене $102 выпускается AMD Phenom II X2 550, 3,1 ГГц, переведенный на 45 нм технологию.Начинаются поставки процессоров Neo для тонких и легких ноутбуков. Частота 1,6 ГГц, технология 65 нм, впроцессоре два ядра.В 2011 году AMD планирует выпуск по 32 нм технологии процессоров серий Opteron 6000 и Opteron 4000 счислом ядер от 12 до 16. AMD разработан графический процессор, поддерживающий Microsoft DirectX11(специальный графический интерфейс для взаимодействия операционной системы и приложенийс драйверами видеокарты).В суперкомпьютере IBM Roadrunner, мировом лидере по производительности 2008 г., использованыпроцессоры Opteron 1.8 ГГц и PowerXCell 3.2 ГГц. PowerXCell имеет многоядерную архитектуру, включаетодин главный и восемь дополнительных процессорных элементов, выполнен по 65 нм технологии,производительность 14 ...102 Gflop/sДоля (в процентах) продукции компаний в элементной базе суперкомпьютеров по списку Top500 отноября 2007 г.
INTEL-13, AMD-12, IBM -53. Хотя по данным других источников на июль 2008 г. ПроцессорыIntel Xeon используются более чем в 50% суперкомпьютеров, а процессоры AMD Opteron, так и IBM Power5(Power6)- не более чем в 10%.ПамятьОперативная память (англ. Random Access Memory, память с произвольным доступом) —энергозависимая часть системы компьютерной памяти, в которой временно хранятся данные и команды,необходимые процессору для выполнения им операции.
Оперативная память представляет собойупорядоченный массив однобайтовых ячеек, каждая из которых имеет свой уникальный адрес (номер).Передача данных в/из оперативную память процессором производится через сверхбыструю память (кэш).Физически кэш и оперативная память в современных компьютерах, как правило, являютсяполупроводниковыми.Важнейшая характеристика памяти, от которой зависит производительность - это пропускнаяспособность, которая выражается как произведение частоты системной шины на объем данных,передаваемых за каждый такт. В случае с памятью SDRAM мы имеет шину шириной 64 бита или 8 байт.Следовательно, к примеру, пропускная способность памяти типа DDR333 составляет 333 МГц х 8 Байт = 2,7Гбайта в секунду или 2700 Мбайт в секунду.Большая скорость обмена данными хороша тогда, когда их размер относительно велик, но если намтребуется «понемногу с разных адресов» — то на первый план выходит латентность - время, котороетребуется для того, чтобы начать считывать информацию с определѐнного адреса.
C момента, когдапроцессор посылает контроллеру памяти команду на считывание (запись), и до момента, когда эта операцияосуществляется, проходит определѐнное количество времени. Если данные в программе расположены«хаотично» и «небольшими кусками», скорость их считывания становится намного менее важной, чемскорость доступа к «началу куска». Латентность подсистемы памяти зависит не только от неѐ самой, но иот контроллера памяти и места его расположения. Понятия «скорость чтения / записи» и «латентность»,применимы к любому типу памяти — к классической DRAM (SDR, Rambus, DDR, DDR2) и к Кэшу.Кэш — это некая особенная разновидность памяти, которая является своего рода «буфером» междуконтроллером памяти и процессором.
Служит для увеличения скорости работы с ОЗУ. Любая считываемая изпамяти информация попадает не только в процессор, но и в кэш. И если эта же информация (тот же адрес впамяти) нужна снова, сначала процессор проверяет: а нет ли еѐ в кэше? Если есть — информация берѐтсяоттуда, и обращения к памяти не происходит вовсе. Аналогично с записью: информация, если еѐ объѐмвлезает в кэш — пишется именно туда, и только потом, когда процессор закончил операцию записи, изанялся выполнением других команд, данные, записанные в кэш, параллельно с работой процессорного ядра«потихоньку выгружаются» в ОЗУ.
Чтобы в кэш могли поместиться новые, более актуальные, проводитсяотслеживание времени последнего обращения к данным, находящимся в кэше.Скорость обмена данными процессора Pentium 4 со своим кэшам более чем в 10 раз (!) превосходит скоростьего работы с памятью.
Фактически, в полную силу современные процессоры способны работать только скэшем. Систему кэширования приходится делать многоуровневой. Кэш первого уровня (самый «близкий»к ядру) традиционно разделяется на две половины, кэш инструкций (L1I) и кэш данных (L1D). Это разделениепредусматривается «гарвардской архитектурой» процессора, которая является самой популярнойтеоретической разработкой для построения современных CPU. Кэш второго и третьего уровня — L2, L3 .
Онбольше по объѐму, и является уже «смешанным» — там располагаются и команды, и данные. Если ни наодном уровне кэша информация не найдена — идѐт обращение к основной памяти (ОЗУ). Все уровни кэшаработают на той же частоте, что и процессорное ядро.Trace cache – идея сохранять в кэше инструкций первого уровня (L1I) не те команды, которые считаны изпамяти, а уже декодированные последовательности.В зависимости от состава выполняемых операций различают несколько типов памяти. Памя ть спроизвольным дос тупом (операциями как чтения, так и записи) обычно обозначают RAM (RandomAccess Memory), время доступа и, следовательно, цикл обращения к любой ячейке RAM для записиили считывания информации не зависят от места расположения (адреса) ячейки в накопителе.В ЗУ с прямым доступом, к которым относятся ЗУ на дисках, обращение производится также впроизвольном порядке, но не к ячейкам, а к блокам данных (файлам), обрамляемых специальнымисимволами начала и конца.
В ЗУ с последовательным доступом, характерным примером которого являетсяЗУ на магнитных лентах, информация хранится так же, как и в ЗУ на дисках, в виде блоков, которые впределах одного носителя имеют последовательные адреса. Для доступа к какому-либо блоку по егозаданному адресу последовательно ищется нужный том и далее просматриваются все номера блоков,пока не будет найден нужный блок.В качестве элементов оперативной памяти используют ячейки, представляющие собой конденсаторы.Заряженный конденсатор хранит "1", разряженный — "0". Во время считывания информации конденсаторыразряжаются. Кроме того, заряд в конденсаторе из-за утечки хранится ограниченное время (несколькомиллисекунд).
Поэтому необходима подзарядка, которая выполняется в процессе регенерации информации.Это обстоятельство обусловило название памяти подобного типа — динамическая памя ть или DRAM(Dynamic RAM). Малые размеры и простота элементов DRAM позволяют получить довольно большуюемкость памяти, но из-за затрат времени на регенерацию снижается быстродействие.С целью повышения быстродействия DRAM разработано несколько модификаций этого типапамяти. Синхронная память типа SDRAM (Synchronous DRAM) отличается от асинхронной памятитипа DRAM тем, что такты работы памяти засинхронизированы с тактами работы процессора. Этопозволяет исключить циклы ожидания, имеющие место в DRAM.По сравнению с обычной SDRAM в памяти типа DDR SDRAM (Double Date Rate SDRAM) при одной и тойже частоте шины памяти быстродействие удалось увеличить вдвое за счет того, что обращения к памятипроисходят дважды за такт — как по переднему, так и по заднему фронту тактовых сигналов.
В памяти типаDDR2 происходит 4 раза обращение к памяти за такт и, соответственно, возможна работа на большихтактовых частотах. Память меньше тормозит работу процессора. Например, в памяти DDR2-1066 при частотешины 266 обеспечивается частота обращений к памяти 1066 МГц. Память типа DDR3 имеет меньшеепотребление энергии по сравнению с DDR2.В более быстрой ста тической памя ти SRAM (Static RAM) элементами памяти являютсябистабильные ячейки, при считывании информация не теряется и регенерация не требуется.
Поэтому SRAMболее быстродействующая память и используется в качестве кэш-памяти. Однако SRAM значительно дорожеDRAM.Память ROM может быть однократно программируемой, т.е. позволять лишь однократнуюпервоначальную запись информации, или быть перепрограммир уемой памя тью . В последнем случаеразличают виды памяти EPROM (Electrically Programmable ROM) и EEPROM (Electrically ErasableProgrammable ROM), которая называется также флеш-памятью. Свойство репрограммируемости основанона использовании МОП-транзисторов с двумя затворами — основным и скрытым в слое диэлектрика. Подачаимпульса повышенного напряжения на МОП-транзисторы в ячейках, которые должны хранить нули, приводитк появлению на скрытом затворе электрического заряда, препятствующего образованию проводящего канала,что и отождествляется как хранение нуля. Состояние нуля сохраняется практически неограниченное время,но при перепрограммировании заряд ликвидируется с помощью внешнего ультрафиолетового облучения (вEPROM) или электрического импульса, подаваемого на затворы (в EEPROM).В современных настольных компьютерах используется оперативная память двух типов - DDR и DDR2.Старые типы памяти вроде SDRAM сегодня практически не применяются, за исключением устаревших машини некоторых встраиваемых систем.