Главная » Просмотр файлов » К. Касперски - Техника оптимизации программ, Эффективное использование памяти

К. Касперски - Техника оптимизации программ, Эффективное использование памяти (1127752), страница 25

Файл №1127752 К. Касперски - Техника оптимизации программ, Эффективное использование памяти (К. Касперски - Техника оптимизации программ, Эффективное использование памяти) 25 страницаК. Касперски - Техника оптимизации программ, Эффективное использование памяти (1127752) страница 252019-05-11СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 25)

Поэтому, независимо от порядка обращения к данным, ВЕРО всегда работает на максимально возможной скорости и лля частоты 66 МГц ее формула выглядит так: 5-1-1-1, что на 40% быстрее ЕРО РКАМ! Все же, несмотря на свои скоростные показатели, ВЕРО оказалась не конкурентоспособной и не получила практически никакого распространения. ггг Глава 2 Просчет состоял в том, что ВЕРО, как и все ее предшественники, оставалась асинхронной памятью. Это накладывало жесткие ограничения на максимально достижимую тактовую частоту, ограниченную 60 — 66 (75) МГц. Действительно, пусть время рабочего цикла составляет 15 нс (1 такт в системе с частотой 66 МГц).

Однако поскольку "часы" контроллера памяти и самой микросхемы памяти не синхронизованы, нет никаких гарантий, что начало рабочего цикла микросхемы памяти совпадет с началом такового импульса контроллера, вследствие чего минимальное время ожидания составляет два такта. Вернее, если быть совсем точным, рабочий цикл никогда не совпадает с началом тактового импульса. Несколько наносекунд уходит на формирование контроллером управляющего сигнала КАБ или САБ, за счет чего он уже не совпадет с началом тактирующего импульса.

Еше несколько наносекунд требуется для стабилизации сигнала и "осмысления" его микросхемой, причем, сколько именно времени потребуется, заранее определить невозможно, т. к, на результат влияет и температура, и длина проводников, и помехи на линии, и еше миллион факторов! 80йАМ (ЗупсГ1гопо(йа 0ВАМ)— синхронная 0йАМ Появление микропроцессоров с тактовой частотой в 100 МГц привело к радикальному пересмотру механизма управления памятью, что привело к созданию синхронной динамической памяти — ЯРКАМ (Яупс)ггопопз РКАМ, синхронная ОКАМ).

Как и следует из ее названия, микросхемы ЯРКАМ- памяти работают синхронно с контроллером, что гарантирует завершение цикла обмена в строго заданный срок. (Помните, "как хочешь, крутись, теща, но чтобы к трем часам как штык была готова".) Кроме того, номера строк и столбцов подаются с таким расчетом, чтобы к приходу следующего тактового импульса сигналы уже успели стабилизироваться и были готовы к считыванию. Также в БОКАМ реализован усовершенствованный пакетный режим обмена.

Контроллер может запросить как одну, так и несколько последовательных ячеек памяти, а при желании — даже всю строку целиком! Это стало возможным благодаря использованию полноразрядного адресного счетчика уже не ограниченного, как в ВЕРО, двумя битами. Другое усовершенствование. Количество матриц (банков) памяти в БОКАМ было увеличено сначала с одного до двух, а затем и до четырех.

Это позволило обращаться к ячейкам одного банка параллельно с перезарядкой внутренних цепей другого, что (при условии правильного планирования потоков данных, см. разд. "Стратегия распределения данных по РКАМ-банкам" этой главьг) приблизительно на 30% увеличивает производительность. Оперативная память Помимо этого, появилась возможность одновременного открытия двух (четырех) страниц памяти, причем открытие одной страницы (т.

е. передача номера строки) может происходить во время считывания инФормации с другой, что позволяет обращаться к новому столбцу ячейки памяти на каждом тактовом цикле. В отличие от ГРМ РВАМ/ЕРО РКАМ/ВЕРО, выполняющих перезарядку внутренних цепей при закрытии страницы (т. е. при сбросе сигнала КАК), синхронная память проделывает эту операцию автоматически, позволяя держать страницы открытыми столь долго, сколько зто угодно (рис. 2.7).

Рис. 2.т. Временная диаграмма, иллюстрирующая работу ВЕ00 0НАМ и 80ЯАЬл памяти Наконец, разрядность линий данных увеличилась с 32 до 64 бит, что еще вдвое увеличило ее производительность! Формула чтения произвольной ячейки из закрытой строки для ЯЭКАМ обычно выглядит так: 4-1-х-х, а открытой так: 2-1-х-х. 11а Глава 2 В настоящее время достаточно большое количество персональных компьютеров все еще оснащены именно БРКАМ-памятью, которая пока прочно удерживает свои позиции, несмотря на активный натиск современных разработок. ООВ 80ВАМ, 80ВАМ И (ОоиЫе Оа1а Ва$е 80ВАМ) 80ВАМ с удвоенной скоростью передачи данных Дальнейшее совершенствование синхронной памяти привело к появлению РРК Я)КАМ вЂ” РоиЫе РаГа КаГе БРКАМ (ЯРКАМ с удвоенной скоростью передачи данных).

Удвоение скорости достигается за счет передачи данных и по фронту, и по спаду тактового импульса гв БРКАМ передача данных осуществляется только по фронту). Благодаря этому эффективная частота увеличивается в два раза — 100 МГц РРК БРКАМ по своей производительности эквивалента 200 МГц ЯИАМ (на самом деле, это не совсем так, см. разд.

"Вычисление полного времени доступа" этой главы). Правда, по маркетинговым соображениям производители РРК-микросхем стали маркировать их не тактовой грабочей) частой, а максимально достижимой пропускной способностью, измеряемой в мегабайтах в секунду. Таким образом РРК- 1600 работает вовсе не на 1,6 ГГц гчто пока является недостижимым идеалом), а всего лишь на 100 МГц, но обладает пропускной способностью 1600 Мбайт/с.

Соответственно, РРК-2100 работает на частоте 133 МГц и обладает пропускной способностью 2100 Мбайт/с. Претерпела изменения и конструкция управления матрицами гбанками) памяти. Во-первых, количество банков увеличилось с двух до четырех, а„вовторых, каждый банк обзавелся персональным контроллером 1не путать с контроллером памяти!), в результате чего вместо одной микросхемы мы получили как бы четыре, работающих независимо друг от друга. Соответственно, максимальное количество ячеек, обрабатываемых за один такт, возросло с одной до четырех. ВОВАМ (ВаГПЬиз ОВАМ) — Вап)Ьиз-память С РРК БРКАМ жесточайшим образом конкурирует Р)гесг КРКАМ, разработанная компанией КашЬцз.

Вопреки распространенному мнению, ее архитектура довольно прозаична и не блещет какой бы то ни бьио революционной новизной. Основных отличий от памяти предыдущих поколений всего три: 13 увеличение тактовой частоты за счет сокращения разрядности шины; Г3 одновременная передача номеров строки и столбца ячейки; С) увеличение количества банков для усиления параллелизма. А теперь обо всем этом подробнее.

Повышение тактовой частоты вызывает резкое усиление всевозможных помех и в первую очередь электромагнитной Оперативная память интерференции, интенсивность которой в общем случае пропорциональна квадрату частоты, а на частотах свыше 350 МГц вообще приближается к кубической. Это обстоятельство налагает чрезвычайно жесткие ограничения на топологию и качество изготовления печатных плат модулей микросхемы, что значительно усложняет технологию производства и себестоимость памяти. С другой стороны, уровень помех можно значительно понизить, если сократить количество проводников, т.

е. уменьшить разрядность микросхемы. Именно по такому пути компания КашЬцз и пошла, компенсировав увеличение частоты до 400 МГц (с учетом технологии Р1Ж эффективная частота составляет 800 МГц) уменьшением разрядности шины данных до 16 бит (плюс два бита на ЕСС вЂ” Еггог Соггесг Сог$е). Таким образом, Ейгес! КОКАМ в четыре раза обгоняет РРК-1600 по частоте, но во столько же раз отстает от нее в разрядности! А от РРК-2100 О)гесг КРКАМ отстает конкретно, и это при том, что себестоимость ИЖ заметно ниже! Второе (по списку) преимушество КОКАМ вЂ” одновременная передача номеров строки и столбца ячейки — при ближайшем рассмотрении оказывается вовсе не преимуществом, а конструктивной особенностью.

Это не уменьшает латентности чтения произвольной ячейки (т. е. интервалом времени между подачей адреса и получения данных), т. к. она в большей степени определяется скоростью ярда, а КОКАМ функционирует на старом ядре. Из спецификации КОКАМ следует, что время доступа составляет 38,75 нс (для сравнения время доступа 100 МГц 8 РКАМ составляет 40 нс). Ну, и стоило было огород городить? Стоило! Большое количество банков позволяет (теоретически) достичь идеальной конвейеризации запросов к памяти, несмотря на то, что данные поступают на шину лишь спустя 40 нс после запроса (что соответствует 320 тактам в системе с частотой 800 МГц), сам поток данных непрерывен.

Стоило?! Для потоковых алгоритмов последовательной обработки памяти это, допустим, хорошо, но во всех остальных случаях КОКАМ не покажет никаких преимуществ перед РРК БОКАМ, а то и обычной ЯЖАМ, работающей на скромной частоте в 100 МГц. К тому же (как будет показано далее, см, главу 3), солидный объем кэш-памяти современных процессоров позволяет обрабатывать подавляющее большинство запросов локально, вообще не обращаясь к основной памяти или, на худой конец, отложить это обращение до "лучших времен". Производительность КРКАМ-памяти реально ощущается лишь при обработке гигантских объемов данных„например, при редактировании изображений полиграфического качества в РЬогозйор.

Таким образом, использование КРКАМ в домашних и офисных компьютеров ничем, кроме желания показать свою "крутость", не оправдано. Для высокопроизводительных рабочих станций лучший выбор — 1НЖ БОКАМ, не уступающая КРКАМ в производительности, но значительно выигрывающая у нее в себестоимости. Глава с В этом свете не очень понятно стремление кол1пании 1пге! к продвижению КашЬцз-памяти на рынке. Еше раз обращу внимание читателя: ничего революционного КагпЬцз в себе не несет. Чрезвычайно сложная и требовательная к качеству производства интерфейсная обвязка обеспечивает высокую тактовую частоту, но не производительность! Соотношение 400х2 МГц при 16 бит оптимальным соотношением категорически не является уже хотя бы потому, что РРК ЯРКАМ без особых ухищрений "тянет" 133х2 МГц при 64 бит. Причем производители РРК ЯРКАМ в ближайшем будущем планируют взять барьер в 200х4 МГц на 128 бит, что увеличит пропускную способность до 12,8 Гбайт/с, что в восемь раз превосходит пропускную способность Р!гесг КРКАМ при меньшей себестоимости и аппаратной сложности! Не стоит, однако, бросаться и в другую крайность, считая КагпЬцз "кривой" и "идиотской" памятью.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее