Дедупликация страницы исполняемого кода драйверов OC Windows (1187398), страница 3
Текст из файла (страница 3)
И выбор конкретной технологии зависит от поставленной задачи [26].Эмуляция.Эмулируется каждая команда процессора. То есть на одну ассемблерную командуэмулируемого кода приходится насколько команд физического процессора. Этот способнадежен (обеспечивает полную изоляцию), универсален (позволяет исполнять на однойархитектуре процессора программы, написанные для другой), но чересчур медленный.Бинарная (динамическая) трансляция.8В данном случае, только "проблемные" (то есть те, исполнение которыхразличается в зависимости от того, в каком кольце защиты процессора они исполняются)команды гостевой OC перехватываются гипервизором или монитором виртуальноймашины. После того как эти команды заменяются на безопасные, происходит возвратуправления гостевой ОС.Стаббирование.Более быстрый способ, чем бинарная трансляция.
Очень похож на нее, но ссозданием "стабов", то есть если в бинарной трансляции анализируется каждый кусоккода, то тут некоторые участки кода сразу вызывают переключение в гипервизор.Паравиртуализация.Паравиртуализация — техника виртуализации, при которой гостевыеоперационные системы подготавливаются для исполнения в виртуализированной среде,для чего их ядро незначительно модифицируется. Операционная система взаимодействуетс программой гипервизора, который предоставляет ей гостевой API, вместоиспользования напрямую таких ресурсов, как таблица страниц памяти.
Методпаравиртуализации позволяет добиться более высокой производительности, чем методдинамической трансляции.Аппаратная виртуализация.Аппаратная виртуализация — виртуализация с поддержкой специальнойпроцессорной архитектуры. В отличие от программной виртуализации, с помощью даннойтехники возможно использование изолированных гостевых систем,управляемых гипервизором напрямую. Гостевая система не зависит от архитектурыхостовой платформы и реализации платформы виртуализации. Например, с помощьютехнологий аппаратной виртуализации возможен запуск 64-битных гостевых систем на32-битных хостовых системах.Аппаратная виртуализация обеспечивает производительность, сравнимую спроизводительностью невиртуализованной машины, что дает виртуализации возможностьпрактического использования и влечет её широкое распространение.
Наиболеераспространены технологии виртуализации Intel-VT и AMD-V. [2, 7, 8, 27].Особенности аппаратной виртуализации []:•Монитор виртуальной машины(ВММ) исполняется как vmroot.•Гость исполняется со своими обычным полномочиями.•Большая часть системных данных процессора описана в vmcs.•Vmexit-ы в случае доступа к невиртуализованным данным.1.4.2. Драйверы в ОС WindowsЯдро.9Термин "ядро" а ОС Windows имеет несколько значений.
В данной работе во"Введении" и в "Архитектуре решения" под ядром ОС будет чаще всего пониматься ккоду, работающему в режиме ядра процессора. В части "Метод решения и реализация"под термином "ядро" будет пониматься ntoskrnl.exe.Драйверы.В современных ОС для управления каждым подключенным к компьютеруустройством ввода-вывода требуется специальная программа, учитывающая егоособенности.
Она называется драйвером устройства. Каждый драйвер устройствауправляет обычно одним типом (или как максимум одним классом) устройств.Большинство современных ОС исполняют драйвера в контексте ядра ОС. Функциидрайверов устройств: принятие абстрактных запросов на чтение-запись отабстрагированного от оборудования ПО и остлеживание порядка их выполнения;инициализация устройств; управление устройством.
Кроме того, все драйвера в системеимеют одинаковый интерфейс. [5]Рассмотрим, как дело обстоит в ОС Windows. Драйверы устройств являютсязагружаемыми модулями режима ядра (как правило это файлы с расширением .sys). Ониобразуют интерфейс между диспетчером ввода-вывода и соответствующимоборудованием. Эти драйверы выполняются в режиме ядра в одном из трех контекстов:•вывода;•в контексте пользовательского потока, инициировавшего функцию вводав контексте системного потока режима ядра;•как результат прерывания (а значит, не в контексте какого-либо процессаили потока, который был текущим на момент прерывания). [1]На Рис.1.
изображено внутреннее устройство ядра ОС Windows. Как видим,драйверы играют в ней очень важную роль.10В Windows для управления устройством загружается драйвер устройства исоздается объект драйвера (Driver Object), в котором представлены свойства устройства иданы указатели на реализованный в нем функции для обработки запросов ввода-вывода.1.4.3. Трансляция виртуального адреса в физическийОпределенияPage Table – структура, позволяющая производить трансляцию виртуальныхадресов в физические.Page Table Entry (PTE) – элементы данной структуры, содержащие PFN и атрибутыфизической страницы.Page Frame Number (PFN) – номер элемента базы данных PFN, которая содержитописания всех физических страниц в системе. [1, 2].Структуры трансляции адресов в x-64 системах.Пусть есть виртуальный адрес, он состоит из указателей на каталоги страниц, накарту страниц, на таблицы страниц, указатель на PTE (см.
пункт 1.4. "Обзор литературы.Определения".) внутри таблицы страниц и на байт внутри страниц. См. Рис. 5.Для перевода виртуального адреса в физический, необходимо пройти по всемкаталогам, находим нужный PTE, из которого получаем информацию о том, какая жефизическая страница, описываемая в базе данных PFN, содержит нужную информацию [1,2].11Рис. 5.
Трансляция виртуального адреса в физический на платформа х64Структура PTE (Page Table Entry)Структура Page Table Entry нуждается в более детальном рассмотрении.Она состоит из двух основных частей, первая это номер PFN, то есть номерэлемента в базе данных PFN, который отвечает за данную физическую страницу, инекоторых атрибутов, из которых нам важны только два - это Writable и Copy On Write [1,2]. См. Рис. 6.Рис. 6. Структура Page Table Entry.121.4.4.
Уровни прерываний в ОС WindowsПрерывания и исключения - ситуации, в которых прерывается нормальный потоквыполнения кода процессором. Прерывание (interrupt) - асинхронное событие, например,генерируемое внешним (по отношению к процессору) устройством. Оно может произойтив любой момент независимо от текущих команд, выполняемых процессором. Исключение(exception) - синхронное событие, результат выполнения определенной команды.Например, ошибки доступа или деление на нуль.Уровни запросов программных прерываний (interrupt request levels, IRQL)необходимы для реализации приоритетов прерываний.
Чем выше номер уровня, темприоритетнее прерывание. Прерывания обслуживаются в порядке их приоритета, ипрерывания с более высоким IRQL вытесняют обработку прерываний с меньшим [1].На нулевом (PASSIVE LEVEL) уровне IRQL работают пользовательские процессыи часть кода операционной системы. Программа, работающая на этом уровне, может бытьвытеснена почти любым событием, случившимся в системе.
Большинство процедуррежима ядра старается удерживать IRQL уровень процессора как можно более низким.IRQL уровни 1 (APC LEVEL) и 2 (DISPATCH LEVEL) предназначены для так называемыхпрограммных (в терминологии Microsoft) прерываний соответственно: асинхронныйвызов процедуры - APC (asynchronous procedure call) и отложенный вызов процедуры DPC (deferred procedure call).
Если ядро принимает решение выполнить некоторуюсистемную процедуру, но нет необходимости делать это немедленно, оно ставит ее вочередь DPC и генерирует DPC прерывание. Когда IRQL процессора станет достаточнонизким, эта процедура выполняется. IRQL уровни 3-26 относятся к обычнымпрерываниям от устройств. [1]1.4.5. Механизм Copy On WriteОпределение:Копирование при записи (Copy On Write) – оптимизация, используемаядиспетчером памяти для экономии физической памяти.Главная идея: при копировании областей данных создавать реальную копию толькокогда ОС обращается к этим данным с целью записи. Таким образом, это один изпримеров отложенных вычислений (lazy evaluation) [1, 5].Существующие методы использования:Copy On Write в Linux – используется, например, при вызове fork() или при работеKSM.Copy On Write в Windows для Paged Memory – используется менеджером памяти.13Но в Windows нет Copy On Write для NonPaged Memory - для неподкачиваемогопула памяти.
Это связано с тем, при высоких уровнях прерываний (IRQL) нельзя выделятьстраницы.142. РешениеВ данной создается метод: алгоритм и его рабочая реализация, которые заменяют впамяти несколько идентичных наборов страниц кода драйвера одним единственнымэкземпляром.2. 1. Предлагаемый метод решенияПредлагаемый метод решения состоит из следующих ключевых пунктов:•Обнаружение драйверов и поиск страниц, пригодных для «слияния»;•Создание общего набора физических страниц;•Подмена страниц драйвера страницами из общего набора;•Возвращение неиспользуемых страниц в систему;•При попытке записи на страницу создание ее копии, доступной только этомудрайверу (механизм COW);•При отгрузке корректное возвращение всех занимаемых ресурсов.Каждый из этих этапов будет более подробно описан в пункте 2.1.2.
"Жизненныйцикл драйвера".2. 1.1. Плюсы и минусы относительно других методовНе требуется сканирование памяти. В данной системе можно заранее определитьобслуживаемые имена драйверов и типы страниц. Так как известно имя драйвера, скоторым предстоит работа, можно не искать его страницы, сканируя всю память системы,а отслеживать момент его загрузки [21, 23].2.1.2. Жизненный цикл драйвераВ этом пункте более подробно рассматривается предлагаемый метод решениязадачи.
Он иллюстрируется жизненным циклом одного драйвера. Сначала описывается таситуация, которая была в системе изначально, а после показывается, как будет работатьсистема в при применении разработанного метода.2.1.2.1. Начальная ситуация.Было раньше.15Раньше, в системе была конкуренция за ресурсы, это видно на Рис.1. Пустьсуществуют два драйвера в системе: драйвер1 и драйвер2, каждого из которых есть набориспользуемых им страниц. Однако, свободной памяти в системе не хватает сразу на двадрайвера и возникают проблемы.Рис1.
Было раньше.2.1.2.2. Начало работыРассмотрим процесс загрузки и начала работы нового экземпляра драйвера вслучае дедупликации.Пусть в системе так же как и в предыдущем случае существуют 2 драйвера. Укаждого из них есть свой набор страниц. Теперь же, эти два драйвера перестают ссылатьсяна свои наборы страниц, и начинают ссылаться на общий набор страниц, которыйидентичен каждому из их наборов страниц.