48674 (Разработка систем хранения информации на RAID-массивах), страница 2
Описание файла
Документ из архива "Разработка систем хранения информации на RAID-массивах", который расположен в категории "". Всё это находится в предмете "информатика" из 1 семестр, которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "информатика, программирование" в общих файлах.
Онлайн просмотр документа "48674"
Текст 2 страницы из документа "48674"
производится обращение практически ко всем дискам массива, то одновременная обработка нескольких запросов невозможна.
Этот уровень подходит для приложений с файлами большого объема и малой частотой обращений (в основном это сфера мультимедиа). Использование только одного диска для хранения контрольной информации объясняет тот факт, что коэффициент использования дискового пространства достаточно высок (как следствие этого – относительно низкая стоимость). Для реализации массива требуется не меньше трех винчестеров.
Преимущества:
-
отказ диска мало влияет на скорость работы массива;
-
высокая скорость передачи данных;
-
высокий коэффициент использования дискового пространства.
Недостатки:
-
сложность реализации;
-
низкая производительность при большой интенсивности запросов данных небольшого объема.
RAID 5
Отказоустойчивый массив независимых дисков с распределенной четностью (Independent Data Disks with Distributed Parity Blocks) (Рисунок 10). Самый распространенный уровень. Блоки данных и контрольные суммы циклически записываются на все диски массива, отсутствует выделенный диск для хранения информации о четности, нет асимметричности конфигурации дисков.
В случае RAID 5 все диски массива имеют одинаковый размер – но один из них невидим для операционной системы. Например, если массив состоит из пяти дисков емкостью 10 Гб каждый, то фактически размер массива будет равен 40 Гб – 10 Гб отводится на контрольные суммы. В общем случае полезная емкость массива из N дисков равна суммарной емкости N-1 диска.
Рисунок 10 – массив RAID 5
В RAID 5 отсутствует выделенный диск для хранения информации о четности. Самый большой недостаток уровней RAID от 2-го до 4-го – это наличие отдельного диска (или дисков), хранящего информацию о четности. Скорость выполнения операций считывания достаточно высока, так как не требует обращения к этому диску. Но при каждой операции записи на нем изменяется информация, поэтому схемы RAID 2–4 не позволяют проводить параллельные операции записи. RAID 5 не имеет этого недостатка, так как контрольные суммы записываются на все диски массива, что делает возможным выполнение нескольких операций чтения или записи одновременно. RAID 5 имеет достаточно высокую скорость записи / чтения и малую избыточность.
Преимущества:
-
высокая скорость записи данных;
-
достаточно высокая скорость чтения данных;
-
высокая производительность при большой интенсивности запросов чтения / записи данных;
-
высокий коэффициент использования дискового пространства.
Недостатки:
-
низкая скорость чтения / записи данных малого объема при единичных запросах;
-
достаточно сложная реализация;
-
сложное восстановление данных.
RAID 6
Отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности (Independent Data Disks with Two Independent Distributed Parity Schemes) (Рисунок 11). RAID 6 – это отказоустойчивый массив независимых дисков с распределением контрольных сумм, вычисленных двумя независимыми способами. Этот уровень во многом схож с RAID 5. Только в нем используется не одна, а две независимые схемы контроля четности, что позволяет сохранять работоспособность системы при одновременном выходе из строя двух накопителей. Для вычисления контрольных сумм в RAID 6 используется алгоритм, построенный на основе кода Рида-Соломона.
Рисунок 11 – массив RAID 6
RAID 6 использует две независимые схемы контроля четности. Этот уровень имеет очень высокую отказоустойчивость, большую скорость считывания (данные хранятся блоками, нет выделенных дисков для хранения контрольных сумм). В то же время из-за большого объема контрольной информации RAID 6 имеет низкую скорость записи. Он очень сложен в реализации, характеризуется низким коэффициентом использования дискового пространства: для массива из пяти дисков он составляет всего 60%, но с ростом числа дисков ситуация исправляется. RAID 6 по многим характеристикам проигрывает другим уровням, поэтому на сегодня не получил коммерческого применения.
Преимущества:
-
высокая отказоустойчивость;
-
достаточно высокая скорость обработки запросов.
Недостатки:
-
низкая скорость чтения / записи данных малого объема при единичных запросах;
-
очень сложная реализация;
-
сложное восстановление данных;
-
низкая скорость записи данных.
RAID 7
Отказоустойчивый массив, оптимизированный для повышения производительности (Optimized Asynchrony for High I/O Rates as well as High Data Transfer Rates) (Рисунок 12). В отличие от других уровней, RAID 7 не является открытым индустриальным стандартом – это зарегистрированная торговая марка компании Storage Computer Corporation. Массив основывается на концепциях, использованных в третьем и четвертом уровнях. Добавилась возможность кэширования данных. В состав RAID 7 входит контроллер со встроенным микропроцессором под управлением операционной системы реального времени (real-time OS). Она позволяет обрабатывать все запросы на передачу данных асинхронно и независимо.
Рисунок 12 – массив RAID 7
RAID 7 – зарегистрированная торговая марка компании Storage Computer Corporation. Блок вычисления контрольных сумм интегрирован с блоком буферизации; для хранения информации о четности используется отдельный диск, который может быть размещен на любом канале. RAID 7 имеет высокую скорость передачи данных и обработки запросов, хорошую масштабируемость. Самым большим недостатком этого уровня является стоимость его реализации.
Преимущества:
-
очень высокая скорость передачи данных и высокая скорость обработки запросов (в 1,5…6 раз выше других стандартных уровней RAID);
-
хорошая масштабируемость;
-
значительно возросшая (благодаря наличию кэша) скорость чтения данных небольшого объема;
-
отсутствие необходимости в дополнительной передаче данных для вычисления четности.
Недостатки:
-
собственность одной компании;
-
сложность реализации;
-
очень высокая стоимость на единицу объема;
-
не может обслуживаться пользователем;
-
необходимость использования блока бесперебойного питания для предотвращения потери данных из кэш-памяти;
-
короткий гарантийный срок.
Matrix RAID
Рисунок 13 – массив Intel Matrix RAID
Matrix RAID – это технология, реализованная фирмой Intel в своих чипсетах начиная с ICH6R (Рисунок 13). Строго говоря, эта технология не является новым уровнем RAID (ее аналог существует в аппаратных RAID-контроллерах высокого уровня), она позволяет, используя небольшое количество дисков организовать одновременно один или несколько массивов уровня RAID 1, RAID 0 и RAID5. Это позволяет за сравнительно небольшие деньги обеспечить для одних данных повышенную надёжность, а для других высокую скорость доступа.
3. Тестовая разработка RAID – массива
В качестве основы тестовой системы мы использовали материнскую плату Intel D925XCV, в южный мост которой встроена поддержка Intel Matrix Storage Technology.
Конфигурация стенда включала также:
-
процессор Intel P4 3,6 ГГц;
-
оперативную память Micron DDR2–533 512 Мб;
-
видеоадаптер ATI Radeon X300 128 Мб.
Эффективность RAID-массива тестировали на двух разных парах винчестеров:
-
Seagate Barracuda 7200.7 SATA NCQ емкостью 160 Гб (ST3160827AS);
-
WD Caviar SE Serial ATA емкостью 120 Гб (WD1200JD).
Тестирование проводилось под операционной системой MS Windows XP Professional SP1. Как уже упоминалось выше, встроенная технология Intel Matrix Storage Technology позволяет создавать RAID-массивы «нулевого» и «первого» уровней. Причем всего на двух винчестерах можно построить RAID 0 и RAID 1. Для этого на обоих накопителях симметрично выделяется часть пространства под один массив, а часть – под другой.
Что для измерения производительности мы тестировали системы, построенные на основе RAID-массива «нулевого» уровня. На таких конструкциях проводились испытания отказоустойчивости RAID 1, построенного с использованием технологии Intel Matrix Storage Technology. Испытания прошли успешно. При имитации выхода из строя одного HDD (винчестер просто отключался от системы) информация сохранялась на «уцелевшем» накопителе. А после подсоединения другого исправного винчестера можно легко восстановить исходное состояние RAID-массива.
Для установки и настройки этого RAID 0 существует два пути.
Первый: создать массив с помощью RAID BIOS'а и установить ОС на него. При этом важно не пропустить при инсталляции системы момент, когда со специальной дискеты нужно установить драйвер RAID-контроллера, без которого установщик Windows просто не увидит винчестеры.
Для пользователей, которые привыкли к более удобному «дружественному» графическому интерфейсу, больше подойдет второй способ. Система устанавливается как обычно. Потом в BIOS'е включается поддержка RAID, после чего под Windows устанавливается специальная утилита Intel Storage Utility. С ее помощью можно легко и просто создать RAID-массив, не потеряв при этом существующие данные.
Intel Storage Utility
Подготовка к созданию массива и настройка параметров производится с помощью понятного интерфейса программы и проходит в шесть шагов.
Шаг 1
Приветствие. Описание того места, куда вы попали, и того, что вам здесь предлагают сделать. Указывается, что на превращение ваших дисков в RAID-массив понадобится до двух часов – в зависимости от размера винчестеров. Пользователь также извещается о том, что процесс будет проходить в фоновом режиме, то есть во время превращения можно продолжать работать с компьютером.
Шаг 2
Здесь нужно указать имя тома (как именно RAID-массив будет отображаться в системе). Выбор уровня – 0 или 1. Для «нулевого» уровня выбирается размер блока (strip size). На этот этап нужно обратить особое внимание, поскольку производительность RAID 0 сильно зависит от выбранного размера блока. Для выбора оптимального показателя, мы тестировали массив с разными значениями strip size.
Шаг 3
Выбор источника данных, то есть винчестера, на котором установлена система. С этого накопителя информация будет дублироваться (RAID 1) или частично копироваться (распределятся между HDD – для RAID 0).
Шаг 4
Выбор второго участника массива. На этот HDD будет копироваться информация с источника. (все данные на выбранном винчестере будут удалены).
Шаг 5
Выбор размера массива. При создании двух RAID'ов на двух дисках (0 и 1) первым обязательно должен быть «нулевой» уровень – и никак не наоборот: при установке сначала RAID 1 используется сразу все дисковое пространство и на RAID 0 ничего не остается. Размер массива «нулевого» уровня должен составлять не менее 50% общего дискового пространства.
Шаг 6
Завершение подготовки и начало миграции данных с источника на второй диск.
После выполнение всех шести шагов на экране появляется окно состояния прогресса. Во время преобразования действительно можно работать с другими приложениями – процесс создания массива практически не сказывается на работе системы.
Результаты тестирования.
Сначала измерялись теоретические параметры системы – как построенной на одиночном винчестере, так и на RAID-массиве «нулевого» уровня. Как и предполагалось, RAID почти вдвое превосходит «простой» накопитель.
Протестировав системы программой Aida32, мы получили вполне логичные результаты. Скорость чтения у винчестера производства WD равна приблизительно 50 Мб/с, а у «нулевого» RAID-массива, построенного на двух таких накопителях, этот параметр составляет около 97 Мб/с. Похожие результаты показал и представитель Seagate: 46 Мб/с для одиночного варианта и 90 Мб/с в случае с RAID’ом.
Для тестирования использовали пакет WorldBench 5, в состав которого входит два приложения:
ACD Systems ACDSee PowerPack 5.0