47121 (597321), страница 12
Текст из файла (страница 12)
На физическом уровне любые записи информационного поля представляют в виде двоичных символов. Обращение к памяти большого объема требует большой длины адреса. Если память имеет емкость 2n слов, то для поиска таких слов потребуются n-разрядные адреса. В микропроцессорах восьмиразрядные слова дают возможность обращаться к 256 ячейкам памяти, что оказывается недостаточно для хранения информации в автоматизированных системах. Если непосредственно обращение к любой ячейке невозможно, переходят к страничной организации памяти.
В этом случае выбирают область памяти емкостью 2n слов и называют страницей, обращение к которой осуществляется командой, содержащей n-разрядное адресное поле. В микропроцессорах обычно используют страницы размером 256 слов.
Принципы адресации, объемы памяти, количественные характеристики зависят от функционального назначения запоминающих устройств, разделяющимся по уровням функциональной иерархии на сверхоперативные, оперативные, постоянные, полупостоянные, внешние, буферные.
С хранением информации связаны следующие понятия: носитель информации (память), внутренняя память, внешняя память, хранилище информации.
Носитель информации – это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг), которую можно назвать оперативной (быстрой) памятью или внутренней памятью, поскольку ее носитель находится внутри нас.
Другие носители информации можно назвать внешними (по отношению к человеку), например бумага, которая, непригодна в обычных (не специальных) условиях для длительного хранения информации: на нее оказывают вредное воздействие температурные условия.
Для ЭВТ по материалу изготовления различают бумажные, металлические, пластмассовые, комбинированные и другие носители; по принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.; по методу считывания различают контактные, магнитные, электрические, оптические. Хранение информации осуществляется на специальных носителях.
Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе, которые бывают прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается такими параметрами, как время доступа, емкость памяти и плотность записи. Хранение больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме.
Хранилище информации – это определенным образом организованная информация на внешних носителях, предназначенная для длительного хранения и постоянного использования, например архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ: анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т. е. упорядоченность, классификация хранимых документов. Она необходима для удобства ведения хранилища: пополнения новыми документами, удаления ненужных, поиска информации и т. д.
Основные свойства хранилища информации: объем хранимой информации, надежность хранения, время доступа (т. е. время поиска нужных сведений), наличие защиты информации.
Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Для описания хранения данных используют те же понятия: носитель, хранилище данных, организация данных, время доступа, защита данных. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных и банками данных.
Таким образом, хранение информации представляет собой процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.
1.6.6 Системы хранения данных
В последнее время применение компьютерной техники претерпевает значительные изменения, связанные с переходом к созданию интегрированных (объединенных) информационных систем, предназначенных осуществлять согласованное управление данными в пределах предприятия (организации), координировать работу отдельных подразделений, автоматизировать операции по обмену информацией как в пределах отдельных групп пользователей, так и между несколькими организациями, отстоящими друг от друга на десятки и сотни километров. Основой для построения подобных систем служат локальные вычислительные сети (ЛВС). Их характерной чертой является предоставление пользователям возможности работать в универсальной информационной среде с функциями коллективного доступа к данным.
Рост объемов данных, возросшие требования к надежности хранения и быстродействию доступа к данным делают необходимым выделение средств хранения в отдельную подсистему вычислительного комплекса – систему хранения данных. Роль и важность ее определяются постоянно возрастающей ценностью информации в современном обществе, возможность доступа к данным и управления ими является необходимым условием для успешного выполнения информационных процессов.
Система хранения данных предназначена для организации их надежного хранения, а также отказоустойчивого, высокопроизводительного доступа серверов к устройствам хранения. В настоящее время объем и стоимость обрабатываемой информации с каждым годом увеличиваются и, как следствие, повышаются требования по надежности, доступности и совокупной стоимости владения используемых систем хранения данных. Помимо высоких показателей производительности, доступности и низкой стоимости необходимо обеспечить требуемую функциональность – объем хранения и число подключаемых серверов.
Дисковые массивы сегодня являются основными устройствами хранения данных, однако обработка информации, формирование логической структуры ее хранения (дисковых томов и файловых систем) осуществляется на серверах. В процесс доступа к данным, помимо процессоров и памяти сервера, вовлечены установленные в нем адаптеры (Host Bus Adapter – HBA), работающие по определенному протоколу, драйверы, обеспечивающие взаимодействие HBA с операционной системой, менеджер дисковых томов, файловая система и менеджер памяти операционной системы.
Если дисковый массив выполнен в виде отдельного устройства, то для его подключения к серверам используется определенная инфраструктура. В зависимости от протокола доступа (транспорта), реализованного в HBA и дисковом массиве, она может быть как простой шиной (протокол SCSI), так и сетью (протокол Fibre Channel (FC)). Если это сеть, то в ней используется активное оборудование – концентраторы и коммутаторы, работающие по протоколу FC, маршрутизаторы протокола FC в другие протоколы (обычно в SCSI). Таким образом, помимо устройств хранения данных в состав СХД необходимо еще добавить инфраструктуру доступа, связывающую серверы с устройствами хранения.
Сетевой инфраструктурой, объединяющей большое количество серверов и устройств хранения, необходимо управлять и отслеживать ее состояние. Это реализуется "подручными" средствами – встроенными утилитами серверов, массива и операционной системы, бесплатными утилитами или "самописными" скриптами. Каждое из устройств в СХД имеет несколько объектов, требующих управления и контроля состояния, например дисковые группы и тома у массивов, порты у массивов и коммутаторов, адаптеры в серверах. Как только число объектов управления в СХД начинает исчисляться десятками, управление такой конфигурацией отнимает у администраторов слишком много времени и сил и неизбежно приводит к ошибкам. Справиться с такой задачей можно, только используя полномасштабную систему управления.
Система хранения данных должна включать следующие подсистемы и компоненты:
1. Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные высокопроизводительные дисковые массивы используют технологию Fibre Channel для подключения к ним серверов и доступа к дискам внутри массива. Они могут масштабироваться до десятков терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций: виртуализации дискового пространства, разграничения доступа к дисковому пространству, создания Point-In-Time (PIT) копий данных и репликации данных между массивами. К устройствам хранения данных также относятся ленточные, магнитооптические и CD/DVD библиотеки.
2. Инфраструктуру доступа серверов к устройствам хранения данных, которая создается в настоящее время на основе технологии "сеть хранения данных" (Storage Area Network – SAN). SAN является высокопроизводительной информационной сетью, ориентированной на быструю передачу больших объемов данных.
В основе концепции SAN лежит возможность соединения любого из серверов с любым устройством хранения данных, работающим по протоколу Fibre Channel. Сеть хранения данных образуют волоконно-оптические соединения, Fibre Channel Host Bus Adapters (FC-HBA) и FC-коммутаторы, обеспечивающие в настоящее время скорость передачи 200 Мбайт/с и удаленность между соединяемыми объектами до нескольких десятков километров.
3. Систему резервного копирования и архивирования данных, предназначенную для создания резервных копий и восстановления данных. Она позволяет защитить данные от разрушения не только в случае сбоев или выхода из строя аппаратуры, но и в результате ошибок программных средств и пользователей.
4. Программное обеспечение управления хранением данных, предназначенное для решения задач управления хранением данных, например, для разметки дисковых томов или повышения производительности доступа к данным прикладного ПО. Это достигается за счет того, что встроенное в массивы программное обеспечение собирает статистику по интенсивности работы с данными и исходя из нее принимает решение о перемещении данных на диски, производительность которых соответствует скорости обращения к данным.
5. Систему управления, предназначенную для мониторинга и управления уровнем качества сервиса хранения данных. Она тесно интегрируется с системой управления вычислительным комплексом. Основой системы управления СХД являются средства управления аппаратными ресурсами сети хранения данных. Их интеграция с другими системами дает возможность контролировать ресурсы СХД и управлять ими на всех уровнях – от дисков в массиве до файловой системы сервера.
Для защиты от отказов отдельных дисков используют технологии RAID (кроме RAID-0), использующие дублирование данных, хранимых на дисках. Уровень RAID-5 хотя и не создает копий блоков данных, но все же сохраняет избыточную информацию, что тоже можно считать дублированием. Для защиты от логического разрушения данных (разрушение целостности базы данных или файловой системы), вызванного сбоями в оборудовании, ошибками в программном обеспечении или неверными действиями обслуживающего персонала, применяется резервное копирование, которое тоже является дублированием данных. Для защиты от потери данных вследствие выхода из строя устройств хранения по причине техногенной или природной катастрофы данные дублируются в резервный центр.
Отказоустойчивость доступа серверов к данным достигается дублированием путей доступа. Применительно к SAN дублирование заключается в следующем: сеть строится как две физически независимые сети, идентичные по функциональности и конфигурации. В каждый из серверов устанавливается как минимум по два адаптера FC-HBA. Первый из них подключается к одной половинке SAN, а второй – к другой. Отказ оборудования, изменение конфигурации или регламентные работы на одной из частей SAN не влияют на работу другой. В дисковом массиве отказоустойчивость доступа к данным обеспечивается дублированием RAID-контроллеров, блоков питания, интерфейсов к дискам и к серверам. Для защиты от потери данных зеркалируют участки кэш-памяти, участвующие в операции записи, а электропитание кэш-памяти резервируют батареями. Пути доступа серверов к дисковому массиву тоже дублируются. Внешние интерфейсы дискового массива подключаются к обеим половинкам SAN.
Все предлагаемые решения обладают высокой степенью масштабирования, что позволяет сначала использовать небольшую и относительно дешевую систему хранения данных и по мере своего развития модернизировать ее в систему хранения данных корпоративного уровня, отвечающую заданным требованиям по надежности хранения и доступности информации.
Структура системы хранения данных имеет несколько уровней.
1. Система хранения данных начального уровня (рис. 1.18).
Строится на основе дисковых массивов с аппаратной реализацией RAID и интерфейсами FC, которые обладают возможностью непосредственного подключения нескольких серверов, а максимальный объем хранимой информации может достигать нескольких терабайт. Для обеспечения резервного копирования информации в рамках предлагаемого решения используются ленточные библиотеки с интерфейсом FC, что позволяет вынести их за пределы вычислительного центра и тем самым обеспечить сохранность данных и возможность их восстановления в случае локальных катастроф, например пожара. Для обеспечения высокого уровня надежности хранения данных у выбираемых моделей дисковых массивов дублированы все основные элементы конструкции.
Рис. 1.18. Система хранения данных начального уровня
Данное решение может быть модернизировано в систему хранения данных среднего уровня.
2. Система хранения данных среднего уровня (рис. 1.19).
Данное решение строится на основе 8- или 16-портовых коммутаторов начального уровня. Они обеспечивают возможность более гибкого распределения дисковых ресурсов между серверами, а также позволяют применять современные технологии резервного копирования данных.
При реализации решения для хранения наиболее важных данных могут использоваться модели дисковых массивов, у которых отсутствует единая точка отказа, что исключает возможность потери доступности данных в случае выхода из строя оборудования.
















