Надежность АСОИУ (1088455), страница 21
Текст из файла (страница 21)
По мере своего разрастания сеть стремитсяприобрести свойства встроенной надежности: чем сложнее сеть, тем целесообразнее использование альтернативныхмаршрутов, чтобы отказ одного компонента блокировал только какую-то небольшую ее часть.Современные конструкции систем высокой готовности предполагают использование «горячего» резерва (FailOver), в том числе переключение прикладных программ и пользователей на другую машину (с гарантией отсутствияпотерь или искажений данных) во время отказа и переключения.Системы высокой готовности связаны со своими резервными системами посредством небольшого программногомодуля «сердечный пульс», который позволяет резервной системе управлять основной системой или системами,которые она резервирует.
Когда «пульс» пропадает, система переходит в режим переключения на резервную систему.Такое переключение может выполняться вручную или автоматически. Имеется несколько уровней автоматизацииэтого процесса. Например, в некоторых случаях пользователи инструктируются о том, что они должны выйти и сновавойти в систему. В других случаях переключение осуществляется более прозрачным для пользователя способом: онтолько должен подождать в течение короткого периода времени.
Иногда администратор может делать выбор между ручным и автоматическим переключением. В некоторых системах пользователи могут продолжить работу послепереключения именно с той точки, где они находились во время отказа. В других случаях их просят повторитьпоследнюю транзакцию.Избыточные резервные системы необязательно должны полностью повторять системы, которые они резервируют(конфигурации систем могут отличаться).
Это позволяет сэкономить финансовые средства за счет резервированиябольшой системы (или систем) с помощью системы меньшего размера и предполагает либо снижениепроизводительности в случае отказа основной системы, либо переключение на резервную систему только в критичныйдля ее функционирования период.Следует добавить, что здесь многое определяет администратор системы. Например, использование избыточныхсредств предоставляет возможность выбора конфигурации системы, что позволяет использовать весь заложенный всистеме потенциал.Таким образом, введение в систему различных видов избыточности повышает надежность ее функционирования,хотя и удорожает ее стоимость.1.8.
Принципы построения отказоустойчивых системСовременные корпоративные компьютерные системы используют сетевые технологии (локальные и глобальныесети) для организации совместного функционирования коллективов людей и предприятий, в том числе и в областииздательского дела и полиграфии. Рынок корпоративных решений насыщен производительными и высоконадежнымисистемами. Основным препятствием их внедрения на отечественных предприятиях является высокая стоимость.Поэтому большой интерес для российского рынка представляют системы, построенные на базе сравнительно недорогихкомпонентов или на оборудовании, которым уже располагает предприятие.62Как свидетельствуют многочисленные публикации, наиболее рациональным (с точки зрения финансовых затрат)решением задач обеспечения отказоустойчивости вычислительных систем АСОИУ являются кластерные системы(называемые в инженерной практике кластерами).
Кластер представляет собой программно-аппаратный комплекс,предназначенный для организации единой вычислительной среды на распределенной аппаратной базе.Кластерные системы имеют дополнительный уровень избыточности — избыточное количество ЭВМ (иливычислительных серверов) в составе кластера. ЭВМ связаны между собой локальной (внутренней) сетью (например,Ethernet) и взаимодействуют при помощи специального программного обеспечения (кластерного ПО).Важным требованием, предъявляемым к кластерам, является «прозрачность» системы относительно запросоввнешнего пользователя (удаленного сетевого клиента), т.
е. при обращении к кластеру по сети для решения каких-либозадач пользователь не обязан знать о его внутренней структуре. Иными словами, кластер является единым целым сточки зрения удаленного сетевого клиента.Программное обеспечение является существенной частью кластерной системы. Оно реализует механизмывосстановления и миграции приложений после отказа компонентов кластера, отслеживает и предотвращает сбои,предоставляет администратору наиболее полную информацию о работе системы.
Программное обеспечение должнобыть гибким, т. е. поддаваться конфигурированию для различных кластерных архитектур, и самое главное — бытьмаксимально отказоустойчивым.Таким образом, основные эксплуатационные характеристики системы существенно зависят от удобства ееобслуживания, в частности от ремонтопригодности, контроля пригодности и эффективного администрирования,возможного при использовании специального программного обеспечения.Конфигурации систем высокой готовности. Конфигурации систем высокой готовности, предлагаемые современнойкомпьютерной промышленностью, имеют широкий диапазон — от «простейших» жестких схем, обеспечивающихдублирование основной системы отдельно стоящим «горячим» резервом в соотношении 1:1, до весьма свободныхкластерных схем, позволяющих одной системе подхватить работу любой из нескольких систем в кластере в случае ихнеисправности.Термин «кластеризация» имеет много различных значений.
Строгое определение могло бы звучать так:«реализация объединения машин, представляющегося единым целым для операционной системы, системногопрограммного обеспечения, прикладных программ и пользователей». Машины, «кластеризованные» вместе, могут приотказе одного процессора быстро перераспределить работу на другие процессоры внутри кластера. Это, возможно,наиболее важная задача многих производителей систем высокой готовности.Кластеризация как способ обеспечения высокой готовности системы.
Впервые в классификации вычислительных системтермин «кластер» определила компания Digital Equipment Corporation (DEC).По определению DEC, кластер — это группа вычислительных машин, которые связаны между собою и функционируют какодин узел обработки информации.Кластер функционирует как единая система, т. е. для пользователя или прикладной задачи вся совокупностьвычислительной техники выглядит как один компьютер. Именно это и является самым важным при построениикластерной системы.К общим требованиям, предъявляемым к кластерным системам, относятся:• высокая готовность;• высокое быстродействие;• масштабирование;• общий доступ к ресурсам;• удобство обслуживания.63Естественно, что при частных реализациях одни из требований ставятся во главу угла, а другие отходят на второйплан.
Так, при реализации кластера, для которого самым важным является быстродействие, для экономии ресурсовменьше значения придают высокой готовности.В общем случае кластер функционирует как мультипроцессорная система, поэтому целесообразно дать классификациютаких систем в рамках распределения программно-аппаратных ресурсов (рис.
1.21, 1.22,1.23).Рис. 1.21. Тесно связанная мультипроцессорная системаРис. 1.22. Умеренно связанная мультипроцессорная система64Рис. 1.23. Слабо связанная мультипроцессорная системаОбычно на PC-платформах используются реализации кластерной системы в моделях тесно связанной и умеренносвязанной мультипроцессорных архитектур.Типы кластеров. В функциональной классификации кластеры можно разделить на высокоскоростные (HighPerformance, HP), системы высокой готовности (High Availability, НА), смешанные системы.Смешанные системы объединяют особенности как первых, так и вторых. Позиционируя их, следует отметить, чтокластер, который обладает параметрами как High Performance, так и High Availability, обязательно проиграет вбыстродействии системе, ориентированной на высокоскоростные вычисления, и в возможном времени простоя системе,ориентированной на работу в режиме высокой готовности.Функционал отказоустойчивого кластера обеспечивается дублированием всех жизненно важных компонентов.Максимально отказоустойчивая система должна не иметь ни единой критической точки (рис.
1.24), т. е. активногоэлемента, отказ которого может привести к потере функциональности системы. Такую характеристику, как правило,называют NSPF (No Single Point of Failure — отсутствие единой точки отказа). Коммутаторы 1 и 2 на рис. 1.24 служатдля связи кластера с внешней сетью, а коммутаторы 3 и 4 — для организации внутренней сети кластера для передачиинформации между узлами.65Рис. 1.24. Кластерная система с отсутствием точек отказовБлагодаря кластеризации достигается такая схема функционирования, когда при отказе одного из компьютеровзадачи перераспределяются между другими узлами кластера, которые функционируют исправно.