diplom (Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости), страница 9
Описание файла
Документ из архива "Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости", который расположен в категории "". Всё это находится в предмете "информатика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "информатика, программирование" в общих файлах.
Онлайн просмотр документа "diplom"
Текст 9 страницы из документа "diplom"
Проиллюстрируем его на примере ВС, изображенной на рис. 2.7, и отказа ПЭ5 в этой конфигурации. Обмен для голосования в сети осуществляется следующим образом:
ПЭ1->ПЭ2, ПЭ3;
ПЭ2->ПЭ3, ПЭ5;
ПЭ3->ПЭ5, ПЭ1;
ПЭ5->ПЭ1, ПЭ2.
Обмен результатами голосования для принятия консолидированного решения – по всей ВС. Приведем логику анализа неисправности с точки зрения выбранной эвристики.
Вариант 1: ПЭ5 продолжает функционирование, обмен и голосование, но функциональная задача выполняется неверно. Таким образом, сигналов о неисправности от модулей коммуникации ПЭ сети поступать не будет.
В таблице 2.23 представлены записи от всех ПЭ, расшифрованные в соответствии с выбранной логикой.
Таблица 2.23
ПЭ№ | Данные голосования от ПЭ № | Информация от модуля коммуникации | Возможная причина неисправности ПЭ № или Линк № | Вывод |
1 | Нет | 5 1-5 | ||
1 | 2 | Нет | 5 2-5 | Неисправен ПЭ5 |
3 | Нет | Нет неисправности | ||
5 | Нет | 5 1-5, 3-5 | ||
1 | Нет | 5 1-5 | ||
2 | 2 | Нет | 5 2-5 | Неисправен ПЭ5 |
3 | Нет | Нет неисправности | ||
5 | Нет | 5 1-5, 3-5 | ||
1 | Нет | 5 1-5 | ||
3 | 2 | Нет | 5 2-5 | Неисправен ПЭ5 |
3 | Нет | Нет неисправности | ||
5 | Нет | 5 1-5, 3-5 |
Составим матрицу состояния ВС, получившуюся у ПЭ1 (см. таблицу 2.24).
Таблица 2.24
№/№ | 1 | 2 | 3 | 5 |
1 | 2 | 1 | 2 | -1 |
2 | 1 | 2 | 2 | 0 |
3 | 2 | 2 | 2 | 0 |
5 | -1 | 0 | 0 | -2 |
Таким образом, делается вывод о неисправности ПЭ5. Аналогичный вывод, судя по таблице 1, делают и ПЭ1 и ПЭ2.
Вариант 2: Наступил фатальный отказ ПЭ5, при котором он прекращает обмен с ВС, либо выдает неинформативные данные.
Таблица 2.25 содержит расшифровку записей всех ПЭ в этом случае.
Таблица 2.25
ПЭ№ | Данные голосования от ПЭ № | Информация от модуля коммуникации | Возможная причина неисправности ПЭ № или Линк № | Вывод |
1 | Нет | 1 или 3 или 5 3-5 или 1-5 | ||
1 | 2 | Нет | 5 2-5 | Неисправен ПЭ5 |
3 | Тайм-аут или КС | 3 или 5 3-5 или 1-5 | ||
5 | Тайм-аут или КС | 5 1-5 | ||
1 | Нет | 1 или 3 или 5 3-5 или 1-5 | ||
2 | 2 | Нет | 5 2-5 | Неисправен ПЭ5 |
3 | Тайм-аут или КС | 3 или 5 3-5 или 2-5 | ||
5 | Тайм-аут или КС | 5 2-5 | ||
1 | Тайм-аут или КС | 1 или 5 3-5 или 1-5 | ||
3 | 2 | Тайм-аут или КС | 2 или 5 3-5 или 2-5 | Неисправен 3-5 |
3 | Нет | 1 или 2 или 3 или 5 3-5 или 1-5 или 2-5 | ||
5 | Тайм-аут или КС | 5 3-5 |
Таким образом :
-
В ПЭ1 оказывается 4 голоса против ПЭ5 и 3 голоса против канала связи 1-5. Решение – отказ ПЭ5.
-
В ПЭ2 оказывается 4 голоса против ПЭ5 и 3 голоса против канала связи 2-5. Решение – отказ ПЭ5.
-
В ПЭ3 оказывается 4 голоса против ПЭ5 и 4 голоса против канала связи 3-5. Решение – отказ канала связи 3-5.
Ситуация, аналогичная наступившей в ПЭ3, возникает, когда у ПЭ остается лишь один канал связи. После его утраты ПЭ становится изолированным и отключается.
2.6. Оценка надежностных характеристик отказоустойчивой ВС
Выбранная концепция построения специализированной распределенной операционной системы реального времени позволит однородной системе функционировать при возникновении N -1 отказа ПЭ в системе.
Если не учитывать вероятность отключения работоспособных процессорных модулей, то можно провести оптимистическую оценку вероятности отказа всей системы за определенный период функционирования и среднего времени наработки на отказ системы.
Будем предполагать, что поток отказов в каждом узле системы является простейшим, т.е. стационарным, ординарным и без последствия, с показательным законом распределения длины интервала между соседними событиями (отказами):
где: - вероятность того, что за время t произойдет ровно “K” событий (отказов);
l - параметр потока, интенсивность потока отказов;
T0 – математическое ожидание длины интервала между соседними событиями – среднее время наработки на отказ;
P0(t) – вероятность того, что за время t не произойдет ни одного события (отказа), вероятность безотказной работы.
Обозначим через – среднее время наработки на отказ одного узла системы. Для отказоустойчивых систем под состоянием отказа будем понимать состояние фатального отказа, т.е. для ОС-N(m), это состояние, при котором произошел отказ более чем “m” узлов системы (m+1, m+2, …).
В произвольный момент времени t мы можем застать систему в одном из двух состояний:
-
работоспособном, с вероятностью R(t),
-
в состоянии фатального отказа, с вероятностью P(t).
Если взглянуть на систему с учетом состояний работоспособности каждого из N ее элементов (узлов), то в произвольный момент времени t мы можем застать систему в одном из 2N состояний (см. рис. 2.10).
Рис 2.10. Состояния N-узловой системы
Если поставить в соответствие каждому узлу системы разряд двоичного N разрядного числа (0 – узел работает, 1 – узел отказал), то каждому такому состоянию системы можно поставить в соответствие свой номер, равный значению введенного двоичного N разрядного числа и каждому такому состоянию соответствует некоторая вероятность нахождения системы в момент времени t в этом состоянии.
Все 2N состояний системы можно разбить на несколько групп состояний, каждое из которых отличается от других количеством отказавших узлов. Нулевая группа (группа с номером 0) содержит одно состояние ( = 1), в котором все узлы системы находятся в состоянии работоспособности, т.е. имеется ровно 0 отказавших элементов. Первая группа включает в себя все состояния, в которых отказал ровно один узел (двоичные номера этих состояний содержат лишь одну единицу в N разрядном двоичном коде). Количество состояний, входящих в первую группу равно =N – числу сочетаний из N по 1 ( ).
Вторую группу составляют состояния, в которых в системе имеется два отказавших элемента, таких состояний ровно и т.д.
В i-ю группу включаются все состояния, в которых в системе отказало ровно i узлов, таких состояний .
Предпоследняя (N-1) –я группа включает в себя состояний, т.е. N состояний.
Последняя N-я группа содержит одно состояние ( =1), в котором отказали все N узлов системы.
Т.к. в произвольный момент времени система может находится только в одном из всех 2N состояний, то эти события являются несовместными. Поэтому вероятность нахождения системы в любом из состояний, относящихся к одной из упомянутых выше групп можно получить как сумму вероятностей нахождения системы во всех состояниях данной группы. А если учесть, что внутри каждой i-й группы все состояния характеризуются наличием ровно i отказавших узлов, то вероятности для всех состояний одной группы равны между собой, поэтому:
где: Pi – вероятность нахождения системы (в произвольный момент времени t) в любом из состояний, отнесенных к i-й группе;
- вероятность нахождения системы в одном конкретном состоянии, отнесенном к i-й группе.
Все состояния, отнесенные к i-й группе характеризуются наличием в системе (в произвольный момент времени t) ровно i отказавших узлов и ровно (N-i) исправных узлов.
В соответствии с введенным выше предположением о простейшем потоке отказов (1) вероятность можно оценить следующим образом:
где первая скобка соответствует тому, что (N-i) элементов находятся в работоспособном состоянии, а вторая тому, что i элементов отказали. Подставляя (3) в (2) можно получить выражение для вычисления вероятностей Pi.