diplom (Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости), страница 10
Описание файла
Документ из архива "Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости", который расположен в категории "". Всё это находится в предмете "информатика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "информатика, программирование" в общих файлах.
Онлайн просмотр документа "diplom"
Текст 10 страницы из документа "diplom"
Очевидно, что для системы ОС-N(m) (N узловой системы с рангом отказоустойчивости m) все состояния системы, входящие в группы 0,1,2,…m относятся к тем состояниям, в которых система нормально функционирует. В этой связи вероятность R(t) можно оценить следующим образом:
Вероятность фатального отказа системы ОС – N(m) можно оценить как сумму вероятностей нахождения системы в состояниях, отнесенных к группам m+1, m+2, … N-1, N:
Критерием правильности предложенной методики является выполнение условия R(t)+P(t)=1 для любых систем и любых значений t.
Объединяя выражения (2) (3) (4) и (5), получим окончательные формулы для вычисления вероятностей безотказной работы – RN(m)(t) и фатального отказа –PN(m)(t) систем ОС-N(m) для произвольного момента времени t:
Для практических расчетов целесообразно использовать одну из этих формул, а именно ту, у которой (в зависимости от значений N и m) меньше суммируемых членов, т.е. при целесообразно использовать формулу PN(m)(t) в противном случае – формулу RN(m)(t). При этом второй параметр получается из соотношения RN(m)(t)+PN(m)(t)=1.
Таким образом для систем типа N(N-1) выражения (6) принимают вид:
Рассмотрим теперь определение среднего времени наработки на отказ T0N(m) отказоустойчивых систем ОС-N(m).
Невосстанавливаемая N-узловая отказоустойчивая система m-го ранга (ОС-N(m)) может быть представлена марковской моделью с количеством состояний (N+1):
где: 0 – состояние, в котором ни один узел системы не отказал;
1 – состояние (объединяющее группу из состояний системы – см. рис. 2.4), в котором отказал ровно 1 узел;
2 – состояние (объединяющее группу из состояний системы), в котором отказали ровно 2 узла;
m – состояние (объединяющее группу из состояний системы), в котором отказало ровно m узлов и т.д.
Переход из одного состояния в другое (по мере постепенной деградации системы) определяется интенсивностью потока отказов, воздействующих на систему, находящуюся в соответствующем состоянии. Интенсивность потока отказов, воздействующих на систему, находящуюся в i-м состоянии, определяется количеством работоспособных узлов (N-i). Т.о. среднее время нахождения системы в i-м состоянии определяется следующим образом:
где: - интенсивность потока отказов одного узла системы.
Фатальный отказ системы ОС-N(m) произойдет только при переходе системы из состояния m в состояние m+1, поэтому среднее время наработки системы ОС-N(m) на отказ равно среднему времени последовательного нахождения системы в состояниях 0,1,2….m:
Выражение (8) получено на основании одного фундаментального свойства показательного закона распределения: «если промежуток времени, распределенный по показательному закону, уже длился некоторое время t, то это никак не влияет на закон распределения оставшейся части промежутка: он будет таким же, как и закон распределения всего промежутка»[12]. Это свойство показательного закона представляет собой, по существу, одну из формулировок для «отсутствия последействия», которое является основным свойством простейшего потока, принятого нами в качестве модели потока отказов.
Если ввести обозначение:
то этот «коэффициент надежности» в соответствии с (8) представляет собой отношение T0N(m) к T0y:
и показывает, во сколько раз по сравнению с T0y – средним временем наработки на отказ одного узла, изменилось среднее время наработки на отказ системы ОС-N(m) в целом.
Используя формулы (6а) и (8а) можно производить оценку надежностных характеристик отказоустойчивых систем типа N(N-1). Примем среднее время наработки на отказ узла =105 часов. В таблице 2.26 приведены характеристики, рассчитанные по формулам (6а) и (8а).
Таблица 2.26
Харктиристики отказоустойчивых систем типа N(N-1)
№№ п/п | N(N-1) – тип системы / Характеристика | 1(0) | 3(2) | 4(3) | 5(4) | 6(5) | 7(6) | 8(7) | 9(8) | 10(9) | |
1 |
| 4 часа | 4∙10-5 | 6,4∙10-14 | 2,56∙10-18 | 1,0∙10-22 | 4,1∙10-27 | 1,6∙10-31 | 6,5∙10-36 | 2,62∙10-40 | 1,05∙10-44 |
2 | 24 часа | 2.4∙10-4 | 1,38∙10-11 | 3,31∙10-15 | 8,0∙10-19 | 1,9∙10-22 | 4,6∙10-26 | 1,1∙10-29 | 2,64∙10-33 | 6,3∙10-37 | |
3 | 1год= | 0.084 | 5,91∙10-4 | 4,96∙10-5 | 4,2∙10-6 | 3,5∙10-7 | 2,9∙10-8 | 2,46∙10-9 | 2∙10-10 | 1,7∙10-11 | |
8766 час | |||||||||||
4 | 5лет= | 0.355 | 0,047 | 1,586∙10-2 | 5,6∙10-3 | 2∙10-3 | 7,1∙10-4 | 2,5∙10-4 | 8,9∙10-5 | 3,16∙10-5 | |
43830 час | |||||||||||
5 | 10лет= | 0.584 | 0,2 | 0,116 | 0,068 | 0,04 | 0,023 | 0,0135 | 7,9∙10-3 | 4,6∙10-3 | |
87660час | |||||||||||
6 | 11,4г.= | 0.632 | 0,252 | 0,16 | 0,1 | 0,064 | 0,04 | 0,025 | 0,016 | 0,01 | |
105час | |||||||||||
7 | 15лет= | 0.73 | 0,391 | 0,286 | 0,21 | 0,153 | 0,11 | 0,082 | 0,06 | 0,044 | |
131490час | |||||||||||
8 | KN(N-1) | 1 | 1,83 | 2,08 | 2,28 | 2,45 | 2,59 | 2,72 | 2,82 | 2,92 |
Для упрощения анализа таблицы построим два графика, отражающих увеличение надежности системы с наращиванием аппаратной части (рис. 2.10 и рис. 2.11).
Рис. 2.10. Коэффициент надежности.
Рис 2.11. Вероятность отказа ВС типа N(N-1) за 10 лет.
Анализ кривых показывает, что среднее время безотказной работы увеличивается в 2-3 раза по сравнению со средним временем безотказной работы одного ПЭ при наращивании вычислительных ресурсов в 5-7 раз и далее стабилизируется и возрастает незначительно. Вероятность отказа систем с рангом отказоустойчивости N(N-1) резко уменьшается при рассмотрении ВС типа 5(4) – 7(6) и далее ее снижение незначительно.
Таким образом, при построении отказоустойчивых вычислительных систем рекомендуется выбирать системы с характеристиками 5(4) – 7(6), с учетом ограничения массы, энергопотребления и др. характеристик.
2.7. Выводы к главе 2
Подводя итог, стоит еще раз отметить, что надежность ВС в процессе эксплуатации складывается из надежности аппаратной и программной компонент системы. В связи с этим были рассмотрены виды и причины отказов при работе ВС, причем особое внимание уделялось возникновению ошибок вследствие неисправностей аппаратных компонент системы, так как ошибки программного обеспечения означают, что они не были выявлены на этапе тестирования.
Для обеспечения надежного решения задач в условиях отказов применяются два подхода – восстановление и предотвращение отказа системы (отказоустойчивость). При создании специализированной ОСРВ, предпочтение отдано второму подходу, поскольку восстановление в ряде случаев может быть связано со значительными затратами процессорного времени и (или) прерыванием вычислительного процесса. В связи с этим рассмотрены механизмы обеспечения отказоустойчивости, основными из которых являются протоколы голосования и принятия коллективного решения.
Введено понятие ранга отказоустойчивости, описана структура ОСРВ и концепция работы системы с рангом отказоустойчивости N(N-1). Дано описание системных таблиц, структуры и взаимодействия модулей ОСРВ таких как маршрутиатор, реконфигуратор, модуль коммункации, голосования и анализа отказов.
Рассмотрен пример организации отказоустойчивых вычислений на примере пятиузловой полносвязной ВС в условиях постоянной деградации, приведена логика анализа отказа в условиях ординарного потока отказов.