diplom (Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости), страница 6
Описание файла
Документ из архива "Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости", который расположен в категории "". Всё это находится в предмете "информатика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "информатика, программирование" в общих файлах.
Онлайн просмотр документа "diplom"
Текст 6 страницы из документа "diplom"
Рис 2.5. Топология ВС
Физическая связь (линк) под номером 4 используется каждым ПЭ для обмена с объектом управления и приема данных функциональной задачей для расчета на очередном цикле. В данной главе аспекты использования и надежности этих связей не рассматриваются, анализу подвергается только внутренняя структура ВС.
2.5.1. Инициализация
Для инициализации работы процессорных элементов используются конфигурационные файлы, содержащие номер ПЭ и таблицу связности (таблица 2.8).
Таблица 2.8
№/№ | 1 | 2 | 3 | 4 | 5 | |
1 | -1 | 0 | 1 | 2 | 3 | |
2 | 3 | -1 | 0 | 1 | 2 | |
3 | 2 | 3 | -1 | 0 | 1 | |
4 | 1 | 2 | 3 | -1 | 0 | |
5 | 0 | 1 | 2 | 3 | -1 |
На основе анализа таблицы связности определяется статические маршруты каждого ПЭ и текущая рабочая конфигурация каждого ПЭ по критерию связности, в данном случае обмен результатами счета осуществляется следующим образом :
-
ПЭ1 -> ПЭ2 и ПЭ3;
-
ПЭ2 -> ПЭ3 и ПЭ4;
-
ПЭ3 -> ПЭ4 и ПЭ5;
-
ПЭ4 -> ПЭ5 и ПЭ1;
-
ПЭ5 -> ПЭ1 и ПЭ2;
В штатном режиме функционирования ВС (при отсутствии неисправностей) на выходе каждой копии функциональной задачи (т.е. в 5-и точках) путем голосования на совпадение результатов подтверждается правильность реализации вычислительного процесса подсистемы.
Представим теперь, что произошел первый отказ аппаратуры. Пусть отказал канал связи между ПЭ1 и ПЭ3. Если при каком-либо отказе процессорный элемент вообще не выдает результаты счета, то голосование осуществляется с использованием соответствующих результатов систем диагностирования (проверка КС, квитанций).
Таким образом, в результате в узлах сети фиксируются следующие факты несовпадения результатов счета, представленные, для наглядности, в виде таблицы 2.9, в которой каждый линк обозначен с помощью двух цифр - номеров связываемых им процессорных элементов.
Таблица 2.9
№ ПЭ | Получены данные от ПЭ № | Данные от ПЭ № | Не совпадают с данными от ПЭ № | Возможная причина: Неисправность ПЭ № или Линк № |
1 | 4 , 5 | Нет неисправности | ||
2 | 5 , 1 | Нет неисправности | ||
3 | 1 , 2 | 1 | 2 , 3 | 1 1-3 |
4 | 2 , 3 | Нет неисправности | ||
5 | 3 , 4 | Нет неисправности |
После обмена результатами голосования, в узлах может оказаться противоречивая информация, представленная таблицей 2.10. Следует уточнить, что на каждом новом такте область памяти зарезервированная под результаты голосования соседних ПЭ переинициализируется, то есть содержит «мусор» до занесения вновь обновленной информации.
Анализ информации ПЭ1 позволяет сделать вывод о работоспособности ПЭ3, поскольку сообщение о его неисправности не подтвердили ПЭ4 и ПЭ5, и выявить сбой в канале связи 3-1. Анализ ПЭ2, ПЭ3, ПЭ4, ПЭ5 полученной информации показывает на неисправность линка 3-1, поскольку работоспособность ПЭ1 подтверждается узлом ПЭ2 и наличием в памяти достоверной информации о состоявшемся сеансе связи с ПЭ1.
Таблица 2.10
ПЭ№ | Данные голосования от ПЭ № | Возможная причина неисправности ПЭ № или Линк № | Вывод | Консолидированное решение |
1 | Нет неисправности | |||
2 | Нет неисправности | |||
1 | 3 | "мусор" | Неисправен Линк 3-1 | |
4 | Нет неисправности | |||
5 | Нет неисправности | |||
1 | Нет неисправности | |||
2 | Нет неисправности | |||
2 | 3 | 1 1-3 | Неисправен Линк 3-1 | |
4 | Нет неисправности | |||
5 | Нет неисправности | |||
1 | "мусор" | |||
2 | Нет неисправности | |||
3 | 3 | 1 1-3 | Неисправен Линк 3-1 | Неисправен Линк 3-1 |
4 | Нет неисправности | |||
5 | Нет неисправности | |||
1 | Нет неисправности | |||
2 | Нет неисправности | |||
4 | 3 | 1 1-3 | Неисправен Линк 3-1 | |
4 | Нет неисправности | |||
5 | Нет неисправности | |||
1 | Нет неисправности | |||
2 | Нет неисправности | |||
5 | 3 | 1 1-3 | Неисправен Линк 3-1 | |
4 | Нет неисправности | |||
5 | Нет неисправности |
При появлении такой ситуации могут возникнуть следующие трудности:
1. Недостоверность переданной информации была вызвана кратковременным сбоем, при этом ПЭ1 получил достоверные результаты счета, а ПЭ3 – недостоверные.
Решение: отключении канала связи 3-1 происходит только при троекратном повторении сбоя.
2. Сбой возник на этапе обмена результатами голосования.
Решение: сбой фиксируется наличием “мусора” вместо стандартных значений, но «полноценное» обнаружение сбоя (если он повторится) произойдет на следующем такте.
В любом случае следует проводить еще один обмен в рабочей сети, для аккумуляции решений всех ПЭ, и определения достоверного вывода путем их сравнения.
После принятия окончательного решения об отказе связи 3-1, инициируется реконфигуратор, вносящий соответствующие изменения в таблицу связности (см таблицу 2.11).
Таблица 2.11
№/№ | 1 | 2 | 3 | 4 | 5 | |
1 | -1 | 0 | -1 | 2 | 3 | |
2 | 3 | -1 | 0 | 1 | 2 | |
3 | -1 | 3 | -1 | 0 | 1 | |
4 | 1 | 2 | 3 | -1 | 0 | |
5 | 0 | 1 | 2 | 3 | -1 |
Далее реконфигуратор проводит проверку на нарушение связности в рабочей сети. В данном случае изменяются статические маршруты ПЭ и связь между ПЭ1 и ПЭ3 осуществляется через ПЭ2.
Предположим теперь, что отказал ПЭ4. При этом ПЭ4 может вести себя двояко: либо наступил фатальный отказ и ПЭ не выдает результатов, либо выдает искаженные результаты. Во втором случае так же может быть два варианта: ПЭ сохраняет способность правильно осуществлять обмен и голосование. В этом случае ПЭ способен диагностировать собственную ошибку. В противном случае считается, что сбойный узел выдает результаты, не несущие информативной нагрузки (“мусор”). Проиллюстрируем все случаи.
После этапа сравнения информации, в системе может оказаться следующая информация (таблица 2.12).
Таблица 2.12
№ ПЭ | Получены данные от ПЭ № | Данные от ПЭ № | Не совпадают с данными от ПЭ № | Возможная причина: Неисправность ПЭ № или Линк № |
1 | 4 , 5 | 4 | 1 , 5 | 4 1-4 |
2 | 5 , 1 | Нет неисправности | ||
3 | 1 , 2 | Нет неисправности | ||
4 Вариант 1 | 2 , 3 | «мусор» | ||
4 Вариант 2 | 2 , 3 | 4 | 2 , 3 | 4 4-3 , 4-2 |
5 | 3 , 4 | 4 | 3 , 5 | 4 5-4 |
После обмена результатами голосования, во всех узлах может оказаться информация, представленная таблицей 2.13.
Таблица 2.13
Данные голосования от ПЭ № | Возможная причина неисправности ПЭ № или Линк № | Вывод | Консолидированное решение |
1 | 4 4-1 | ||
2 | Нет неисправности | ||
3 | Нет неисправности | ||
4 Вариант 1 | «мусор» | Неисправность ПЭ4 | Неисправность ПЭ4 |
4 Вариант 2 | 4 4-3 , 4-2 | ||
5 | 4 5-4 |
Вариант 1: Сообщение от ПЭ4, содержит «мусор», что говорит о неисправности ПЭ4 или его каналов связи. Однако ПЭ1 и ПЭ5 приняли решение о неисправности ПЭ4 или каналов связи 5-4, 4-1. Поскольку отказ сразу всех каналов связи ПЭ4 и отказ ПЭ4 события равнозначные, принимается решение об неисправности ПЭ4.
Вариант 2: Сообщение ПЭ4 подтверждает результаты голосования в тройке ПЭ4, ПЭ5, ПЭ1 и принимается решение об отказе ПЭ4.
После двух отказов (линка 3-1 и ПЭ4) ВС имеет вид (рис. 2.6)