Диссертация (1137355), страница 15
Текст из файла (страница 15)
Входящие в формулы (2.5.21) – (2.5.23) вспомогательные вероятностные истоимостные характеристики полумарковской модели, а именно функции:( )( ){}( )( ){}{}93( )( ){}( )( )( ){}( )( ){}{}( ){}{}определяются с использованием предшествующих аналитических представлений следующимиравенствами: (2.5.2) – (2.5.3) и (2.5.5) – (2.5.8) для вспомогательных переходных вероятностей;(2.5.9) – (2.5.14) для вспомогательных величин, связанных со временем пребывания процесса( ) в различных состояниях; (2.5.15) - (2.5.20) для вспомогательных величин, связанных сматематическими ожиданиями дохода, полученного за время пребывания процесса( ) вразличных состояниях.Доказательство.Стационарный функционал средней удельной прибыли вида (2.2.1), рассматриваемый вкачестве целевого функционала в исследуемой задаче управления запасом, является частнымслучаем стационарного стоимостного функционала вида (3.2.16).
Структура данногофункционала, то есть форма его зависимости от управляющих вероятностных распределений,определяется теоремой 3.2.2. Применим эту теорему. Заметим, что основные вероятностные истоимостные характеристики модели, входящие в выражения для подынтегральных функцийчислителя и знаменателя дробно-линейного функционала (3.2.16), то есть в правые частиравенств (3.2.17), (3.2.18), определены в ходе предшествующего анализа. Именно:( )где функции( )( ){( )( )( ){}},определяются формулами (2.5.22), (2.5.23) с учетомпредшествующих соотношений.
Условные вероятности переходавходящиеввыражениядлявспомогательныхфункций( ){̂ ( )(},),определяются формулами (2.5.21) также с учетом предшествующих соотношений. Такимобразом, аналитическое представление для подынтегральных функций числителя и знаменателядробно-линейного функционала (3.1.1) задаются формулами (3.3.1), (3.3.2) с учетомпоследующих равенств (3.3.3), (3.3.4).
Теорема 3.3.1 доказана.3.2. Итоги теоретического исследования проблемы оптимального управления.В разделе 3.1 доказано утверждение о представлении показателя качества управления(2.2.1) в виде дробно-линейного функционала. Удалось явно выразить подынтегральныефункции числителя и знаменателя (см. формулы (3.3.1), (3.3.2)), то есть найти аналитическоепредставлениедляосновнойфункцииэтогофункционала.Согласноутверждениям,приведенным в 1 параграфе главы 3, решение проблемы оптимального управления для94рассмотренной задачи определяется точкой глобального экстремума основной функции(), определяемой формулой (3.1.2).Задачу поиска оптимального управления запасом в рассматриваемой модели можносчитать завершенной. Нахождение точек, принадлежащих пространству допустимых векторныхзначений параметров управления((), которые доставляют глобальный экстремум функции), представляет собой отдельную задачу.
Такая задача может быть решена толькочисленными методами при помощи средств современной вычислительной техники.95Глава 4. Численное решение задачи оптимального управления запасом вдискретной полумарковской модели.В данной главе приводится описание алгоритма программы, а также некоторых из еёкомпонент, которые предназначены для нахождения численного решения задачи оптимальногоуправления запасом в рассматриваемой полумарковской стохастической модели. Даннаяпрограммабыларазработанасцельюподтверждениявозможностипрактическогоиспользования теоретических результатов, полученных во второй и третьей главах настоящегодиссертационного исследования.В программе реализован ряд вспомогательных функций, позволяющих вычислятьзначения всех вероятностных и стоимостных характеристик модели, а также значения основнойфункции исследуемого дробно-линейного функционала. Основой алгоритма являютсяаналитические формулы для данных вероятностно-стоимостных характеристик модели и дляподынтегральных функций числителя и знаменателя дробно-линейного функционала.
Помимочисленного представления описанных выше математических объектов в программе реализованблок оптимизации, который предназначен для поиска точки глобального экстремума основнойфункции дробно-линейного функционала. Результатом выполнения данной части программыявляется набор приближенных значений оптимальных параметров управления. В программетакже реализованы графические представления для промежуточных и основных характеристикполумарковской модели управления.§1. Описание схемы программы, ее алгоритма и функцийПриведем описание структуры программного продукта при помощи крупноблочнойсхемы (рисунок 13), отражающей алгоритм программы, и проведем описание каждого изсоставляющих её блоков.Блок формирования входных данных модели содержит в себе значения наборапараметров (исходных характеристик модели) необходимых для численного решения задачиоптимального управления.
Подробная интерпретация данных характеристик была дана вописании модели (см. глава 2, пункт 1), приведем здесь их краткое описание. Таким образом,входными данными для блока 2 в схеме, изображенной на рисунке 13, являются:скорость потребления (спрос) и вместимость склада:96задание разбиения множества значений объема запаса (дискретизация модели):( ){}( ){}вероятностные характеристики, описывающие процедуру пополнения запаса в системе:{( )}{( )} {}{}( ){}условные математические ожидания длительностей задержек пополнения запаса:{( )}{( )} {}{}( )функции, характеризующие различные виды затрат и доходов:( ){1. Блок формированиявходных параметровмодели.2. Блок аналитическихпреобразований ичисленных методов.4.
Блок выводарезультатов.3. Блок оптимизации.}Рисунок 13. Структура программы численного решения задачи оптимального управлениязапасом.Блок аналитических преобразований и численных методов содержит ряд связанныхмежду собой процедур и функций. Структура данного блока будет описана ниже при помощисхемы, представленной на рисунке 14.Блок оптимизации предназначен для реализации процедуры поиска точки глобальногоэкстремума основной функции (3.1.2) дробно-линейного функционала (3.1.1).
Как следует изобщей структуры программы (см. рисунки 13,14), входными данными для этого блока являетсямассивчисленныхзначенийфункциипреобразований и численных методов.(3.1.2),полученныйвблокеаналитических972.1. Символьноевычисление функций(+) , , ∈ , , … , ;(−)Математические ожиданияприбыли: , ∈ , , … , ., , ∈ , , … , .Математические ожиданиявремени пребывания: , ∈ , , … , .2.2. Определениевероятностно-стоимостныххарактеристик модели припомощи численныхметодов.Переходные вероятностивложенной цепи Маркова: , , ∈ , , … , .2.3 Итоговое представлениедля основной функции , … , дробнолинейного функционала.Вычислениевспомогательных функций , … , − , + , … , Рисунок 14.
Описание блока аналитических преобразований и численных методов.Блок вывода результатов предназначен для реализации следующих задач:графического представления приближенных значений вероятностно-стоимостныххарактеристик, заданных выражениями (2.5.21) – (2.5.23);вывода найденного приближенного значения оптимального управления – точки(глобального экстремума);графического представление основной функции (3.1.2) и ее поведения вокрестности точки(): полностью для случаяпомощи срезов и проекций для случая большей размерности –; при.§2.
Описание некоторых стандартных вычислительных функций программы MATLABВ данном параграфе будет приведено описание стандартных вычислительных функцийпрограммы MATLAB, которые были использованы для численного решения задачиоптимального управления запасом в рассматриваемой полумарковской модели.98( )Для символьного интегрирования функций()( )(), задаваемых формулами(2.3.23), (2.3.24), использовалась встроенная функция int(fun, var, a, b). Расшифровка входныхпараметров функции int следующая: fun – подынтегральная функция; var – переменнаяинтегрирования; величины a, b – пределы интегрирования.Для численного интегрирования вероятностных и стоимостных характеристик модели(2.5.21) – (2.5.23) использовалась встроенная функция quadgk(fun, a, b) (далее quadgk).Расшифровка входных параметров функции quadgk следующая: fun – подынтегральнаяфункция; величины a, b – пределы интегрирования.
В основу работы данной функции заложенадаптивный алгоритм численного интегрирования, использующий квадратурные формулыГаусса и Гаусса-Кронрода. Подробное описание использования данных формул для решениязадач численного интегрирования приведено в [1]. Приведем здесь их представление и изложимсуть алгоритма функции quadgk.Для приближенной оценки интеграла∫ ( )()(),а–строится квадратурная формула Гаусса∫ ( )где∫ ()∑( )– веса, с которыми берутся значения функции в узловых точкахкорни многочлена Лежандра( ) на отрезке [].
Представление для( ) имеетследующий вид:( )Остаточный член[() ]формулы Гаусса сузлами (с учетом формулы Стирлинга) имеетвид:√()()( )[]Модификация данного алгоритма, предложенная Кронродом, заключается в повышенииуровня точности метода Лежандра-Гаусса путем добавления в формулу (4.2.2)дополнительных узлов:99∫ ( )где узлыи коэффициенты∑( )∑( )( )()подбираются так, чтобы данная формула имелаполиномиальный порядок точности.Функция quadgk производит расчет интеграла (4.2.1) по формулам (4.2.2), (4.2.3) ивычисляет разность между полученными по данным формулам результатам, котораяиспользуется в качестве оценки погрешности вычисления интеграла (4.2.1).
В случае еслиданная погрешность превышает заданную точность, то количество узлов в обеих формулахувеличивается и описанный процесс повторяется до тех пор, пока желаемая точность не будетдостигнута. Отметим, что синтаксис функции quadgk позволяет настраивать значенияпараметров абсолютной и относительной погрешностей интегрирования.Для построения графиков функций( )( )( ){}, задаваемыхформулами (2.5.21) – (2.5.23), использовалась встроенная функция plot(X,Y) с определеннойнастройкой входных параметров, которая позволяет отобразить на плоскости () несколькографиков соответствующих характеристик в зависимости от состояния полумарковскогопроцесса ( ) в момент после очередного пополнения запаса в системе.