Диссертация (1137355), страница 5
Текст из файла (страница 5)
Кроме того, пусть функция(∫], а функция. Тогда ( ) монотонно убывает по((()) ( ))(функция( )() монотонно) монотонно возрастает.Утверждение, доказанное в лемме 1, используется в следующей теореме, определяющейструктуруоптимальнойстратегииврассматриваемойсистемеуправлениязапасом.Сформулируем основной результат для рассматриваемой модели управления запасом.Теорема 3. Пусть выполнены условия теоремы 2, леммы 1 и при этом() монотонно возрастает по()(монотонно убывает по)[([) (()),)∫() ( )). Тогда оптимальная стратегияуправления запасами имеет следующий вид: существует порог[()для задачи] такой, что{Таким образом, при достаточно общих предположениях о функциях стоимости авторамибыл получен результат относительно вида оптимальной стратегии.Замечание к параграфу главы.Отметим, что в данной работе также рассматривается специальный вариант модели,когда на функции общих издержек накладываются дополнительные условия, связанные схарактером убывания.
Именно, доказана теорема о существовании и форме представленияоптимальной стратегии управления (теорема 4, представляющая собой аналог теоремы 2).Кроме того, установлено, что оптимальная стратегия для средних издержек, являетсястационарной, детерминированной и имеет пороговый характер (теорема 5).21§4. Оптимальное управление запасом в полумарковской модели производства ипотребления продукта, основанной на системе обслуживания M|G|1|∞В настоящем параграфе будет приведено описание результатов исследованияполумарковской модели управления запасом дискретного продукта, выполненного в [35].Стохастическая полумарковская модель, предложенная автором, имеет существенное иестественное прикладное содержание. Математические методы, используемые в ходеисследования, а также получаемые результаты весьма сложны и разнообразны. Само изложениеэтих результатов потребует значительного объема текста, а их понимание – значительныхусилий.
Перейдем к изложению результатов данной работы.Описание модели и постановка задачи оптимизации.Рассматривается некоторая управляемая система, предназначенная для производства ипоставки потребителю определенного вида продукта. Реализация произведенного приборомпродукта потребителю осуществляется при поступлении требования в систему.
Входящийпоток заказов (требований) является пуассоновским с параметром. Каждое поступающеетребование удовлетворяется, если объем имеющегося запаса положителен, при этомпотребляется ровно одна единица продукта. Время производства единицы продукта - случайно,его функция распределения задается своим преобразование Лапласа-Стилтьесаимеет конечное математическое ожиданиеи дисперсию( ), а также. Входящий поток заказов ислучайная длительность производства единицы продукта независимы. В рассматриваемоймодели предполагается, что дляусловие устойчивостиинтенсивности входящего потокавыполняется.В модели предусматривается возможность создания запаса произведенного продукта –производство продукта может происходить независимо от поступления требований на заказпродукта в систему.
Именно, если в систему не поступает требование на производство единицыпродукта, а производство продукта продолжается, то произведенный продукт помещается насклад, который вмещает в себяединиц продукции. Поступивший в систему заказобслуживается мгновенно в результате поставки со склада, если на складе имеетсяположительный объема запаса продукта; в противном случае – требование помещается вочередь неограниченного размера.Рассматривается полумарковский процессмножеством состояний( ) с непрерывным временем и дискретным, который описывает состояние системы в момент времени.22( ) - известно.
ДляПредполагается, что значение процесса в начальный момент времени( )( ) . Величина( )описывает объем запаса продукта на складе в момент времени, а величина( )представляет собой число заказов, поступивших в систему за время []. Случайный процессопределения процесса( )( )( ) введем вспомогательные процессы( ) представляет собой объем продукта, который необходимо произвестидля удовлетворения всех поступивших заказов. Если величина( ), то объем запасапродукта на складе достаточен для удовлетворения всех требований, поступивших в систему завремя , и объем продукта, который необходимо произвести равен 0; если же( ), то всистеме образуется дефицит продукта (неудовлетворенный спрос) объема ( ).
Таким образом,{множество возможных состояний процесса ( ) имеет вид}.Управление эволюцией системы осуществляется при помощи стратегииопределяется следующим образом. Моментамиипринятия решенияявляются либо моменты поступления заказов в бездействующую систему (в системе непроизводится продукт), либо моменты завершения производства единицы продукта.Управление заключается в выборе одного из двух возможных решений:принимается решение не производить продукт;, если, если принимается решение опроизводстве следующей единицы продукта. Стратегия управления определяется наборомрешений, принимаемых в каждом состоянии системы. Случайный процесс принятия решений( )определяется соотношением[). Случайные процессыявляются полумарковскими, а последовательности {( )( ) и}и{( )( )} образуют вложенные в них цепи Маркова.Значение управлениясоответствует решению о непрерывной работе прибора,производящего продукт и может быть принять только в ситуации, когда склад не заполненполностью, то есть, когда система находится в одном из управляемых состояний{}{}.
Обозначим черезтечение интервала времени[число заказов, поступивших в систему в). Если в моментпринято решение о производствеочередной единицы продукта (активный режим), то изменение состояния процессаданном интервале описывается соотношениемрешение( ). Если в момент( ) напринятоне производить продукт (пассивный режим), то следующим моментомпринятия решенияявляется момент поступления очередного заказа в систему.
Такимобразом, выполняется соотношение. Решениеможет быть принято, когдасистема находится в любом из возможных состояний, но обязательно должно быть выбрано23только в том случае, когда склад полностью заполнен, то есть, когда вложенный процесснаходится в неуправляемом состоянии.Таким образом, множество возможных состоянийподмножества:{}процесса( ) разбивается на два- множество состояний, в котором возможно принять любое из{допустимых решений об управлении -{ }};- множество состояний, в котором{ }. Для большей общности получаемыхдопустимо только решение о простое системы -в дальнейшем результатов автор рассматривает следующие объекты, связанные с исходным{множеством состояний модели}. Предполагается, чтои{ограниченные снизу множества упорядоченных по возрастанию целых чисел, а множествосостоит из наименьшего элемента множества.
Для заданных чисел}{ }данныемножества имеют вид:{{},Для того, чтобы процесс}{},{ }{ }.( ), связанный со стратегией управления, былэргодическим в модели делается предположение об устойчивости данной стратегии. Также вмоделипредполагается,чтоклассдопустимыхстратегийзамкнутотносительнорандомизации:[]()Функционирование рассматриваемой системы связано с затратами на хранение запасапродукта на складе, которые непрерывно накапливаются со скоростьюза единицу времени,при условиях, что процесс ( ) находится в состоянии и в данном состоянии принято решениеоб управлении . Величина затрат, которые несет система при выборе стратегии управления, определяется мерой. В модели рассмотрены варианты дисконтированных и среднихудельных (отнесенных к единице времени) затрат.
Представление данных показателей качествауправления системой имеет вид:[∫∞[∫( )( )( )( )]]( )( )где формула (1) выражает дисконтированные затраты, а формула (2) - средние удельныезатраты.24В исследуемой полумарковской модели рассматриваются две основные постановкизадачи оптимизации (оптимального управления) по отношению к целевым функционалам,определяемым формулами (1) и (2). Стратегия управленияявляется оптимальной поотношению к функционалам (1), (2), если выполняется соотношение:{}( )Поиск оптимальных стратегии для задачи вида (3) автор предлагает вести в классе такназываемых пороговых стратегий. Пороговая стратегия определяется своим критическимножеством{{}}, связанным с фиксированным состоянием (порогом).
При такой стратегии система управляется в активном режиме, если её состояниенаходятся в критической области (выше порогового значения); в пассивном режиме, если еёсостояние находится вне критической области. В рассматриваемой модели понятия активного ипассивного режимов управления означают принятие решения производить или не производитьочередную единицу продукта.Множество всех пороговых стратегий управления, определяемых своими критическимножествами, задается следующим образом:{}( )Для обоснования оптимальности именно пороговых стратегий автор статьи ссылается наработы [26], [27], где доказываются соответствующие общие утверждения.Для решения основной оптимизационной задачи (3) автор дополнительно вводит новыйпоказатель качества управления – так называемую меру работывыбранной стратегии управления, которая зависит оти характеризует время, затраченное в системе напроизводство продукта.
В модели рассматриваются три различных вида меры работы,определяемые следующим образом:[∫ ( )[∫ ( )[∫( ( )]])( )( )]( )25где формулы (5) - (7) характеризуют дисконтированную, среднюю удельную и смещеннуюотносительно среднего меры работы соответственно. Величинав формуле (7) выражаетсяформулой:[∫ ( )где]( )- исходное состояние системы.В работе принимаются следующие предварительные предположения относительнопороговых стратегий и введенных показателей качества управленияПредположение 3.1. Для класса пороговых стратегий.и мервыполняютсяследующие условия регулярности:{1.}{ }⋃{ }, где- множествостационарных детерминированных стратегий управления.{ограничена сверху:}2.Мера работы3.Мера затрат4.Мера работы5.Доступная область работы - интервал, образованный пороговыми стратегиями:{ограничена снизу:.}.{является убывающей по :{}⋃ [{}.]}Далее автор сводит оптимизационную задачу (3) к выпуклой задаче оптимальногораспределения ресурсов, которая заключается в нахождении меры работысловами, нахождению такой стратегииили, другими, при которой:{}( )Для решения оптимальной задачи (9) используется метод множителей Лагранжа, изадача нахождения оптимальной стратегииформулируется в виде экстремальной задачидля функции Лагранжа:( )( ){( )что эквивалентно поиску оптимальной стратегии( )( ){}для( )- функция Лагранжа для задачи (9), гдеЛагранжа.
Множитель( ))()( ):}Величины, входящие в формулы (10),(11), определяются следующим образом:( )(;( )- множительинтерпретируется как плата за производство в системе одной единицы26продукции, а величина( ) представляет собой суммарные затраты, которые несет системапри выборе стратегии управления.В работе также рассматривается двойственная по отношению к (10) задача, связанная споиском оптимального значения:( ){( )}()и устанавливается связь необходимых и достаточных условий оптимальности дляосновной и двойственной задач. В дальнейшем исследование поставленной задачиоптимизации проводится по отношению к параметру, и условия оптимальностиформулируются именно для этого параметра.Представление основных результатов работы.Для представления основных результатов, автор вводит следующее понятие, связанное соптимальностью в классе пороговых стратегий (4).Определение 3.1.