Диссертация (Синтез оптимальных стратегий в двухшаговых задачах стохастического оптимального управления билинейной моделью с вероятностным критерием), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Синтез оптимальных стратегий в двухшаговых задачах стохастического оптимального управления билинейной моделью с вероятностным критерием". PDF-файл из архива "Синтез оптимальных стратегий в двухшаговых задачах стохастического оптимального управления билинейной моделью с вероятностным критерием", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Структура оптимальной логарифмической стратегии приналичии и отсутствии управляющего воздействия 01№ примера100,020,030,04–20,020,030,04–30,020,030,04–010,8080,8620,916–110,0830,0560,0280,492210,1090,0820,0560,50811 /210,7610,6830,50,9690,20,3430,3770,411–0,2830,2660,2470,4640,3740,3570,3410,5360,7570,7450,7240,8660,40,2760,3060,338–0,1060,0870,0660,2850,6180,6070,5960,7150,1710,1430,1110,399120,050,060,150,07Как следует из таблицы 1.3, логарифмический критерий диверсифицирует управляющее воздействие.
При этом если управляющее воздействие 01отсутствует, то управляющее воздействие, получаемое по логарифмическомукритерию, очень близко по стратегии (по соотношению 11 /21 ) к оптимальнойдвухшаговой вероятностной стратегии на первом шаге. Дополнительное управляющее воздействие 01 только ухудшает структуру управляющего воздействияв смысле близости 11 /21 к 11 /21 для любого из рассмотренных 0 .Теперь сравним на реальных данных оптимальную двухшаговую вероятностную стратегию и оптимальную логарифмическую не только по структуреуправляющего воздействия, но и в смысле значения {3 ≥ } на каждой изэтих стратегий.
Для этого рассмотрим случай, когда 1 = 0, 024 и 2 = 0, 058.Значение 1 = 0, 024 соответствует реализации выборочного среднего годовойдоходности акций компаний Lockheed Martin при их покупке в период с 01.01.10по 01.01.11, значение 2 = 0, 058 – Boeing при их покупке за тот же период.—75—Рисунок 1.4. Динамика акций Boeing.Рисунок 1.5.
Динамика акций Lockheed Martin.—76—Отметим, что логарифмическая стратегия является программной, причем на каждом шаге остается одной и той же = для всех = 1, 2, то естьзависит только от характеристик распределения и не зависит от и параметра. Для вычисления вероятности {3 ≥ } воспользуемся выборочной оценкойвеличины{1 (1 + 11 11 + 21 21 )(1 + 12 12 + 22 22 ) ≥ },(1.87)поскольку точное значение вероятности (1.87) получить довольно сложно, т.к.под знаком вероятности стоит произведение случайных величин, имеющих трапециевидное распределение.Положим 1 = 1 и для различных найдем оптимальные стратегии.Таблица 1.4. Сравнение оптимальной двухшаговой вероятностной илогарифмической стратегийОптимальная стратегияЛогарифмическаяДвухшаговаяЛогарифмическаяДвухшаговая1,021,05110,4720,4630,4720,458210,5280,5370,5280,542{3 ≥ }0,480,5090,4630,493Объем выборки, по которой производилось вычисление вероятности{3 ≥ } для логарифмической стратегии, составил 107 реализаций.
Параметр ˆ = 10−3 .Как следует из таблицы 1.4, оптимальная логарифмическая стратегияпрактически совпадает с оптимальной двухшаговой вероятностной стратегиейна первом шаге, однако ожидаемо уступает в смысле величины {3 ≥ }.При этом стоит отметить, что если бы оптимальное управление в двухшаговойзадаче строилось при наличии управления 01 с мультипликативным детерминированным воздействием на систему 0 , то значения вероятностей {3 ≥ }особенно при больших на оптимальной двухшаговой вероятностной стратегии и оптимальной логарифмической стратегии отличались бы существенно.Это связано с тем, что логарифмический критерий «консервативен» в плане—77—выбора оптимального управляющего воздействия, т.е.
управление 01 в оптимальной логарифмической стратегии имеет большой вес.1.6.Выводы по главе 11. Найдена плотность суммы двух равномерных распределений, у которых правые концы носителя меры заданы параметрически.2. Найден аналитический вид оптимального управления на втором шаге в двухшаговой задаче оптимального капиталовложения с двумя рисковымиактивами, имеющими равномерное распределение доходностей. Оптимальноеуправление оказалось кусочно-постоянной функцией состояния.3.
Найден аналитический вид критериальной функция на первом шаге в двухшаговой задаче оптимального капиталовложения с двумя рисковымиактивами, имеющими равномерное распределение доходностей, которая оказалась кусочно-нелинейной. Доказана ее непрерывность и предложен алгоритмее оптимизации. Таким образом, задача оптимизации в функциональном пространстве сведена к задаче оптимизации по скалярному параметру.4. Найдены аналитические выражения для критериальных функций водношаговых задачах с логарифмическим и квантильным критерием.5. Проведены численные эксперименты. Для различного набора исходных данных в двухшаговой задаче было найдено оптимальное управляющеевоздействие на первом шаге, которое, как правило, оказывалось диверсифицированным.
Проведено сравнение оптимальной двухшаговой вероятностнойстратегии с оптимальной логарифмической.Основные результаты главы опубликованы в [12, 13, 15, 16, 22].2.Синтез оптимального управления в двухшаговойзадаче оптимального капиталовложения с произвольным распределением доходностейЦелью данной главы является разработка алгоритма поиска приближенной стратегии первого и второго шагов в двухшаговой задаче оптимального капиталовложения по вероятностному критерию для случая произвольного числаслучайных величин, характеризующие доходности, на каждом шаге.В разделе 2.1 приводится постановка двухшаговой задачи оптимальногокапиталовложения с произвольным числом рисковых активов, имеющими некоторое финитное распределение доходностей на каждом шаге, по вероятностному критерию.
В разделе 2.2 находятся верхняя и нижняя оценки функционалавероятности в классе кусочно-постоянных управлений второго шага. В разделе 2.3 приводятся алгоритмы максимизации нижней оценки в случае одногорискового актива, а также в случае произвольного числа рисковых активов накаждом шаге.2.1.Постановка задачиВ данном разделе приводится постановка двухшаговой задачи оптимального капиталовложения с произвольным числом рисковых активов, имеющиминекоторое финитное распределение доходностей на каждом шаге, по вероятностному критерию.Рассмотрим динамику системы, описываемую соотношением(︃)︃∑︁+1 = 1 + 0 0 + , = 1, 2,(2.1)=1где – управляющие воздействия на систему на -м шаге, = 0, . . .
, ,а – случайные воздействия на систему на -м шаге, = 1, . . . , , 0 –детерминированное воздействие на систему, 1 – некоторое положительноедетерминированное число, = 1, 2. Предположим, что 11 , 21 , . . ., 1 , 12 ,78—79—22 , . . ., 2 независимы в совокупности. Предположим также, что у всех случайных величин во все моменты времени существует плотность распределения,а также то, что закон распределения случайной величины 11 совпадает с законом распределения случайной величины 12 , закон распределения 21 совпадает с законом распределения 22 , закон распределения 31 совпадает с закономраспределения 32 , и т.д.
Будем рассматривать только такие случайные величины, плотность распределения которых финитна, т.е.inf{ ∈ R1 : () > 0} = , = 1, , = 1, 2,sup{ ∈ R1 : () < 1} = , = 1, , = 1, 2,где () – функция распределения -ой случайной величины в -ый моментвремени, причем ∀ ∈ {1, . .
. , } −1 ≤ < 0 < . Пусть управляющие воздействия на -ом шаге , col(0 , ), где , col(1 , . . . , ), при фиксированном (реализовавшемся) значении выбираются из множества , {(0 , 1 , . . . , )T : 0 + 1 + . . . + = 1, ≥ 0, = 0, }.(2.2)Отметим, что множества допустимых стратегий, подобные множеству(2.2), встречаются в задаче распределения ресурсов [71, 83].
Обозначив , col(1 , . . . , ), = 1, 2, перепишем соотношение (2.1) в виде+1 = (1 + 0 0 + T ), = 1, 2.Введем в рассмотрение функционал вероятности (1 , 2 (·)) , {3 (2 (1 , 1 , 1 ), 2 (2 ), 2 ) ≥ },(2.3)где под записью {3 (2 (1 , 1 , 1 ), 2 (2 ), 2 ) ≥ } как и ранее понимается,что управление на втором шаге выбирается в зависимости от значения состояния 2 , а управление на первом шаге, завися от значения 1 , ищется при фиксированном 1 , при этом ищется вероятность того, что состояние 3 преодолеетпорог , который необходимо достичь. В дальнейшем будем предполагать, что > 1 (1 + 0 )2 , так как в противном случае задача оптимизации не имеет—80—никакого смысла, поскольку любой уровень ≤ 1 (1 + 0 )2 можно достичь свероятностью единица, выбрав в качестве управления на первом и втором шагестратегию (1, 0, 0, .
. . , 0)T . Также не рассматриваются уровни ≥ 1 (1 + )2 ,поскольку при таких значение функционала вероятности равно нулю.Сформулируем оптимизационную задачу(1 , 2 (·)) = argmax1 ∈,2 (·)∈ (1 , 2 (·)),(2.4)где под записью 2 (·) ∈ понимается, что значение функции 2 (2 ) принадлежит множеству , а сама эта функция является измеримой. Сформулируемутверждение о существовании решения данной задачи.Если под переменной понимать долю капитала инвестора, вкладываемую в -й момент времени в -й финансовый инструмент с доходностью 0 , если = 0, и доходностью , если > 0, а под 1 – начальный капитал инвестора,под – желаемый капитал инвестора при ликвидации инвестиционного портфеля, то задача (2.4) представляет собой двухшаговую задачу оптимального капиталовложения по вероятностному критерию с произвольным числом рисковыхактивов. Отметим, что используемое ограничение на финитность плотностейу доходностей – физическое, и обусловливается тем фактом, что наихудшийслучай для инвестора – это разорение компании, в акции которой он вложился, поскольку при разорении компании возможен случай, когда за свои акцииинвестор не получит никакой компенсации, тогда в этом случае доходность оттакого актива составит −100%, однако меньшую доходность получить невозможно, при этом бесконечно обогатиться также невозможно, поэтому носительмеры ограничивается некоторой положительной величиной.