Теория случайных процессов (1042226), страница 21
Текст из файла (страница 21)
Анализ структуры дискретных цепей3.30.4321109865234765891073.31.13.32.126543710893.33.32154976810170Сборник задач3.34.7651893243.35.123487653.36.3.37.21367895104171§ 3. Анализ структуры дискретных цепей3.38.3.39.3.40.123654873.41.10923187910645172Сборник задач3.42.32415678910233.43.3.44.1546789103.45.31246587910§ 3. Анализ структуры дискретных цепей3.46.213476589103.47.534218671093.48.123546798103.49.612738594173174Сборник задач3.50.3.51.3.52.125349687103.53.78431256910175§ 3.
Анализ структуры дискретных цепей3.54.243519678103.55.132876549103.56.56712348910176Сборник задач3.57.143251098673.58.3.59.21105483.60.367237189410695177§ 3. Анализ структуры дискретных цепей3.61.432615789103.62.124536791083.63.3.64.1234510987612345689107178Сборник задач3.65.231894107563.66.123451098763.67.15264378910§ 4.
Дискретные цепи с доходамиДанный параграф «Сборника» включает десять задач, которые примыкают к трем примерам, рассмотренным в лекциях:• руководителя фирмы (лекции 8–10),• об оптимальной остановке (лекция 11),• управления запасами в условиях неопределенности (лекция 11).Первые шесть задач являются основными и могут использоваться в качестве тем курсовых (самостоятельных) работ. Исходные данные формируются на ЭВМ самостоятельно с учетомсоответствующих рекомендаций.§ 4. Дискретные цепи с доходами179В рамках нижеследующих задач читателю предлагается выполнить такое задание:• построить граф (графы) состояний моделирующей ДЦМв неуправляемом режиме,• найти значения ПОД в неуправляемом режиме для n == 1, 2, 3, 4, 5 и построить графики vi (n) ∀ i по приведенным исходным данным,• найти оптимальное управление для n 6 5 (методом динамического программирования) и для n → ∞ (двумя методами —полного перебора и Ховарда по тем же исходным данным).4.1.
Управление запасами в условиях неопределенности.Рассмотрим n-шаговый процесс функционирования магазина,шаг представляет собой некоторый интервал времени, например,месяц. В начале n-го шага магазин заказывает kin единиц однородного и неделимого товара по цене c руб.
Это количестводобавляется к i единицам товара (i = 0, 1, 2, ... ), которое моглооказаться непроданным после предыдущих шагов. Таким образом, в начале каждого шага мгновенно создается так называемый сформированный запас в количестве t = i + kin единиц.Величина запаса ограничена, например, емкостью склада N .На протяжении шага запасенный товар продается по ценеd руб., d > c > 0, в соответствии со спросом. Спрос представляет собой ДСВ с распределением вероятностей p(m) m == 0, 1, 2, ... , M , M > N . Если спрос m превышает запас t,то неудовлетворенный спрос наказывается штрафом e(m − t).В неуправляемом режиме i + kin = N .Исходные данные:M = 5, N = 3, c ∈ (0, 10), d = c + ∆, ∆ ∈ (0, 5) ⇒⇒ c = 10R1 , ∆ = 5R2 , e = 8R3 , β = R4 ,Rm+4p(m) =, m = 1, 2, ...
, 5,R5 + R6 + ... + R9где R1 , R2 , ... , R9 — независимые случайные числа, равномернораспределенные на интервале (0,1).4.2. Задача коммивояжера о заключении контракта напоставку товаров («управление по остановке»). Некий коммивояжер (К) объезжает N городов, занумерованных числами1, 2, ... , N , в соответствии с заданной МВП.
Находясь в n-ймомент времени (n = 0, 1, 2, ... ) в i-м городе, К может принятьодно из двух решений: kin = 1 — «остановка», т. е. заключение180Сборник задачконтракта и прекращение поездок; kin = 0 — объезд городовпродолжается. Исключение составляют поглощающие состоянияс принудительной остановкой и заключением контракта. Призаключении контракта в городе i К получает доход fi ; если жеон продолжает поездку из города i, то вносит определеннуюплату ci > 0.
Отказ от заключения контракта в городе i связанс надеждой через один или несколько шагов оказаться в городеj и получить доход fj ≫ fi .Итак, какого правила должен придерживаться К, чтобы получить максимальный доход? Это правило и есть так называемоеуправление по остановке.Исходные данные:N = 5, fi ∈ (0, 100), ci ∈ (0, 10), P = (pij ), i, j = 1, 2, 3, 4, 5 ⇒⇒ fi = 100Ri , ci = 10Ri+5 ,pij =Rij,Ri1 + Ri2 + Ri3 + Ri4 + Ri5где Ri , Rij — независимые случайные числа.4.3. Задача о ремонтной мастерской (РМ).
Рассмотрим РМс состояниями i = 0, 1, 2, ... , N , N = 3, где i — число клиентов.В дискретные моменты времени n = 1, 2, ... в РМ обращаетсяодин потенциальный клиент с вероятностью pi или никто необращается с вероятностью qi = 1 − pi . Каждый клиент можетбыть обслужен с вероятностью Pi в течение одного периода илине обслужен с вероятностью Qi = 1 − Pi . В последнем случае оностается в РМ. Если РМ находится в состоянии i, то по прошествии одного периода она может оказаться в состоянии j(i − 1 6 j 6 i + 1) с вероятностями 1p= qi Pi , i,i−1p1i,i = qi Qi + pi Pi , 0 < i < N ; 1pi,i+1 = pi Qi ,( 1( 1p0,0 = q0 ,pN ,N −1 = PN ,i = 0;i = N.p10,1 = p0 ,p1N ,N = QN ,При переходе из состояния в состояние РМ получает доходы, образующие МОД R.
Назовем этот режим неуправляемым(k = 1).§ 4. Дискретные цепи с доходами181Для повышения рентабельности РМ ее руководство рассматривает две возможности:• модернизацию технических средств ремонта (k = 2);• модернизацию технических средств ремонта с переходом накруглосуточный график работы (k = 3).Эти усовершенствования позволяют увеличить вероятностиpi и Pi на a % при k = 2 и на A % при k = 3, но требуютопределенных затрат, которые приводят к снижению доходов наb % и B % соответственно.Исходные данные:N = 3, pi , Pi ∈ (0,5; 0,8),0250R = 100 125 25100i = 0, 1, 2, 3,00 ⇒125⇒ pi = 0,5 + 0,3Ri , R0 > R1 > R2 > R3 ,bi , Rb1 > Rb2 > Rb3 ,Pi = 0,5 + 0,3Rгде Ri — равномерно распределенные случайные числа; a = 10,A = 20, b = 7, B = 14.4.4.
Задача Ховарда о водителе такси (ВТ). Область деятельности ВТ охватывает три города: А, В и С. Если ВТнаходится в городах А или С, то у него имеется три стратегии:• курсировать в надежде поймать случайного пассажира(k = 1),• поехать на стоянку такси и ждать пассажира в очереди(k = 2),• надеть наушники и ждать вызова по радио (в городе В этойвозможности нет) (k = 3).Для каждого города i и каждой стратегии k задаются вероятности pkij того, что следующий рейс будет совершен в городk . Неуправляемыйj , и соответствующие этим рейсам доходы rijрежим соответствует k = 1.Исходные данные:kpkij ∈ (0, 1), rij∈ (1, 51), b ∈ (0, 1) ⇒Xkkkk⇒ pkij = Rij/Rij, rij= 1 + 50Rij ∀ i, j , k ; β = R,jгде R c различными индексами — независимые случайные числа.182Сборник задач4.5. Задача о замене станочного оборудования. Станочноеоборудование цеха может находиться в одном из трех состоянийi, i = 1, 2, 3.
В первом из них руководитель цеха может принятьодно из двух решений: k = 1 или k = 2, во втором — одноиз трех решений k = 1, k = 2 или k = 3, в третьем — одноиз двух решений k = 2 или k = 3. Если k = 1, то оборудованиеостается прежним; если k = 2 или k = 3, то старое оборудование продается по цене ci и покупается новое оборудование илиотличного качества (k = 2) по цене d2 или хорошего качества(k = 3) по цене d3 . Эта модернизация осуществляется мгновеннов начале рассматриваемого шага, и к его завершению станочноеоборудование может перейти из i-го состояния в j -е с заданнойвероятностью pkij .
При этом цех получает одношаговый доходk1rij= rij+ ci − d k ,k > 2.Неуправляемый режим соответствует k = 1.Исходные данные:R11 > R12 > R13 > R22 > R23 ⇒R1j⇒ p11j =, j = 1, 2, 3;R11 + R12 + R13p2j =0,R2j,R22 + R23j = 1,j = 2, 3;p3j =⇒ p2ij = p11j ∀ i, j ; p32j = p33j200 1901β = R, R = − 170− −c2 = 70,c3 = 40,d2 = 80,(0,j = 1, 2,1,j=3⇒= p12j ∀ j ;180160 ,150d3 = 50.Здесь, как и выше, R c нижними индексами — случайные числа,β — коэффициент переоценки; в матрице R1 черточки означают,что соответствующие элементы не определены.4.6. Задача управления рекламной кампанией. Фирма может рекламировать свои изделия с помощью одного из трехсредств: радио (k = 1), телевидения (k = 2) и газеты (k = 3).183§ 4.
Дискретные цепи с доходамиНедельные затраты на рекламу Ck , k = 1, 2, 3, заданы. Сбытпроизведенных изделий оценивается либо как отличный (i = 1),либо как хороший (i = 2), либо как удовлетворительный (i = 3).Функционирование фирмы моделируется ДЦМ с заданными матрицами P k , Rk , k = 1, 2, 3, и заданным КП β .
Неуправляемыйрежим соответствует k = 3.Исходные данные:kpkij ∈ (0, 1), rij∈ (30, 300), ci ∈ (10, 30) ⇒⇒ Rik1 > Rik2 > Rik3 , z = Rik1 + Rik2 + Rik3 ⇒!Rik1 Rik2 Rik3k⇒ pi =,,, i, k = 1, 2, 3 ⇒zzzkkk⇒ Ri1 > Ri2 > Ri3 ,k⇒rik= 270kkkkz = Ri1 + Ri2 + Ri3 ⇒!kRi1 Ri2 Ri3,,zzz+ 30, i, k = 1, 2, 3 ⇒⇒ R1 > R2 > R3 ⇒ ci = 20Ri + 10, i = 1, 2, 3, β = R4 .4.7. Задача садовника. Садовник в начале каждого сезонапроводит химический анализ почвы. По его результатам оценивается продуктивность сада на новый сезон как хорошая (состояние 1), удовлетворительная (состояние 2) или плохая (состояние 3).
Вероятности переходов из одного состояния в другое можно представить в виде матрицы P 1 . Садовник можетизменить эти вероятности, если применит удобрения того илииного типа, тогда МВП станет равной P 2 или P 3 . С каждымсостоянием почвы связан доход, задаваемый МОД R1 , R2 илиR3 в зависимости от использования или неиспользования удобрений.4.7. Задача капитана судна.
Судно совершает регулярныерейсы между двумя портами 1 и 2. Продолжительность рейсаот порта до порта составляет одни сутки.В каждом порту капитан решает вопрос о загрузке суднастандартным грузом или спецгрузом. Рейс со спецгрузом приносит больший доход, но он будет доставлен в порт отплытиятолько через сутки. Последующий маршрут судна определяетсяМВП (P 1 или P 2 ) и характеризуется вектором СОД (Q1 илиQ2 ) .184Сборник задач§ 5. Непрерывные цепи. Уравнения КолмогороваВо всех задачах этого параграфа требуется по размеченному графу состояний составить систему дифференциальноразностных уравнений для вероятностей состояний, а также найти решение при произвольном t и t → ∞.5.1.
См. рис. 83.211, 5213π2 ( 0 ) = 10,5Рис. 83Решение. По мнемоническому правилу (лекция 13) составляем систему уравненийπ̇ (t) = 2π2 (t) − π1 (t), 1π̇3 (t) = 0,5π2 (t) − 1,5π3 (t), π (t) + π (t) + π (t) = 1, π (0) = 1.1232Используя таблицу изображений по Лапласу (лекция 13), строимсистему линейных алгебраических уравнений относительно Li ≡≡ Li (x) — образ системы дифференциально-разностных уравнений xL1 = 2L2 − L1 ,2 L20,5L2, L3 =⇒xL3 = 0,5L2 − 1,5L3 , ⇒ L1 =x+1x + 1,5 L + L + L = 1/x123⇒20,51++x + 1 x + 1,5L2 =1⇒xx2 + 5 x + 51L2 = ⇒(x + 1)(x + 1,5)x2(x + 1,5)L1 =,xp2 (x)(x + 1)(x + 1,5) ⇒⇒ L2 =x x2 + 5x + 50,5(x + 1), L3 =xp2 (x)⇒185§ 5. Непрерывные цепи.