Диссертация (1149223), страница 16
Текст из файла (страница 16)
Рассмотрим пространство R × X с нормой1k(c, x)kq = (|c|q + kxkq ) q ,где 1 < q < +∞,1p+1q= 1. Ясно, что это пространство, как и пространство X, являетсястрого выпуклым и рефлексивным.Обозначим через i естественный изоморфизм между R × X ∗ и (R × X)∗ . Операторi является изометрическим по предложению 3.1.1. Очевидно, что множество i(A) являетсявыпуклым слабо компактным и 0 ∈/ i(A).
Тогда по предыдущей теореме inf{kF k | F ∈ i(A)}достигается. Обозначим элемент, на котором достигается минимум, через F0 . Из того, чтоi — это изометрия, следует, что минимум нормы достигается и на множестве A, причемэлемент с минимальной нормой в множествах A и i(A) будет один и тот же с точностью доизоморфизма. Обозначим i−1 (F0 ) через (a0 , ϕ0 ) ∈ A.79Также из теоремы 3.6.1 получаем, чтоF ((c, x)) 6 F0 ((c, x)) ∀F ∈ i(A),(3.24)гдеmin(c,x)∈SR×XF0 ((c, x)) = F0 ((c, x)) = −kF0 k.Так как F0 = i((a0 , ϕ0 )), то нетрудно проверить, что(c, x) =1(− sign(a0 )|a0 |p−1 , kϕ0 kp−1 y0 ),p−1(k(a0 , ϕ0 )kp )а отсюда, учитывая (3.24), получим, что для любого (a, ϕ) ∈ A будет− sign(a0 )|a0 |p−1 a + kϕ0 kp−1 ϕ(y0 ) 6 −(k(a0 , ϕ0 )kp )p ,что и требовалось доказать.Замечание 3.6.3. Любое гильбертово пространство является строго выпуклым рефлексивным нормированным пространством. Отметим также, что пространства Lp и пространстваСоболева Wpm при 1 < p < +∞ тоже строго выпуклые и рефлексивные (доказательство см.,например, в [19, 63]).3.6.3Исследование метода кодифференциального спускаИзучим свойства последовательности, определяемой по методу кодифференциальногоспуска для функции f .
Для этого предположим, что пространство X рефлексивно и строговыпукло.Пусть на k-м шаге кодифференциального спуска была получена точка xk , причём точка xk не является inf–стационарной. В соответствии с методом, для построения следующейточки необходимо для любого w ∈ dµ f (xk ) найтиminv∈L(xk ,w)kvkp = kvk (w)kp ,(3.25)где vk (w) = (ak (w), ϕk (·; w)).
Как уже отмечалось, если 0 ∈ L(xk , w), то, очевидно, vk (w) = 0.Если же 0 ∈/ L(xk , w), то по следствию 3.6.1 минимум в (3.25) достигается. Далее необходимонайти ∆xk (w) ∈ SX такое, чтоmin ϕk (∆x; w) = ϕk (∆xk (w); w).∆x∈SX(3.26)По предположению пространство X строго выпукло и рефлексивно, поэтому минимум в(3.26) достигается, причем ∆xk (w) единственно. Напомним, что если ϕk (·; w) = 0, то поопределению ∆xk (w) = 0.80Покажем, что среди всех ∆xk (w) существуют такие, которые являются направлениямиспуска функции f в точке xk .
Так как в точка xk не inf–стационарна, то существует w0 =(0, ψk0 ) ∈ df (xk ) такое, что 0 ∈/ df (xk ) + {(0, ψk0 )} = L(xk , w0 ). Из этого, в частности, вытекает,что (ak (w0 ), ϕk (·; w0 )) 6= 0.По следствию 3.6.1 имеем, что для любых (a, ϕ) ∈ L(xk , w0 ) выполняется неравенство− sign(ak (w0 ))|ak (w0 )|p−1 a + kϕk (·; w0 )kp−1 ϕ(∆xk (w0 )) 6 −(k(ak (w0 ), ϕk (·; w0 ))kp )p < 0.Отсюда получаем, что для любых (0, ϕ) ∈ df (xk ) + {(0, ψk0 )} справедливо неравенствоkϕk (·; w0 )kp−1 ϕ(∆xk (w0 )) 6 −(k(ak (w0 ), ϕk (·; w0 ))kp )p < 0,значит ϕk (·; w0 ) 6= 0 и ∆xk (w0 ) 6= 0. Отсюда получаем справедливость следующего утверждения.Предложение 3.6.1.
Если для некоторого w = (0, ψ) ∈ dµ f (x) будет 0 ∈/ L(xk , w), тоϕk (·, w) 6= 0 и ∆xk (w) 6= 0.С учётом вида квазидифференциала кодифференцируемой функции (предложение3.5.1) имеемf 0 (xk , ∆xk (w0 )) =minmaxψ∈∂f (xk ) ϕ∈∂f (xk )+{ψ}ϕ(∆xk (w0 )) ≤6−maxϕ∈∂f (xk )+{ψk0 }ϕ(∆xk (w0 )) 61(k(ak (w0 ), ϕk (·; w0 ))kp )p < 0,kϕk (·; w0 )kp−1т.
е. ∆xk (w0 ) является направлением спуска функции f . В итоге получаем справедливостьследующего утверждения.Предложение 3.6.2. Если точка xk ∈ X не является inf–стационарной, то существуетw0 = [0, ψk0 ] ∈ df (xk ) такое, что f 0 (xk , ∆xk (w0 )) < 0, откуда, в частности, следует, чтоf (xk+1 ) < f (xk ).Теперь оценим убывание функции f вдоль каждого направления ∆xk (w), что понадобится при исследовании сходимости метода кодифференциального спуска. По предположению функция f кодифференцируема, поэтому для любого w = (b, ψ) ∈ dµ f (xk ) выполняетсяf (xk + α∆xk (w)) = f (xk ) ++max(a + ϕ(∆xk (w))) +(a,ϕ)∈df (xk )+minmin(b + ψ(∆xk (w))) + o(α, xk ) = f (xk ) +(b,ψ)∈df (xk )max(b,ψ)∈df (xk ) (a+b,ϕ)∈df (xk )+{(b,ψ)}(a + b + αϕ(∆xk (w))) + o(α, xk ) 6 f (xk ) ++max(a + b + αϕ(∆xk (w))) + o(α, xk ), (3.27)(a+b,ϕ)∈L(xk ,w)81где o(α, xk )/α → 0 при α → 0.
Предположим, что 0 ∈/ L(xk , w), тогда по следствию 3.6.1 длялюбых (a, ϕ) ∈ L(xk , w) выполняется неравенство− sign(ak (w))|ak (w)|p−1 a + kϕk (·; w)kp−1 ϕ(∆xk (w)) 6 −(k(ak (w), ϕk (·; w))kp )p .(3.28)Если же 0 ∈ L(xk , w), то неравенство (3.28) очевидно. Для упрощения записи положим1/kϕk (·; w)kp−1 , если kϕk (·; w)k =6 0,ξk (w) =1, в противном случае,иηk (w) =− sign(ak (w))|ak (w)|p−1 /kϕk (·; w)kp−1 , если kϕk (·; w)k =6 0,− sign(ak (w))|ak (w)|p−1 , в противном случае.Из неравенства (3.28) получаем, что для любого w ∈ dµ f (xk ) выполняется соотношениеϕ(∆xk (w)) 6 −ξk (w)(k[ak (w), ϕk (·; w)]kp )p − ηk (w)a ∀(a, ϕ) ∈ L(xk , w).Откуда, с учётом (3.27), находим, что для любого w ∈ dµ f (xk ) справедливо неравенствоf (xk + α∆xk (w)) 6 f (xk ) ++maxa + b − αξk (w)(k(ak (w), ϕk (·; w))kp )p − αηk (w)(a + b) +(a+b,ϕ)∈L(xk ,w)+ o(α, xk ) = f (xk ) − αξk (w)(k(ak (w), ϕk (·; w))kp )p ++max(a + b)(1 − αηk (w)) + o(α, xk ).
(3.29)(a+b,ϕ)∈L(xk ,w)При достаточно малых α > 0 будет (1 − αηk (w)) > 0, отсюдаf (xk + α∆xk (w)) 6 f (xk ) − αξk (w)(k(ak (w), ϕk (·; w))kp )p ++ (1 − αηk (w))b + o(α, xk ). (3.30)В итоге получаем справедливость следующего утверждения.Предложение 3.6.3. Если точка xk ∈ X не является inf–стационарной, то для любогоw ∈ dµ f (xk ) существует αw > 0 такое, что справедлива оценкаf (xk + α∆xk (w)) 6 f (xk ) − αξk (w)(k(ak (w), ϕk (·; w))kp )p ++ (1 − αηk (w))b + o(α, xk ) ∀α ∈ (0, αw ),где o(α, xk )/α → 0 при α ↓ 0.82Отметим, что в (3.30) выполнено b ∈ [0, µ], поэтому направление ∆xk (w) может ине быть направлением спуска функции f (даже если k(ak (w), ϕk (·; w))k > 0).
Но, как былопоказано выше, найдется хотя бы одно w0 ∈ dµ f (xk ), для которого направление ∆xk (w0 ) будетнаправлением спуска.Замечание 3.6.4. Ясно, что в методе кодифференциального спуска направление движения накаждом шаге (xk+1 −xk ) может и не быть направлением спуска (в этом направлении функцияможет вначале возрастать, а затем убывать, т. е. алгоритм позволяет “обходить” некоторыеточки локального минимума, см. [82]).3.6.4Сходимость метода кодифференциального спускаПокажем, что если последовательность, построенная по методу кодифференциальногоспуска, сходится, то при некоторых предположениях относительно функции f предельнаяточка этой последовательности будет inf–стационарной точкой рассматриваемой функции.Для этого нам потребуется определение равномерной кодифференцируемости.Определение 3.6.1.
Функция f : Ω → R называется равномерно кодифференцируемой внекоторой окрестности O точки x0 ∈ Ω, если функция f кодифференцируема в даннойокрестности и для любых x ∈ O и ∆x ∈ X справедливо равенствоf (x + ∆x) − f (x) =max (a + ϕ(∆x)) +(a,ϕ)∈df (x)min(b + ψ(∆x)) + o(∆x, x),(b,ψ)∈df (x)где o(α∆x, x)/α → при α ↓ 0 равномерно по x ∈ O и ∆x ∈ SX .Очевидно, что равномерно кодифференцируемая в некоторой окрестности точки x ∈ Ωфункция f : Ω → R является кодифференцируемой по Фреше в данной точке. При этом, каки в случае кодифференцируемости по Фреше, нетрудно проверить, что для любых непрерывно равномерно кодифференцируемых в некоторой окрестности точки x ∈ Ω функцийf1 , f2 : Ω → R, вещественных чисел λ1 , λ2 ∈ R и непрерывно дифференцируемой функции g,определённой в некоторой окрестности точки (f1 (x), f2 (x)) ∈ R2 , функции λf1 + λf2 , f1 · f2 ,max{f1 , f2 }, min{f1 , f2 } и g(f1 (·), f2 (·)) также являются непрерывно равномерно кодифференцируемыми в некоторой окрестности точки x.Справедлива следующая теорема о стационарности предельных точек последовательности, построенной по методу кодифференциального спуска.Теорема 3.6.2.
Пусть X — строго выпуклое рефлексивное нормированное пространство,функция f : X → R непрерывно кодифференцируема на X и inf x∈X f (x) > −∞. Предположим83также, что последовательность {xk }, построенная по методу кодифференциального спуска для функции f , сходится к точке x∗ ∈ X, а функция f равномерно кодифференцируемав некоторой окрестности точки x∗ . Тогда точка x∗ является стационарной точкой функции f на X. Если, кроме того, функция f выпукла, то x∗ — точка глобального минимумафункции f .Доказательство. Предположим, что точка x∗ не является стационарной, тогда существуетw0 = (0, ψ0 ) ∈ df (x∗ ) такое, что 0 ∈/ df (x∗ ) + {(0, ψ0 )} = L(x∗ , w0 ). Положимminw∈L(x∗ ,w0 )kwkp = k(a∗ , ϕ∗ )kp .Поскольку 0 ∈/ L(x∗ , w0 ), то k(a∗ , ϕ∗ )kp > 0 и нетрудно показать, что kϕ∗ k > 0 (предложение3.6.1).По предположению кодифференциальное отображение непрерывно, поэтому найдетсяпоследовательность {w(k) } такая, чтоw(k) = (bk , ψk ) ∈ df (xk ),0 6 bk 6 µ,w(k) → w0 = (0, ψ0 ).(3.31)Из непрерывности df (x) следует, что k(ak (w(k) ), ϕk (·; w(k) ))kp → k(a∗ , ϕ∗ )kp .
При этом ясно, что kϕk (·; w(k) )k → kϕ∗ k и ak (w(k) ) → a∗ , а тогда, начиная с некоторого номера, имеемkϕk (·; w(k) )k > 0 и при k → ∞ будетξk (w(k) ) → ξ(w0 ) =1,∗kϕ kp−1ηk (w(k) ) → η(w0 ) =− sign(a∗ )|a∗ |p−1.kϕ∗ kp−1(3.32)Из (3.32) следует, что существует такое α∗ > 0, что при достаточно больших k будет (1 −α∗ ηk (w(k) )) > 0 (см. (3.29) и (3.30)) и поэтому для любого α ∈ (0, α∗ ) будетf (xk + α∆xk (w(k) )) 6 f (xk ) − αξk (w(k) )(k(ak (w(k) ), ϕk (·; w(k) ))kp )p ++ (1 − αηk (w(k) ))bk + o(α, xk ).Также из (3.32) получаем, что начиная с некоторого номера,f (xk + α∆xk (w(k) )) 6 f (xk ) −3αξ(w0 )(k(a∗ , ϕ∗ )kp )p + (1 − αηk (w(k) ))bk + o(α, xk ).4Поскольку функция f равномерно кодифференцируема в некоторой окрестности точки x∗ ,то найдется 0 < α0 < α∗ такое, что при достаточно больших k будетf (xk + α0 ∆xk (w(k) )) 6 f (xk ) −α0ξ(w0 )(k(a∗ , ϕ∗ )kp )p + (1 − α0 ηk (w(k) ))bk .2Так как bk → 0 и ηk (w(k) ) → η(w0 ) (см.















