Ф.П. Васильев - Методы оптимизации (1125241), страница 76
Текст из файла (страница 76)
Из (16) следует, что )х — х (<(д(ст))ь(хо — хт я'! 7т > й Отсюда при т- сс получим оценку (15). Так как х,=Р„(х„— ст/'(х,)), то из теоремы 4.4.4 следует, что хь — точка минимума функции /(х) иа множестве Х. Теорема 3 доказана. П Заметим, что наименьшее значение у(ся) из (15) п1>и 0 < а < 2)ьЬ ' достигается при ст, = )гЛ ' и равно д(сг,) = (1 — ()г/Ь)') (Я. 3. Следуя !241, рассмотрим слоднмость метода (2), (4), не требуя, а отличие от теорем 1, 2, ограниченности множества АГ(хо).
Кроме того, будем считать, что вычисление градиента функции и проектирование на множество на каждой итерации проводятся с погрешностями. Теорем а 4. Пусть Х вЂ” вьтуклое гамкнутое многкестао ив Е", 1п1 Х ф Я, функция у(х) выпукла яа Х, у(х)Е СЬ (Х), >, > — со, Х„г Е1. Пусть вместо точного влечения градиента Г(х) и проекции Рх(х)жР(х) иавестяы ия приблихггния Уь'(х) и соответственно Рь(х) с погретностью )Т(х) — Уь~(х)! < бь, хЕ Х; !Р(х) — 'Рь(х)! < Себя, х Е л", С,=сапы>0, бь>0, Ь=0,1,..4 2; б, =6<ос.
ь=о 255 4 2. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА (!8) (У(х),х — х)>0, хбХ (22) [х„— х„[<(д( ))й! — .о[, Й=О,1, (29) Из (20) и неравенства (4,4.1) получаем где Г', '* г,,К 1 — рой, 0<а<2(ЬЧ-р) ', д( )= Ьп — 1, 2(Ь+р) (а<2Ь (24) (26) (31) (32) (33) 254 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ Наконец, пусть последовательность (хй) определяется условиями хй ! —— Рй(хй — айУк'(хй)), як 6 Х, й =О,! где ай еькбирается так: О<го<а <2(! — е)/Ь, й=0,1,, 0<э<!. Тогда (х„) сходится к некоторой точке е, 6Х,.
Д о к а э а т е л ь с т в о. Наряду с (хк) введем вспомогательную последовательность (ок), определяемую следующим образом; ик — — Р(хк — п у'(х )), й = О, 1, .. и ео— - хо. (20) Ото|ода и из (18) с помощью теоремы 4.4.2 и условий (17) получаем !хй ! — ог,! < !Рк(хк — ай Уй'(х,)) — Р(хй — айУй~(х ))[+ + [Р(хй — пйУй~(хй)) Р(хй — пйУ~(хй))! ( Собк + ай[Уй~(хй) — У~(хй)! < < Собй Ч (2(1 г)/Ь)б.
= С бк й = 0 1 (21) Возьмем произвольную точку х, 6 Х„, Согласно теореме 4.2.3 тогда (ий — хк + ак У (хг ), х — ой) > 0 кУх 6 Х. (23) Положим в (23) х = х„а (22) умномким на пй > 0 и примем х = о, Сложим получившиеся неравенства ("й и ой)+ай(у'( .) — у'(,),х„— .) >О, А=О, ! 11реобразуем каждое слагаемое в правой части (24). Прюкде всего имеем 2(и — х, х„— и,) = /х — х„[з — /х, — ой!з — !и — х,[з (25) Далее, воспользуемся неравенством (4,2.20) при и = хй, о = хм ш = ок; получим (У'(х ) — Уч(х„), х„— о ) < (ЬУ4)!х — и [з, й =О, 1, Подставив (25), (26) в (24), получим [хй — х„! — [о, — х,/З вЂ” (1 — айЬ/2)[хй — ой! > 0 Отсюда, учитывая условие (! 9), имеем [хй — х,[з > [и„— х„/з.1- е/х„— о !з, й — О 1 (27) Далее, воспользуемся леммой 2.6.10 при х„= х,, г„= хы юй ! — — ой! из (! 7), (21), (27) получим 1!и /х — х„! = 8гп !ой — х,! < оо, !пп [ой — х„! = О.
(28) й оо й оо й Отсюда следует, что последовательность (хй) ограничена. Тогда существует хотя бы одна предельная точка о, этой последовательностй и подпоследовательность (хй ), сходящаяся к и„. Из (28) имеем 1цп ой — — и,. Согласно (23) с учетом (19) получаем (у(х,),*-.й»-(,-*„*-..)-й -!;-*,[[*-;[; . Отсюда при й = й со будем иметь (у'(о,), х — о„) > 0 при всех х 6 Х, По теореме 4,2,3 тогда оо 6 Х,.
Вспомним, что неравенство (27) было получено для любой точки х, 6 Х„, В частности, (27) верно и для х, = и,. Но о, — предельная точка последовательности (х„). Из леммы 2.6.!0 тогда следует, что (х„) сходится к о„. Теорема 4 доказана. С! Замечание 1. Если в (17) бк — — О, й =0,1,..., то из (!8)-(20) следует, что х„! — ей, й = О, 1,... Тогда из (27) имеем !хй — х.!'>!хй,— х.! Йе[х, — х„,!', Й=О,!,..о 'кгх„пХ Пользуясь произволом в выборе х, н Х„отсюда получаем [х„— е[>!х, — о[, р(хй,Х)>р(хй„к,Х), Й=О,!,..о причем равенство здесь возмоккно лишь при хйч! — — хк, что в силу теоремы 4.4.3 означает хй 6 Х,.
Таким образом, при точной реализаций метода (!7)-(19) расстояние от точки хк до множества Х, или до точки о„монотонно убивает. Как мы видели, таким кке свойством обладает градиентный метод (1.3), (1.21), (1.22). 4. Опираясь на неравенства, полученные при доказательстве теоремы 4, можно оценить скорость сходимости метода (2), (4) для сильно выпуклых функций, причем, в отличие от теоремы 3, новая оценка оказывается неулучщаемой на классе сильно выпуклых функций, принадлеккащих С! '(Х), Те ар е м а 5.
Пусть Х вЂ” выпуклое замкнутое множество из Ж", 1п1 Х фиг, а функция У(х) сильно выпукла на Х и принадлежит С' '(Х ), Пусть последовательность (х„) построена методом (2) при пй — — а, й = О, 1... О < а < 2УЬ. Тогда 0 < д(а) < 1, постоянные р, Ь вэятьк иэ (2.6.6), (4.3,12), а х„— точка минимума у(х) на Х. Наименьшее значение д(п) при 0 < а < 2Ь ! достигается при а = гй„= 2(Ь -ь р) ! и разно д(п,) = (Ь вЂ” р)(Ь + р) Доказательств о.
Из теоремы 4.3.1 следует, что У, > — оо, Х, состоит из единственной точки х,.Тогда из теоремы 4имеем )пп !хй-х !=О. Здесьмы предполагаем, чтов(17) бй — — О, й = О, 1,, поэтому из (18), (20), (2!) следует ек — — хк !, й = О, 1, Учитывая последнее равенство и условие а„= а, подставим (25) в (24). Получим [х„, — х„[х < !х„— х,[я — [х,, — х„[з+ 2а(у'(хк) — у'(х,), х, — хй „!) = =[х„— х,[З вЂ” [х, — хй „! — а(у'(хй) — у (х,))! + и. аз[у'(х„) — у'(х )!я — 2п(у'(хй) — у'(х ), хй — х,), Й =О, 1,... (30) Вспомним неравенства (4.3.17),(4.3.18), из которых имеем [,у'(хй) — у'(х,)! -1- Ьр[х„ — х„! < (Ь Ч- р)(у'(х ) — у'(х„), х, — х„), й = О, 1, р[х — х,! <[у'(х ) — у'(х,)[< Ь!х„— х„[, й =О,1,...
Из (30), (31) следует [х, — х,[З < [х — х„! -и а [у'(хй) — у (х,)!— — 2а(Ь + р) ! !Уг(х ) — У~(х„)[~ — 2аЬР(Ь + Р) [хй — хо! — а[а 2(У, 4 ) 














