Том 2 (1160084), страница 26
Текст из файла (страница 26)
,дх, дхэ " ' дхн (27) Решение а = (а,, зе, ..., И„) системы (24) является и решением системы (27), которая имеет специальный вид, рассмотренный в п. 1. Покажем, что з можно найти методом итераций, описанным в п. 1, примененным к системе (27), т.
е. покажем, что последовательность х!"'! = !Р (х! - '!) = — х!"'- н — 7 (х!"'- '!) е (х!"'- '!) (т=1, 2, ...) (28) сходится к з. если только начальное приближение хаз взято достаточно близко к а. Для. этого воспользуемся очевидным равенством .Г!(а1. Яы ° ° ° ° Яч) ЕЕ(У! Уа. ° ° 1 = ~ „— ", ~е(У!+е(я! — У~ ч н Е'ч д = ) г,—.Л!У!+Е( — У) ,l Л1 дх. о ун + Е (х — у !) ) !ЕЕ = у„+ Е (г„— У„)] (ЕŠ— УЕ) с(Е. (29) не вырождена. При этих условиях решение а системы (24) можно найти следующим образом. Пусть лп а11 ''' а1Н "(х) — эа! В11 ° ьэч Кч! КИ1 ° ° ° Кнн — матрица, обратная к у„(х). Рассмотрим систему уравнений хь = у! (х1, х,, .... х„) = х» — ~~'„АТЕЕ (х1, ..., х„) ЕЕ (х1, х,,..., х„) ,! 1 (1=1, 2, ..., а), или коротко в векторной форме х = !Р (х) = х — 7 (х) е' (х).
(27') 156 гашение алгевеаических и теансцендентных геавнений (гл. 7 Введем обозначения: > Ро (у ') — / д —,,Л(у>+(( — у>), "уо+т(го — уо)1 й, Р д о Рн(у, г) Р,о(у, г) ... Р>о(у, г) Р(» г) Ро>(у, г) Роя(у, г) ... Ро„(у. г) (ЗО) Ро>(у, г) Гоо(у г) "° Роо(у г) Очевидно, что при у=а= х Р;у(х, х)=, Р(х, х) — У,,(х), дху У(г) — У(у)=Р(у. г)( — у). (31) (32) Так как (33) х>'о> = >р (х> -'>), а = >о (а), то хне> — а= >р(хон '>) — ~р (а) = хне-» — а — Г (хне-») > (хне '>) = = Х>'"-Π— а — У~'(Х> -'>) 17(Х>о1-О) — 7 (а)], (34) ибо У(а) = (У> (ан аа ° а ).. ° У (ао ао а )) = 6.
Испольауя (32), можно записать (34) в виде хпо> — а = х> -'> — а — У„'(х> '>) Р(х' '>, а) (х~ — а) = — 17 )','(х> -»)Р(х> -и а)1(х> ~-» — а), (ЗЯ >>х»> — а>> = >>17 — у (х>о>) Р(х>о>, а)1(хи> — а)>> ( ( (~7 — У > (х>о>) Р(х>о> а))! ° )~х>о> ц!) (36) Так как нулевая матрица имеет норму. равную нулю, а где! — единичная матрица. Матрица Р(у, г) является непрерывной функцией своих аргументов, и при х=у=-г Р(х. х)=Уг(х). Если хы> достаточно близко к а, то Р(х>о>, х>'>) =7'„(х>~>) Ф О и Уе (хо) Р (хю> х>о>) = 7, а матрица > ' (х>~>) Р (х>о> а) достаточно близка к единичной матрице У, а 7 — у„'(хо)Р(хо, а) близка к нулевой матрице.
Как бы мы ни определили норму вектора х и соответственно норму матрицы, имеет место неравенство 157 гашении систвм тглвнвний $5! близка к нулевой, то существует такое 3 ) О, что если р (х, а) < 3, то !!7 — Уя'(х)Р(х, и)!! <К<1. (37) Если р(хгв>, а) < 3, то р (хч>>, з) = !!хч>> — а!! < К!!х>м — а!! = Кр(хг>з, з) < Кь < Ь, Следовательно, и !!! — Уе'(х»>, з)Р(х>О, и)!! <К. Предположим, что мы уже доказали, что р(х>м>, а)<Ко(х> '>, а) <3, !!! — 7 >(х>"'>)Р(х>"'>. а)!! <К, (38) Тогда р( ' '", )=!! '"'" — !!= !!!7 — Х (ч >) р(хн»>, и)!( г > — ) !!< < !!7 — У '( >)Р(хЧм>, )!! ° !! > — !! <Кр( ( >, ) < 3, т.
е. р(х>"'+», а) <3 и по (37) !!7 — 7 (х' +'>) Г(хг '>, а) !! < К. Таким образом, неравенства (38) справедливы при всех т. Последовательно применяя ик, получим неравенство , (хчм> а) < Км о (хЧо> Так как К < 1, то при т -+ со Км -+ 0 и 1пп р(хЧм>, и)=0, РИ» 7 (39) (40) 7>= М'7.3 е < 1 (41) что и доказывает сходимость процесса итераций к решению си. стемы (24). На начальное приближение х>в> накладывается условие, что оно должно принадлежать окрестности р(х, з) <6, в которой имеет место неравенство (37). При более жестких ограничениях на функции 7>(х>, х, ..., х ) можно доказать более сильную теорему, доказательство которой можно найти в статье Л.
В. Канторовича «Функциональнь>й анализ и прикладная магематика» (УМН, т. 3, вып. б, 1948): Теорема. Если в области >е функции г>(х>, х,, ..., х„) имеют вторме производные, не превосходящие по абсолютной величине числа 7., в точке хчв> ~ 6 матрица 7 (х) не вмроо>едена и выполнено условие 158 гвшинив ллгеввличиских и тглнснвндвнтных гвлвниний [гл.
7 где ~ 7 (х!ь) хш! х!ь!) ! ( ", (1 — 1 2 и) и (42) /|,Ун'(хь)!)! = шах ~', !8ь~(х'ь!) ) ( М, ! г= ! 1 то сисьпеми (24) имеет решение х=и, которое находится в области 1 †)'1 — 2А х<й ~~ шак ! х,— х!о! ! ( 3 (43) в и может бать получено кик предел последовательности х!ы! = х!ы-и — 7. ь(х!ы-и) 7( ьы-н) (28,' и быстрота сходимости оценивается неривенством !) х!ы! — и)~ ( — (27ь)гы-ьь. (44) Векторное равенство (28) эквивалентно системе линейных алгебраических уравнений д, Е( <ив <ы-ь!) 1, ь1 е- ! (! = 1, 2, ..., л). (45) хь=фь(хь, хг ...
х„) = х — ~ь и .(х(й х1!ь х1~!) )( ! )( 7е(х,, х,, ..., х„) (1=1, 2, ..., и). (46) или в векторной записи х = 7 (х) = — х —,1* (х'") 7 (х), (46') где х<ь! достаточно близок к решению и системы (24), а следовательно и (46), которую также решают методом итераций, описанным в п. 1. Вычисление последовательных приближений с помощью равенства (28) или путем решения системы (45) связано с большой вычислительной работой, так как на каждом шаге нужно решать систему со своей матрицей или на каждом шаге находить матрицу У„(х("'!). В связи с этим вместо рассмотренного метода решения сисчемы (24), который носит название метода Ньютона, иногда применяют следующий более простой метод. Вместо системы (27) рассматривают систему 159 $ 51 РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ От функций Л(х,, ха,..., х„) будем требовать выполнения тех же условий, которые накладывались в начале этого пункта.
Используя (32), можно записать: Ф(х) Ф (У) = х У /т (Ачо>) 1/(х) — / (У)) = Я У /х '(х>о>) Х Х /'(а, у)(х — у) =!/ —,/, '(х>'>) Р(г, у)! (г — у). (47) Если у и я близки к х>з>, то матрица >".(г, у) близка к матрице (х>е>), а / — /'. (х>з>) гт(х, У) близка к нулевой матрице, т. е.
для некоторого К< 1 можно найти такое г ) О, что при р(у, хы>) = = >>у — х~" >» <г и р(г, АЧ'>)<г будет иметь место неравенство Р—./ ( ~>)~(.. У)!1><К, (46) а из (47) ~$9(г) — Ф(УИ!> < й/ ./ (хз»)/' (я. У)й> йх — у!~> <К 3у — х~~> (49) т. е. будет иметь место условие Липшица с константой К < 1.
Далее, из (46') ~~ф(хчо>) хчо>~~> < )~/ь, (х>о>)~~ )(/(х>9))~ (50) и выбирая хы> достаточно близким к а1р(х>'>, а) <г], можно добиться выполнения неравенства >>,>,( ~о>) ~о>>> <(! К) . (51) а выполнение неравенств (49) и (51), как это было показано в и.
1, гарантирует, что в окрестности р(х, хм>) = >>х — х>е>>>> < г существует единственное решение системы (46'), которое может быть получено как предел последовательности х~"'>=ф(х> -'>)= — х! -'> —,/ '(х>'>)/ (х> -и) (п>=2, 3, ... ), (52) где за начальное приближение хн> можно взять любую точку указанной окрестности. Но этим решением и будет х= и, т. е. !нп АЧ"и = а, (53) и сходнмость метода доказана. В цитированной выше статье Л. В. Канторовича показано, что в условиях теоремы, которую мы приводили выше, быстрота сходимости последовательности х<"'> к п определяется неравенством ))хнн> — а))> (>/ ->!)Ач» — а))> (>7= 1 — ')> ! — 2Ь < 1). (54) Этот процесс, который можно рассматривать как видоизменение метода Ньютона, хотя сходится и медленней, чем процесс Ньютона, 160 яишенке ллгизвлических и тплнсцвндянтных твлвнений (гл.
7 имеет то преимущество, что последовательные приближения по (52) находятся значительно проще, так как достаточно один раз найти матрицу 7 '(хзз). Хотя мы и обосновали теоретически сходимость метода Ньютона и его видоизменения, при их фактическом применении неизбежные в процессе счета ошибки округления все же могут привести к тому, что решение с заданной наперед точностью не удастся. Вопросы влияния ошибок округления на точность результата в общем случае еще не изучены.
Прим ер. Уточнить по методу Ньютона приближенные значения решения хе=0,4, уз= 0,9 системы 7,(х, у) = — 4хе+у'-) — 2ху — у — 2= О, 7,(х, у) = 2х'+Зху+у' — 3= 0. Для этого будем последовательно решать системы: г .7~я(х~~ г ущ-г) Ьхт-~+Лл(х~р — н ут — г) ~ум — г = Л(лт-г уч~-г) / / У,„(х„,.У,) Ьх„,+Ля(х о У ) ЬУ г = — Л(х,, У ). где 7,„= 8х+ 2У, 7ш — — 2х+ 2у — 1, 7ат = 4х+ Зу, Лл — — Зх+2у; г ,7,(хо, уо) = — 0.73. 7ш(хо уо) = 5,0, Лд(хо, уо) =1,6, 7,(х,. Уе) = — 0,79.
7а (х,, у,) = 4.3, 7щ(х,. У,) = З,О; 5,Омахе+ 1,65уо = 0,73, 4,35х„+З,ОЬУ =0,79; Ьх,= 0,114, х, = хе+Ьхе= 0,514„ Ьу = 0,100, у, =у, +Ьу = 1,000; 7,(хо у,)=0,084784, Д (х,,у,)= 6,112, Д„(хо уг)=2,028, 7а(хн у,) =0,070392, 75 (хну) = 5,056, Л;,(хо у,)=3,542; 6,1125хг+ 2,0285уг = — 0,084784, 5,056йхг + 3,5425уг = — 0,70392; Ьх, = — 0,013826, ха = 0,500174, Ьуг = 0 000138 уа = 0 999862' 161 $5] вешания систем ягавнвний )г)(ха, Уз) = 0,000768, Лх(ха,Уа) = 6001116, У)я(хз,Уа)=2000072, Уа (хз, у ) = 0 000387.
Узм (хз, уз) = 5 000282, узя (ха у ) = 3 500246; 6,001116 Ьхз+ 2,000072 Ьу! = — 0,000768, 5,000282 Ьхз+ 3,500246 Ьуз = — 0,000387; Ьха = — 0,000174, хз — — 0.500000, Ьуа = 0,000138. уз = 1,000000; ,) ! (х,, у,) = О, г'з (х,, у,) = О. Таким образом, мы получили точное решение. 8. Метод скорейшего спуска. Кратко остановимся на методе скорейшего спуска. В этом методе решение системы (24) сводится к задаче отыскания минимумов функции Ф (х,, хз, ..., х„), которую можно построить различными способами, положив, например, ч Ф(х,.
ха, ..., х„) = ~~'„У',. (х„хз, .... х„). (55) <-! или ч Ф(х,, х,, ..., х„)= ~~~~ а<дУ<(х,, х,, ..., х„)Уд(х„х„..., х„), <,! 1 (56) где а<д — элементы некоторой положительно определенной матрицы. Если а=(а), аз, ..., а„) есть некоторое решение системы (24), то )<(я)=0 (<=1, 2, ..., и) и Ф(в)=0.
В других точках х Ф(х) О. Таким образом, каждый нулевой минимум функции Ф(х) даст решение системы (24) и отыскание решений системы (24) сводится к отысканию нулевых минимумов вспомогательной функции Ф(х). Метод скорейшего спуска отыскания последних заключается в следующем. Если известно примерное расположение нулевого минимума, то выбираем вектор х<о) =(х<<~, ..., х~„~), близкий <о) <о) д4) (х(о)) к э, вычисляем производные и в направлении вектора дх< Фх (х(о)) ага<1 Ф (х<о)) г аф (.Р)) аэ (.Р)) дх! ' дхз проводим прямую х — х<о) ),Ф (х(о)), (58) проходящую через точку х<о) в направлении вектора Ф (х<о)), ортогонального к поверхности Ф(х)=Ф(х<о)).
Определяем )о и х<!) = =х<о) — Аофх(х<о)) из условия минимума функции ф ()) ф(.<о) )!Ф (.<о))) 162 гвшвнив ллгвввличвских и тглнсцвндвнтных гвлвнвпий (гл. 7 из х~п и двигаясь снова на прямой Если Ф (хгп) Ф О, то продолжаем процесс, исходя в направлении вектора втаб Ф (хьч) = Ф (х'и), и х = хгн — ЛФ (х<п) отыскиваем точку, в которой ф, (Л) = Ф (хги — ЛФ„(хсн) ) приближение х<"1, имеет минимальное значение. Если уже найдено 7з-е то Ла находим из условия минимума функции ф„(Л) = Ф( ы — ЛФ. (хро)) и полагаем (59) (60) Хфэо — Хйя ЛЬФк (Хйд) На каждом шаге придется решать уравнение ф',(Л)=О (61) где 1, — вектор в направлении 1-й координатной оси.