Математический анализ. Конспект лекций_Воронина Б.Б_2007 -160с (530591), страница 13
Текст из файла (страница 13)
е.∂lΔz∂zlim.=Δl → 0 Δl∂lПредположим теперь, что функция f (M) дифференцируемав точке M. Тогда ее приращение в этой точке вдоль прямой Lможно записать в виде:Определение 1. Предел отношенияΔz = f x′ ( x, y )Δx + f y′ ( x, y )Δy + α1(Δx, Δy )Δx + β1(Δx, Δy )Δy,где α 1 и β 1 — бесконечно малые функции при Δl → 0.Разделив обе части равенства на Δl и учитывая, что Δx = Δl cosα,Δy = Δl sin α = Δl cos β . Переходя к пределу в этом равенстве приΔl → 0, получаем формулу для производной по направлению:∂z ∂z∂z=cos α + cos β .∂l ∂x∂y(1)Из формулы (1) следует, что производная по направлению является линейной комбинацией частных производных, причем на91правляющие косинусы являются как бы весовыми множителями,показывающими вклад в производную по направлению соответствующей частной производной.Определение 2. Градиентом функции z = f(x, y), в точке M(x, y)называется вектор, координаты которого равны соответствующим∂z∂zчастным производными, взятым в точке M(x, y).∂y∂xОбозначение:⎧ ∂z ∂z ⎫grad z = ⎨ , ⎬.⎩ ∂x ∂y ⎭Используя понятие градиента функции и учитывая, что вектор l имеет координаты cosα и cosβ, представим формулу (1)в виде скалярного произведения векторов grad z и l :∂z ∂z∂z=cos α + cos β = grad zl .∂l ∂x∂y(2)С другой стороны, по определению скалярного произведенияимеемgrad z × l = grad z × l cos ϕ ,(3)где |grad z| — длина вектора grad z;ϕ — угол между векторами grad z и l .Сравнивая формулы (2) и (3) и учитывая, что | l | = 1, получаем∂z= grad z cos ϕ .∂lИз последнего равенства следует, что производная функциипо направлению имеет наибольшую величину при cos ϕ = 1 ( ϕ = 0),т.
е. когда направление вектора l совпадает с направлением grad z.∂zПри этом= grad z .∂lТаким образом, градиент функции z = f (M) в точке M(x, y) характеризует направление и величину максимальной скоростивозрастания этой функции в данной точке.92Аналогично определяется производная по направлению длятрех переменных u = f (x, y, z), выводится формула:∂u∂u∂u∂u=cos α +cos β +cos γ ,∂l∂x∂y∂zвводится понятие градиента⎧ ∂u ∂u ∂u ⎫grad u = ⎨ ,, ⎬.⎩ ∂x ∂y ∂z ⎭6.
Частные производныеи дифференциалы высших порядковПусть частные производные f x′ ( x, y ) и f y′ ( x , y ) функцииz = f(M), определенной в окрестности точки M, существуют в каждой точке этой окрестности. В этом случае частные производныепредставляют собой функции двух переменных x и y, определенные в указанной окрестности точки M. Назовем их частными производными первого порядка.В свою очередь, частные производные по переменным x и y отфункций f x′ ( x, y ) и f y′ ( x , y ) в точке M, если они существуют, называются частными производными второго порядка от функции z = f(M)в этой точке и обозначаются следующими символами:∂ 2z∂x 22∂ z∂y 2′′ ( x, y ) = f (22 )( x, y );= f xx∂ 2z′′ ( x, y ) = f yx(2 )( x, y );= f yx∂y∂x′′ ( x, y ) = f (22 )( x, y );= f yy∂2z′′ ( x , y ) = f xy(2 )( x , y ).= f xy∂x∂yxyЧастная производная высшего порядка, взятая по различнымпеременным, называется смешанной частной производной, например,∂2z ∂2z∂ 3z,, 2.∂x∂y ∂y∂x ∂ x∂yТеорема (о равенстве смешанных производных).
Если производ′′ ( x, y ) и f yx′′ ( x, y ) существуют в некоторой δ окрестностиные f xy93точки М(x, y) и непрерывны в самой точке M, то они равны между собой в этой точке, т. е. имеет место равенство′′ ( x , y ) = f yx′′ ( x , y ).f xyДоказательство. Рассмотрим выражениеA = [ f ( x + Δx, y + Δy ) − f ( x + Δx, y )] − [ f ( x, y + Δy ) − f ( x, y )],где Δ x и Δ y — любые столь малые числа, что точка M1(x + Δ x, y ++ Δ y) находится в указанной δ окрестности точки M.Введем вспомогательную функциюϕ ( x ) = f ( x, y + Δy ) − f ( x, y ),тогда выражение A можно рассматривать как приращение дифференцируемой на отрезке [x, x + Δx] функции ϕ (x) одной переменной x:A = Δϕ = ϕ ( x + Δx ) − ϕ ( x ).Поэтому, применяя к этой разности теорему Лагранжа, запишем:A = Δϕ = ϕ ′( x + θ1Δx )Δx = [ f x′ ( x + θ1Δx, y + Δy ) −− f x′ ( x + θ1Δx, y )]Δx, 0 < θ1 < 1.Выражение в квадратных скобках можно рассматривать какприращение дифференцируемой на отрезке [y, y + Δy] функцииодной переменной y.
Применяя еще раз теорему Лагранжа по переменной y, получаем′′ ( x + θ1Δx, y + θ 2Δy )ΔxΔy, 0 < θ1,θ 2 < 1A = f yxС другой стороны, если ввести вспомогательную функциюψ ( y ) = f ( x + Δx, y ) − f ( x, y ),94(1)то, поступая аналогично, получимA = Δψ = ψ ( y + Δy ) − ψ ( y ),а затем′′ ( x + θ 4 Δx, y + θ3Δy )ΔyΔx, 0 < θ3,θ 4 < 1.A = f xy(2)Сравнивая (1) и (2), получаем:′′ ( x + θ1Δx , y + θ 2 Δy )ΔxΔy = f xy′′ ( x + θ 4 Δx, y + θ 3 Δy )ΔyΔx .f yxПереходя теперь в этом равенстве к пределу при Δx → 0 и Δy → 0′′ ( x, y )и учитывая непрерывность частных производных f xy′′ ( x, y ) в точке M, получим:и f yx′′ ( x + θ1Δx, y + θ2 Δy )ΔxΔy =lim f yxΔx → 0Δy → 0′′ ( x + θ 4 Δx, y + θ3Δy )ΔyΔx= lim = f xyΔx → 0Δy → 0или′′ ( x, y ) = f yx′′ ( x, y ).f xyТеорема доказана полностью.Дифференциалы высших порядковdz = f x′ ( x, y )dx + f y′ ( x, y )dy(3)будем называть дифференциалом первого порядка.
Для удобстваусловимся обозначать дифференциалы не только символом d, нои символом δ .Пусть функции f x′ ( x, y ) и f y′ ( x , y ) дифференцируемы в точкеM. Будем рассматривать dx и dy в выражении для dz как постоянные множители. Тогда функция dz представляет собой функцию95только переменных x и y, дифференцируемую в точке M, и еедифференциал имеет вид:δ (dz ) = δ [ f x′ ( x, y )dx + f y′ ( x, y )dy ] = [ f x′ ( x, y )dx + f y′ ( x, y )dy ]′x δx ++[ f x′ ( x, y )dx + f y′ ( x, y )dy ]′y δy.(4)Дифференциал δ (dz ) от дифференциала dz в точке M, взятыйпри δx = dx , δy = dy , называется дифференциалом второго порядка функции z = f(M) в точке M и обозначается d 2z.
В свою очередь,дифференциал δ (d 2 z ) от d2z, взятый при δx = dx , δy = dy , называется дифференциалом третьего порядка функции z = f(M) в точкеM и обозначается d3z и т. д. Дифференциал δ (d n −1z ) от дифференциала d n −1z , взятый при δx = dx , δy = dy , называется дифференциалом nго порядка функции z = f(M) и обозначается dnz.Итак, для дифференциала nго порядка функции z = f(M)nn −1справедлива формула: d z = δ (d z ) |δx =dx .δy = dyПри нахождении второго и последующих дифференциаловобычно вычисление δ (dz ) и приравнивание дифференциалов аргументов ( δx = dx , δy = dy ) производится одновременно.С помощью формулы (4) найдем выражение для дифференциала второго порядка:d 2z = δ (d n −1z ) |δx =dx = ( f x′dx + f y′dy )′x dx + ( f x′dx + f y′dy )′y dy =δy = dy′′ (dx )2 + f xy′′ dxdy + f yx′′ dydx + f yy′′ (dy )2 .= f xx′′ ( x, y ) и f yx′′ ( x, y ) непрерывны, то согласно теореме о раЕсли f xy′′ dydx′′ dxdy и f yxвенстве смешанных производных слагаемые f xyравны, так что′′ (dx )2 + 2 f xy′′ dxdy + f yy′′ (dy )2 .d 2 z = f xxАналогично,′′′ (dx )3 + 3 f xxy′′′ (dx )2 dy + 3 f xyy′′′ dx (dy )2 + f yyy′′′ (dy )3,d 3z = f xxx96…nd z =f (nn ) (dx )nx+ nf (nn−)1 (dx )n −1dy + … +xyn(n − 1)...(n − k + 1) (n)+f n − k k (dx )n −k (dy )k + ...
+ f (nn) (dy )n .xyyk!Формула для dnz напоминает разложение двучлена в nй степени по формуле Ньютона. Поэтому выражение для dnz символически можно записать в виде, более удобном для запоминания:n⎞⎛ ∂∂d n z = ⎜⎜dx +dy ⎟⎟ f ( x, y ).xy∂∂⎠⎝7. Формула Тейлора для функции двух переменныхТеорема. Пусть функция z = f (M) непрерывна вместе со всемичастными производными до (n+1)го порядка включительнов некоторой δ окрестности точки M(x, y). Пусть точкаM 1( x + Δx, y + Δy ) принадлежит этой окрестности. Тогда приращение Δ f = f (M1) – f (M) этой функции в точке M можно представить в следующей форме:Δf = df ( x, y ) ++d 2 f ( x, y )d n f ( x, y )+ ... ++n!2!d n +1 f ( x + θΔx, y + θΔy ), 0 < θ < 1.(n + 1)!(1)Формула (1) называется формулой Тейлора для функции z = f(M).Доказательство. Для доказательства введем вспомогательнуюфункцию F(t) = (x + t Δ x, y + t Δ y), которая является сложнойфункцией независимой переменной t, изменяющейся в пределахот 0 до 1, и имеет (n + 1)ю производную по t на отрезке.Дифференцируя функцию F(f ) по t, получаемF ′(t ) = f x′ ( x + tΔx, y + tΔy )Δx + f y′ ( x + tΔx, y + tΔy )Δy =⎞⎛ ∂∂= ⎜⎜Δx +Δy ⎟⎟ f ( x + tΔx, y + tΔy ),∂y⎠⎝ ∂x97′′ ( x + tΔx , y + tΔy )(Δx )2 + 2 f xy′′ ( x + tΔx, y + tΔy )ΔxΔy +F ′′(t ) = f xx2⎛ ∂⎞∂′′ ( x + tΔx, y + tΔy )( Δy )2 = ⎜⎜+ f yyΔx +Δy ⎟⎟ f ( x +∂y⎝ ∂x⎠+ tΔx, y + tΔy )По индукции найдем:n⎛ ∂⎞∂F (n) (t ) = ⎜⎜ Δx +Δy ⎟⎟ f ( x + tΔx, y + tΔy ),∂x∂y⎝⎠⎞⎛ ∂∂F (n +1) (t ) = ⎜⎜Δx +Δy ⎟⎟xy∂∂⎠⎝n +1f ( x + tΔx , y + tΔy ).С другой стороны, применяя к функции F(f ), как функции одной переменной t, формулу Маклорена и полагая t = 1, получаемF (1) = F (0) ++F ′(0) F ′′(0)F (n ) (0)++ ...
++n!1!2!F (n +1) (θ ), 0 < θ < 1.(n + 1)!НоF (1) = f ( x + Δx, y + Δy ) = f (M 1 ),F (0) = f ( x , y ) = f (M ),⎛ ∂⎞∂F ′(0) = ⎜⎜Δx +Δy ⎟⎟ f ( x, y ) = df ( x, y ),∂x∂y⎝⎠2⎛ ∂⎞∂F ′′(0) = ⎜⎜Δx +Δy ⎟⎟ f ( x , y ) = d 2 f ( x, y ),∂x∂y⎝⎠…n⎛ ∂⎞∂F (n ) (0) = ⎜⎜Δx +Δy ⎟⎟ f ( x, y ) = d n f ( x , y ),∂y⎝ ∂x⎠98(2)n +1⎛ ∂⎞∂F (n + 1) (θ ) = ⎜⎜Δx +Δy ⎟⎟∂y⎝ ∂x⎠f ( x + θΔx, y + θΔy ) == d n + 1 f ( x + θΔx, y + θΔy ).Учитывая эти равенства, из формулы (2) имеемF (1) − F (0) = f (M 1) − f (M ) = Δf = df ( x, y ) ++d 2 f ( x, y )+ ...
+2!d n f ( x, y ) d n + 1 f ( x + θΔx, y + θΔy ), 0 < θ < 1,+n!(n + 1)!т. е. получена формула (1).8. Необходимые и достаточные условиясуществования локального экстремумаПусть функция z = f (x, y) определена в некоторой окрестноститочки M0(x0, y0).Определение.
Говорят, что функция z = f (x, y) имеет в точке M0локальный максимум (минимум), если существует такая окрестность точки M0, в которой для любой точки M(x, y) выполняетсянеравенство:f (x, y) < f (x0, y0), f (x, y) > f (x0, y0).Точки локального максимума и локального минимума называются точками локального экстремума. Из определения следует,что если функция z = f (x, y) имеет экстремум в точке M0, то полное приращение этой функции в точке M0 удовлетворяет в некоторой окрестности точки одному из следующих условий:Δ z < 0— в случае локального максимума,Δ z > 0— в случае локального минимума.И, наоборот, если в некоторой окрестности точки M0 выполняется одно из этих неравенств, то функция имеет экстремумв точке M0.Теорема (необходимое условие экстремума).
Если функцияz = f(x, y) имеет в точке M0(x0, y0) экстремум и имеет в точке M099частные производные первого порядка, то в этой точке частныепроизводные первого порядка равны нулю, т. е.f x′ (x0 , y0 )= f y′ ( x0 , y0 ) = 0.(1)Доказательство. Докажем, например, равенство нулю частнойпроизводной f x′ ( x0 , y0 ) , Для этого рассмотрим в окрестности точки M0 только те точки, для которых y = y0. Полученная функцияодной переменной x имеет в точке x = x0 производную f x′ ( x0 , y0 ).Следовательно, в этой точке выполняется необходимое условиеэкстремума функции одной переменной:f x′ ( x0 , y0 ) = 0,что и требовалось доказать.Аналогично, рассматривая функцию f(x0, y) одной переменной y, находим f y′ ( x0 , y0 ) = 0 .Теорема доказана.Теорема (достаточные условия экстремума). Пусть в точкеM0(x0, y0) возможного экстремума и некоторой ее окрестностифункция f(x, y) имеет непрерывные частные производные второго порядка.