Приложение О Дифференциальное исчисление векторов и матриц
П.15. Дифференциальное исчисление векторов и матриц
Производные функций векторов и матриц
Пусть u=f(x) - функция переменных вектора хT=[x1, x2,..., xр] и ∂u/∂x1, ∂u/∂x2,..., ∂u/∂xр - частные производные её по этим переменным. Определим ∂u/∂х в виде
=
(П.15.1)
Представляющие интерес две специфические функции следующие: u1=aТx и u2=xТAx. Их производные по вектору х приведены в следующих двух теоремах.
Теорема П.15.1. Пусть u1=aТx=xТa, где aТ= [а1, а2,..., ар] - вектор постоянных. Тогда
=
=
=а. (П.15.2)
Доказательство:
=
=ai.
Рекомендуемые материалы
Таким образом, в силу (П.15.1), получаем
=
=а.
□
Теорема П.15.2. Пусть u2=xTAx, где А - симметричная матрица постоянных. Тогда
=
=2Ax. (П.15.3)
Доказательство: Покажем, что выражение (П.15.3) справедливо для частного случая, где А размеров 3х3. Этот пример можно обобщить для симметричной матрицы А любых размеров. Пусть
х= и А=
=
.
Тогда xTAx=x12a11+2x1x2a12+2x1x3a13+x22a22+2x2x3a23+x32a33 и имеем
=2x1a11+2x2a12+2x3a13=2а1сx
=2x1a12+2x2a22+2x3a23=2а2сx
=2x1a13+2x2a23+2x3a33=2а3сx.
Таким образом, в силу (П.2.3), (П.2.19) и (П.15.1), получаем
=
=2
=2Ax.
□
Пусть теперь U=f(X) - функция переменных x11, x12,..., xpp, являющихся элементами матрицы X=Хрр, и ∂U/∂x11, ∂U/∂x12,..., ∂U/∂xрр - частные производные её по этим переменным. Аналогично выражению (П.15.1), определим ∂U/∂Х в виде
=
. (П.15.4)
Представляющими интерес двумя функциями этого типа являются U1=след(XA) и U2=ln[det(X)] для положительно определённой матрицы X.
Теорема П.15.3. Пусть U1=след(XA), где X=Хрр - положительно определённая матрица переменных и A=Арр - матрица постоянных значений. Тогда,
=
=A+AT–диагA. (П.15.5)
Доказательство: Заметим, что след(XA)= [см. доказательство пункта 2 теоремы П.11]. Так как xij=xji, то ∂[след(XA)]/∂xij=аij+аji, если i≠j, и ∂[след(XA)]/∂xii=аii. Результат следует.
□
Теорема П.15.4. Пусть U2=ln[det(X)], где матрица X=Хрр положительно определенная. Тогда,
=2X–1–диаг(X–1). (П.15.6)
Доказательство: см. [Harville (2008) стр.310].
□
Производные обратных матриц и определителей
Пусть матрица А=Аnn невырожденная с элементами аij, являющимися функциями скалярной переменной х. Определим ∂A/∂x как матрицу размеров nхn с элементами ∂аij/∂x. Часто представляет интерес производная от обратной матрицы ∂A–1/∂x. Кроме этого, если матрица А положительно определённая, то производная ∂{log[det(А)]}/∂x также часто бывает необходима.
Теорема П.15.5. Пусть матрица A невырожденная порядка n с производной ∂A/∂x. Тогда,
∂A–1/∂x=–A–1(∂A/∂x)A–1 (П.15.7)
Доказательство: Так как матрица А невырожденная, то имеем
A–1A=I.
Производная этого выражения получается в виде
A+A–1
=O.
Отсюда
A= –A–1
,
и, умножая последнее выражение справа на A–1, получаем
∂A–1/∂x=–A–1(∂A/∂x)A–1.
□
Теорема П.15.6. Пусть матрица А=Аnn положительно определённая. Тогда,
=след(A–1
). (П.15.8)
Доказательство: Так как матрица А положительно определённая, то её спектральное разложение (по теореме П.12.4) можно записать в виде MLMТ, где M - ортогональная матрица и L - диагональная матрица с диагональю из положительных собственных значений li. Применяя теорему П.12.5, получаем
=
=
=
=след(L–1).
Теперь
A–1=ML–1MТ
=ML–1MТ
=ML–1MТ
=.
Применяя пункты 1 и 2 теоремы П.11, имеем
след(A–1)=след(
).
Так как M ортогональная, то MТM=I. Отсюда следует, что
=О
и
след()=след(
)=0.
Таким образом, след(A–1)=след(
) и результат следует.
□
Нахождение максимума или минимума функции вектора
Рассмотрим функцию u=f(х) от р переменных вектора х. Во многих случаях можно найти максимум или минимум функции u, решая систему р уравнений
=0. (П.15.9)
14.1. Физическое моделирование - лекция, которая пользуется популярностью у тех, кто читал эту лекцию.
Иногда требуется определить максимум или минимум функции u при q ограничениях на переменные вектора х. Обозначим ограничения в виде h1(x)=0, h2(х)=0,…, hq(х)=0 или более кратко h(х)=0. Нахождение максимума или минимума функции u при ограничениях h(х)=0 часто может осуществляться методом множителей Лагранжа. Обозначим l - вектор q неизвестных постоянных (множителей Лагранжа) и пусть уТ=[хТ, lТ]. Тогда функция Лагранжа v=u+lТh(х). Максимум или минимум функции u, при ограничениях h(х)=0, получается решением системы уравнений
=0
или, равносильно, решением уравнений
+
l=0 и h(х)=0 (П.15.10)
где
=
.