В.И.Тихонов Статистическая радиотехника (2-е издание, 1982) (1092037), страница 11
Текст из файла (страница 11)
Отметим, что кумулянты нееовпадают е центральными мо. 55 Видно, что первый кумулянт х, совпадает е математичеаким ожиданием т1, второй х2 — в диепереией Р, Не оетанавливаяеь на значении других кумулянтов более выеокого порядка, укажем> что отно- шения ментами. Как видно из (51), расхождение между ними начинает проявляться в ме. Итак, моменты однозначно выражаются через кумулянты. При определенных условиях по моментам или кумулянтам можно воснтановить характериатичепкую функцию и, следовательно, плотность вероятности. Позтому как моменты, так и кумуляиты можно использовать для описания случайных величин*.
Соотношения между различ- Рис. 1.9. Соотношения между функцией распределения (плотностью вероятности), характеристической функцией, моментами и кумулянтами ными характеристиками случайной величины наглядно'показаны на рис. 1.9. Приведенные выше результаты и, в частности, определения моментов и кумулянтов можно обобщить на совокупность нескольких случайных величин $ы 5„..., $„, описываемых функциями распределения (1.2.26), плотностями вероятности (1.2.27) или характеристическими функциялеи (1.2.35). Соед1естные начальные моменты пт „т„,,„ ль,,, ... „случайных величин 5ы $„..., $„определяются как математические ожидания соответствующих произведений.
*Укажем, что можно ввезти квазимоменты каи козффицненты разложения плотности вероятности в ряд по поляномвм Эрмита (ом. с. 2831. Квазимомеиты однозначно связаны е моментами н кумуляитамн, и ии в равной мере можно применять для описания случвйныи величин. т„, = М Я; ) = ~ х', р! (хл) 0х„ . - м !!! !! !-11 ! ч р, (~, а) а, а (1.3,54) т„„, =М($;* $; ...$„') = = ( ... ( х",* ... х'„~ р„(х„..., х„) е(хл ...
!(х„, Аналогично формуле (45) совместные моменты можно определить как коэффициенты разложения в кратный степенной ряд совместной характеристической функции (1.2.35)! и и в„(!о, ..., !а !=и~~.!! т !.е,~- —, !' т !.!е.ь„-~ !л ! и. =! и и +з 1' Ж '~ ~~""+- ='+)2й (') "+ р,ч,л=! з=! л + —, Р "~~ М($а$.) д й + жч=! + — 1' ~'„М($„$ 5л)йзй ()л+' = 1 .з 31 и,лл=! У "'"-'.
()йл) ()й,)" ... (15,,)'., (1.3.55) 07!1 У21 *'~п1 и где ч,+м,+ ..+ч дат д Зм,...даГа Х !й„(1ом ..., )о„)1 Лд,-с.-'...=Е, (1.3.57) 57 где т! (1 ( ! ( и) — неотрицательные целые числа. Момент т „,...,„, относящийся к и различным случайным вели чинам $„$„..., $, называется п-мерным моментом (тл+ те+ ... + + т„)-го порядка. Так, т„— одномерный момент ч,-го порядка, т„...
— двумерный момент(т, + т,)-го порядка и т. д. Вместо начальных моментов можно рассматривать центральные моменты, которые определяются формулой )л„... = М ((Зл — тм)'* ... ($ — тз )"') = ) ... ) (хл — ть)' ... (х„— — тл )'" р„(хл, ..., х„) !(хл ... !(х„, тл, М (з!). (1.3.55) Аналогично многомерным моментам можно ввезти многомерные кумулянпяя и„ч, ...,„.
Они определяютоя путем разложения в кратный степенной ряд не самой характериатичеокой функпии (1.2.35), а ее логарифма: (1,3 58) (1.3.59) яч ч ч„...,ч О я )ч~ (16 )ч, (16 )чо где хч,, =( — 1)"' "+-' ~ОХ дч~+ ч +-'+ч„ х 1п Ф„(10м ..., 10„) дач~ дЖ...дзчо 1 о'" о О1 Оа ††... Оо О Между многомерными моментами и кумулянтами существуют связи, подобные (51) и (52) [9, 10[.
В чазтности, гп» вЂ” — им + к„им, (1.3.60) пош = иш + о«оо»о«мо + ко»ои»о» + м»оо иом + и»оо ио»о о«оои Нетрудно убедитьея, что при $, = $о $» зти формулы переходят в еоответетвующие формулы (52). Основываяеь на условных плотностях вероятностей (1.2.41) и (1.2.70), можно ввести условные моменты и кумулянты. Они определяютея формулами, аналогичными (11), (12), (54), (55) и (59), только теперь в них нужно подставлять условные плотности вероятности (1.2.41) и (1.2.70) и условные характериетичеекие функции.
Еатевтвеино, что уеловные моменты и кумулянты будут завиоеть от тех условий («правых» переменных), которые входят в соответствующие уеловные плотности вероятности и условные характериатичеакие функции. В дальнейшем будут часто использоватьоя условное математическое ожидание и условная дисперсия для уаяовных вероятноетей вида (1.2.71) ° т.е. для одной случайной величины при фиксированных оатальных.
Они определяютея соответственно формулами М($» [хо ы ..., х») ~ х„р (х„[хо-ь -., х,) дх„, (1.3.61) 0 ($„[х, ы ..., х») = М ([з„— М (я„[ х„м ..., х,)1») = [х„— М ($„[хо ы ..., х»)[о Р (х„[х,-ь ...х,) дх„. (1.3.62) Поскольку многомерные моменты и кумулянты определяются как коэффициенты разложения д степенной ряд еоответетвующих характеристических функций или их логарифмов, то, как и в одномерном случае, первые коэффициенты разложений при извеетных условиях являются наиболее важными и сущеетвенными. Расамотрим, например, двумерный случай. 58 Пусть нас интересует математическое ожидание функции ~р (х„х,) двух случайных величин $з и $».' М (<р ($„~»)) ~ ~ <р (хм хз) р, (х„хз) дх, з(хз.
(1.3.63) Разложение «гладкой» функции зр (хз, хз) в ряд Тейлора в окрестности точки (т„т,) имеет вид <у (х„хД =у(т„тз)+ — (х,— тз)+ — (хз — т,)+ ... д<р дч дхз дхз Если двумерная плотность вероятности р, (хз, х,) сконцентрирована около точки (тз,т,) и изменяется плавно в окрестности этой точки порядка ЯР», ~~Р»), то в написанном разложении можно ограничиться учетом лишь низших членов до квадратичных включительно. Примем, что т, и т, есть математические ожидания случайных величин сз и $з, а Р, и Р, — дисперсии этих величин. Подставив раз.
ложение функции чз (х„х,) в (63), получим М (Ч> Яз $»)) ~р (тн тз)+ - ~Р» —, + 2рзз +Рз — 1 ° 1 Г дзя дзя дзэт 2 1 дх,' дхз дхз д»1 (1.3.64) Им М ((»з тз) (»з тз)) где ) (х, — т,) (х, — т,) р, (х„ х,) Их, (хз, (1.3.65) Смешанный центральный момент второго порядка (ззз называетая корреляционним моментом. Выражение (64) иллюстрирует особо важную роль низших моментов (в частности, математических ожиданий, дисперсий и смешанного центрального момента второго порядка).
Покажем роль этих характеристик двух случайных величин, исходя из другого подхода. Предположим, что требуется найти наилучшую оценку (или предсказанное значение) Зз для случайной величины 5» в виде некоторой функции зз = я (з,) от случайной величины $о причем в качестве критерия оптимальности оценки по-прежнему примем минимум среднего квадрата ошибки: а' = М ((яз†(с)') = М ((з — а (яз))з) = ) (хз — д (хз)!' р, (х„х,) з(хз з(хз. (1.3.66) Докажем, что наилучшей оценкой по минимуму среднего квадрата ошибки является условное математическое ожидание $з при фиксированном значении $»: 5з = а %) = М ($з ! Ы (1.3.67) 59 Совместную плотность вероятноати ваегда можно представить в виде произведения р, (х„х,) = р (х, ] хг) р (х,).
Поэтому М ([з,— д($,))'] = [ р(х,) ~ [х,— д(х,))'р(х,]х„) йх., йх„. Здесь подынтегральное выражение неотрицательно. Чтобы минимизировать двойной интеграл, достаточно минимизировать при каждом хт внутренний интеграл[х,— д (х,Ц' р (хе ] х,) йхь Для любого фиксированного значения х1 функция д (х,) является постоянной величиной. При этом из (43) и (44) следует, что написанный интеграл имеет минимальное значение, когда и (х1) = ] хз р (хз ] х1) йхз = М (зз [ х1]. Это равенотводолжио выполнятьея при любом возможном значении х,, что и доказывает формулу (67). Зависимость д (хг) = М Я, ] х ) называется кривой регрессии $, на $,. Фактическое вычисление оценки М ($, [ $,) по совмеотной плотности вероятноати р, (х„х,) во многих практических случаях оказывается веаьма влажным, поэтому часто ограничиваются отысканием линейных оценок для $, в виде линейной функции $, = й($,) = а+ Ь$ь (1.3.68) Естественно, что при этом ошибка во многих случаях может оказаться больше, чем при нелинейной оценке.
Итак, найдем коэффициенты а и Ь, при которых средний квадрат ошибки зз = М (($, — 3,)') = М(йз — (а + Ь$,))з) (1.3.69) минимален. Дифференцируя это выражение по а и Ь и приравнивая нулю результаты, имеем — = — 2М (3,]+2а+2Ь М (ч1] =О, да ы = — 2М ]31 Я2]+2ам %+2ЬМ ] $1] =о. дд Решая эти два уравнения относительно а и Ь, получаем Ь = М(а,— т,) й.— т,))77), = р„l(7,. а = т, — т,М ((я, — т1) (ь, — т,) )1(71 = т, — т, умог1,, (1.3,70) 60 Из (68) получаем выражение для линейной оценки си = т, +(1ттт)Рт) ($в — тт), а из (69) находим минимальное значение ошибки ит!и= (1 — г') Рвю (1.3.71) (1.3.72) где и = ИттФРт Рг (1.3.73) — нормированный корреляционный момент, часто называемый коэф4ициентом корреляции. Допустим, что случайная величина $т приняла некоторое конкретное значение х,.
Тогда согласно (71) линейная оценка (или предсказуе. мое значение) ха для значения хв случайной величины $вдается фор- мулой ха та + 911 (хт тт) Р1' (1.3.74) Рис. 1.10. Линии средне- квадратической регрессии Зависимость х, от х, представляет собой прямую линию (рис. 1.10), пРоходЯщУю чеРез точкУ (т„т,), е наклоном, Равным (втт/Рт. Эта пРЯ- мая называется линией средней квадратической регрессии чв на 5т. Следовательно, корреляционный момент определяет наклон линии средней квадратической регреесии. Укажем, что в дальнейшем оеобую роль будут играть моменты т, = М ($т) и йц —— М (($т — т,) ($в — т,)) или тц = = М ($тйи) = р„+ тат,. В отличие от корреляционного момента р„начальный момент тт, называетия ковариационным моментом.
Раздел теории, посвященный изучению лишь тех свойетв случайных величин, которые определяются этими характериетиками, называется корреляционной теорией. Две случайные величины Ят и 5а называются некоррелированными или линейно независимыми, если для них ртт = — О, т. е. тм — — М ДД~) = М (В~) М Д~); (1.3.76) в противном случае величины называютея коррелированными.