Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения (2-е изд., 2000) (1186207), страница 35
Текст из файла (страница 35)
(7.6.14) Величина г, называется коэффициентов корреляции с. в. Х и У; он характеризует степень зависимости зтнх величин, причем не любой вависимости, а только липн е й н о й, проявляющейся в том, что при возрастании одной с. в. другая проявляет тенденцию также возрастать (или убывать). В первом случае г„„> О, и говорят, что с.в. Х и У связаны положительной корреляцией, во втором г.„сО, и корреляция отрицател ь н а. Далее (п. 8.3) мы докажем, что для любых двух случайных величин Х, У -1 ( г„, < 1.
(7.6.15) тл числОВые хАРАктеРистнки системы 217 У=аХ+Ь, то г„„=+ 1 при а > 0 и г„„= -1 при а(0 (это мы также докажем в п. 8.3). Если ковариацпя К,„двух с. в. (а значит и их коэффициент корреляции) равна нулю, с. в. Х и У называются яеяоррслированными; если не равна нулю — коррелированяыми. Из независимости с. в. Следует их пекоррелировапность; но из некоррелирован ности с.в, (г„„=О) еще не вытекает их независимостьт ь.
Если г.„О, это означает только отсутствие линейной связи менарду с.в.; любой другой вид связи может при этом присутствовать. П р и и е р 1. Матрица распределения системы двух дискретных с. в. (Х, У) задана таблицей о,~ о' од О,2 о о (7.6.16) о о,з о,з 11айти числовые характеристики спстемы (Х, У): м. о. — т„ пг„, дисперсии 17., 77„, с. к. о. о„., о„, ковариацию К„и коэффициент корреляции г . * Р е ш е и и е. Прежде всего найдем ряды распределения отдельных величин, входящих в систему: суммируя вероятности рс, стоящие в первой, второй и третьей строках (7.6.16), получим; р„= Р (Х = 1) = 0,1+ О+ О,й = 0,3; р„,= Р(Х = 2) О+ 03+ 0= 03; р„- Р(Х 4) 0,1+ 0,3 = 0,4. Модуль коэффициента корреляции случайных величин Х, У характеризует степень тесноты линейной аав иск мости между ними.
Если линейной зависимости нет, г, = О. Если между случайными величинами существует жесткая функциональная линейная зависимость: Згз ГЛ. 7 СИСТЕМЫ СЛУЧЛЙНЫХ ВЕЧП'П1Н Ряд распределения с. в. Х имеет внд Ее м. о. т„ 1 ° О,З + 2 0,3 + 4 0,4 = 2,5. Дисперсию Р„ находим через Второй начальный момент: а1 [Х) = 1' 0,3 + 2' 0,3 + 41 0,4 = „9; .О, = ае [Х[ — яге = 7,9 — (2,5)' — 1,65. Среднее квадратическое огклопеипо а„= '1'ь7„= 1,285. Аналогично находим ряд распределения с.
В. Г, суммируя вероятности ро по столбцам табл. (7.6.16): Р„= Р ()' — 0) = О,1 + 0,1 = О,; 71У вЂ” Р ()' =- 2) = 0,6; РУ вЂ” — Р()'.= 5) = 0,2. Ряд распределения с.в. у имеет вид: " ~ — ',.Н '..~ лгУ 0 0,2 + 2 0,6 + 5 0,2 2,2; Х)У = яе [)') — т'„= 0'0,2 + 2'0,6 + 51 0,2 — (2,2)'=2,56; о„= 1,60. 11аходнм м.
о. произведения с. в. Х и У1 М[Х )") 1 0 0,1+1.2 О+1 5 0,2+2 0 0+ +2 2 03+2 5 О+4 0 01+4 2 03+4 5 0=46. Коварнацню К,„вычисляем по формуле (7.6.13): К, 4,6 — 2,5 2,2 = — 0,90., Деля К, па о.о„, получим коэффициент корреляции: — о,в ,, ';„- — 0,436, что показывает, что между с. в. Х н У существует отрицательная линейная зависимость, т. е. при увеличении г « '!!!Г.ювык ха!глкт!.!'нетпкн спствыы 219 одной пз ннх другая имеет некоторую тенденцию уменьгозться. в П ример 2. Для системы с. в., приведенной в примере 2 и.
7.5, распределенной равномерно в квадрате Л со стороной, равной а и составляющей угол 45' с осью Ох (рпс. 7.6.1), найти коварнзцню и коэффициент корреляции с. в. Х, У. 1'е ш е н и е. Из соображений симметрии распределения, его «цевтр массы» лежит в начале координат: и»,= = в»„= О. Находи!! и. о. произведения величин Х и У (каждая пз которых совпадает со своей цептрпрованпой): К,„= М ((ХУ~ = ( ~ху/(х, у) «?х г?!/. <в! Илп, учитывая, что /(х, у)= 1/а«, в квадрате ?? к,„- —,, ~)).««.«« 1 (в ) «((.««*«г «Ц««с»«;- ( !*««««], !в«) (в,) 1в ) где 7?!, ??„Н„Л! — четыре треугольника, на которыо оси координат делят квадрат 1? (рпс. 7.6Л), В первом из вих а/ку (г?,) > О, р > О; р (/?,) х ( О, у > 0; интегралы по обеим областям равны по вз модулю и противоположны по л/»'2 »г я„л/»'2 знаку; прн суммировании опи «г а взаимно уничтожа«отея.
То же относится и к интегралам по -а/ку областям /?» и ??,; в первой Рмс. 7/Х1 пз них х(0, у<0, во второй л > О, у ( 0; суммирование интегралов дает нуль. Отсюда К = 0; г К„„/(о,о„) О, т. е. с.в. Х и У некорролированны. Из примера 5 п.7.5 мы знаем, что вти величины зависимы; таким образом мы наглядно убен!даемся, что из некоррелировапностн еще не вытекает их независимость.
Для коррелировапных с, в. характерно, что среднее значение наждой ив пих вавпсит от того, какое значение приняла другая, в 220 Гл. т. системы случАЙных велнчип 7.7. Условные числовые характернстнки системы случайных величин (Х, У). Регрессия Уеловныл! л!отел!итическилв огсидаиие.и одной пз с. в., входящих в систему (Х, У), называется ее м. о., вычисленное при условии, что другая с. в. приняла определенное значение, т.
е. найденное на основе условного закона распределения. Для двух дискретных с.в. (Х, У) условные м.о. вычисляются по формулам: М [У ] х;] = т„!, = ~л у.р, ]„,.,' '! ! ! ! н М [Х ]у.] = т,!„. = х«х,р,,[„., ! ! ! ! 3 (7.7.1) где рг.]„! = Р (У у.] Х = х!); р„,.[„л Р(Х х;]У = у) — условные вероятности значений с. в.
У и Х соответственно при условии, что другая с. в. приняла определенное значение. Для двух непрерывных с.в. Х и У »» М [У]х] = тг!» ~ у/г(у]х) !]у; (7.7.2) М [Х]у] = пл.!у = ( х[!(х]у)«]х, где ]«(у]х), ],(х[у) — условные плотности распределения случайных величин У при Х =х н Х прп У-у соответственно. Условное математическое ожидание с.
в. У при заданном Х х: М [У ! х] тм» называетсн регрессией У на х; аналогично М [Х]у] = т„!„Называется регрессией Х на у. Графики этих зависимостей от х и у называются линилл!и регрессии нлп «яривыл!и регреесииг У на х и Х на у соответственно (рис. 7.7.1 и 7.7.2), П р и м е'р 1. Построить линии регрессии У на х и Х на у для пары с. в. (Х, У), приведенных в примере 1 и.
7.6. 7.7. услОВные числОВые хйуйктегистики 221 Р е >и о и и е. По данным матрицы (7.6.16) находим условные ряды распределепия с.в. У при ж~ 1, х,=2, Рвс. 7.7.1 Рис. 7.7.2 х,=4. По формулам (7.7.1) находим: ру,1, — — Р(1'= =О~ Х = 1) = 0,170,3 = 173; р„~„, - Г (). = 2 1Ъ - Ц - О; ру Р = Р (г = 5) Х = 1)=0,2!0,3=2>'3. Откуда туы = 0 0,333+ 2 О+ 5 О,Г>667 ж 3,333. Аналогично р„)„, = Р(У - О) Х - 2) 0; ру,,)»,= Р(У 2)Х= 2) = 0,3/0,3=1; ру „,— 0 и т„,„=О О+2.1+5 0=2. Наконец Р„,)» = Р (1' = 0) Х = 4) = 0,170,4> = 0,25; ру,)», = 0,75; ру,р», 0 и ту1„- 0 0,25 + 2 0,75 + 5 0 — 1,5. Аналогично находим р» )у Оз1>>Оз2 = Оз51 р )з = 01 р» )у Оз5; т„,„1 05+2 О+4 05=25. Далее Р»6у, 0' Р Оу, = 0~3/0>6 = Оз5: р„)„, 0,5; т„1„»=1 О+2 0,5+4 0,5 3 и, наконец, Р» )>, 0'270'2 1' р" ,'уз р"з)уз 0 тму 1 1+2 О+4 0 1.
" уз Линия регрессии Х на у показана на рис. 7.7.3. 222 гл 7 система слгчгиных вглглнн Для независимых с. в. лпппв регрессии У ка х н Х на у параллельны координат~ым осям, так кзк ч. о. каждой нз них нс зависит от того, какое зппчеппе приняла другая, Лпнпн регрессия могут быть параллельны координатным осям и цлл зав~спмых с. в., если только и. о. каждой ~з ннх не зависят от того, какое значение приняла ггг ! 2 д, Ь З у Рас. 7.7.3 другая. Например, для двух зависимых случайных величии Х и У нз примера 2 п.
7.5 условное м.о. каждой из с. в. равно нулю, независимо от того, какое впачепие приняла другая; линии регрессии У на х и Х на у совпадают с координатными осими Ох и Оу. Если сместить квадрат В так, чтобы его центр находился в точке (и„ и„), то липин регрессии будут параллельными осям координат прямыми х = и„; у = пйв Так как все моменты — начальные и пептральпые— любых порядков представляют собой и а т е и а т и ч ес к и е о ж и д а н и я, то можно говорить об условных моментах (условных дисперсиях 0 [У [ г], 0 [Х ! у], условных начальных и центральных моментах любых порядков).
Пример 2. Для системы случайных величин (Х, У), распределенной с постоянной плотностью в пределах круга с радиусом г и центром в начале координат (пример 6, п. 7.5), найти условные дисперсии 0[У[х] н 0[Х]у]. Решение. Условная плотность распределения с. в. У пРп Х х постоаппа и Равна 7г(У]х)=сонат на Участке ( — Угг — х', Уг' †.т'), т. е.
[г(у]х) 17[2Уг' — х'] при — Уг' — х' ( у ( У~ — х* и У,(у[х)= О вне етого участка. Условггая дисперсия 0 [У [х] для равномерного распре- 7 8 ЗАБОни РАспРеделепия случлйнОГО ВсктОРА 223 делопия на участке (а, ,р) равна (р — а)'/!2, откуда: 0(У(х) = Рм„= (2 Уг'" —,ь')'/12 =(г2 — х'),'3 (О < х < г). (7.7.3) При х г эта дисперсия обращается в нуль, так как значение с. в. У становится вполне определенным: У-г.
При х=О с. в, У распределена равномерно на участке ( — г, +г) и ее дисперсия Р„„=, равна (2г)'/12 = г'/3, что и следует пз формулы (7.7.3) при х = О. Аналогично Р„,„определяем условную дисперсию Р.,„: 0(Х(у) = Рму (гз — у')/3 (О<у<У). ~ (7.7.4) 7.8. Закон распределения и числовые характеристики я-мерного случайного вектора Закон распределения системы и с. в. — я-мерного случайного вектора с составляющими Х„Х„..., Х„: Х=(Х.
Х. в самом общем случае ыогкет быть задан в виде ф.р. А'(хм хм ..., хп) = Р (Х1 < хп Хз < хю ..., ХР < хп) = и Р(П(х'(*)) (781) $-1 Свойства ф. р. (7.8.1): 1. г"(хо х,,, х„) есть неубывающая функция кало дого из своих аргументов. 2. Если хотя бы один из аргументов х„хн ..., х, обрап1ается в —, функция распределения равна нулю. 3. Ф. р. любой подсистемы (подмножества) (Х„Х„... ..., Х,) системы (Хо Х„..., Х„..., Х„) определится, если положить аргументы, соответствующие остальным случайным величинам Х„„„..., Х„, равным +Р: йск...,з(хо ..., х,) Г(хо ..„хм +ао °, +'о) (782) (нумерация аргументов — в произвольном порядке). В частности, ф. р.
Р,(х„) одной из случайных величин, входящих в систему, получится, если положить в функции Р'(хп .. ч х.) все аргументы, кроме х„равными + к РА(х„) Р(+, +,..., х„, +,..., + ). (7.8.3) Гл 7. системА случАЙных Величин 224 4. Функция Г(хь .. „х.) непрерывна слева по каждому из аргументов. Доказательства этих свойств проводятся так же, как и для ф.р. двух с.в. (и. 7.2), н поэтому мы нх не приводим.
Если с. в. Х„Х„..., Х„независимы (т. е. закон распределения каждой из ннх не зависит от того, какие значения приняли другие), то х' (хт хз ° ° ° ~ хз) = х'> (х>)'~з(х ) ° ° ° ~п (хз) П ~1(з>) >=> (7.8.4) Для инженерной практики преимущественное значение имеет случай системы непрерывных случайных величин; для такой системы ф. р. Е(хо ..., х„) непрерывна и дифференцируема по каждому пз аргументов, а также существует п-я смешанная частная производная д"Р(хь ..., х„)/(дх, дх,...
дх„). Плотностью распределения (или совместной плотностью) системы п непрерывных с. в. (Х„Х„..., Х„) называется и-я смешанная частная производная функции распределения, взятая один раз по каждому аргументу: Лзл(г, г, ..., х„) Совместная плотность обладает свойствамп: 1) >(хт, ..., хд)ЪО; (7.8.6) 2) ) (х> ) 7(хы хз, ..., х„) дх, дхт дх„= 1*). Доказываются эти свойства так же, как и для двух с.в. Функция распределения г'(хо х„..., .г.) выражается через плотность л-кратным интегралом: х х, г'(х„хз, ..., х„) =- ( <"> ~ /(х„..., х„) г(х,...с>хз.