Н.И. Чернова - Теория вероятностей (1119918), страница 19
Текст из файла (страница 19)
Далее,∞∞∞ZZZ21222 −x2/222 −x2/2Eξ = √x edx = √x edx = − √x de−x /2 =2π2π2π−∞00∞∞∞ZZ21 −x2/22x −x2/2 1√√ e−x /2 dx = 1.+2= −√ eedx=0+2π2π2π00−∞Поэтому D ξ = E ξ − (E ξ) = 1 − 0 = 1.= NПример 51 (нормальное распределение Na, σ2 ). Если ξ ⊂a, σ2 ,=то η = (ξ − a) / σ ⊂ N0, 1 . Мы только что вычислили E η = 0, D η = 1.2290ГЛАВА 9. Числовые характеристики распределенийТогда (над каждым равенством подписать, каким свойствам оно обязано)E ξ = E (ση + a) = σE η + a = a;D ξ = D (ση + a) = σ2 D η = σ2 .Пример 52 (показательное распреде л е н ие Eα ). Найдём дляпроизвольного k ∈ N момент порядка k.∞∞∞ZZZk!1kkk−αxEξ =x fξ (x) dx = x α edx = k (αx)k e−αx d(αx) = k .α−∞α00В последнем равенстве мы воспользовались гамма-функцией Эйлера:∞ZΓ(k + 1) = uk e−u du = k!0ТогдаEξ =1α,E ξ2 =2α2,D ξ = E ξ2 − (E ξ)2 =1α2.Пример 53 (стандартное распределени е К о ш и C0, 1 ).
Математическое ожидание распределения Коши не существует, так как расходитсяинтеграл∞∞ZZ111E |ξ| =|x|dx=dx2 = limln(1 + x2 ) = +∞.x→+∞ ππ(1 + x2 )π(1 + x2 )−∞0Расходится он из-за того, что подынтегральная функция ведёт себя на бесконечности как 1/x. Поэтому не существуют ни дисперсия, ни моменты более высоких порядков этого распределения.
То же самое можно сказать прораспределение Коши Ca, σ .Пример 54 (р аспределение Парето). У распределения Парето существуют только моменты порядка t < α, поскольку∞∞ZZ11E |ξ|t = xt α α+1 dx = α α−t+1 dxxx11сходится при t < α, когда подынтегральная функция на бесконечности ведёт себя как 1 / xs+1 , где s = α − t > 0.Упражнение. Посчитать момент порядка t < α распределения Парето.При каких α у этого распределения существует дисперсия? А две тысячи триста семнадцатый момент?Г Л А В А 10Числовые характеристики зависимостиКажется, нельзя сомневаться ни в истине того, что всё в мире можетбыть представлено числами; ни в справедливости того, что всякаяв нём перемена и отношение выражается аналитической функцией.
Между тем обширный взгляд теории допускает существованиезависимости только в том смысле, чтобы числа, одни с другими всвязи, принимать как бы данными вместе.Н. И. Лобачевский, Об исчезании тригонометрических строк§ 1. Ковариация двух случайных величинМы знаем, что для независимых случайных величин с конечными вторыми моментами дисперсия их суммы равна сумме их дисперсий. В общемслучае дисперсия суммы равнаD (ξ + η) = D ξ + D η + 2 E (ξη) − E ξ E η .(19)Величина E (ξη) − E ξ E η равняется нулю, если случайные величины ξи η независимы (свойство (E7) математического ожидания). С другой стороны, из равенства её нулю вовсе не следует независимость, как показываютпримеры 40 и 41. Эту величину часто используют как «индикатор наличиязависимости» между двумя случайными величинами.Определение 46.
К о в а р и а ц и е й cov(ξ, η) случайных величин ξ иη называется ч и с л оcov(ξ, η) = E (ξ − E ξ)(η − E η) .Свойство 13. Справедливы равенства: cov(ξ, η) = E (ξη) − E ξ E η;cov(ξ, ξ) = D ξ; cov(ξ, η) = cov(η, ξ); cov(c ξ, η) = c cov(ξ, η).Упражнение. Доказать свойство 13.Упражнение. Доказать следующее свойство 14, пользуясь равенствами(a + b)2 = a2 + b2 + ab + ba = a2 + b2 + 2ab = aa + bb + ab + baи получив аналогичные равенства для квадрата суммы n слагаемых.92ГЛАВА 10.
Числовые характеристики зависимостиСвойство 14. Дисперсия суммы нескольких случайных величин вычисляется по любой из следующих формул:nXXD (ξ1 + . . . + ξn ) =D ξi +cov(ξi , ξj ) =i=1=nXi=1i6=jD ξi + 2Xi<jcov(ξi , ξj ) =Xcov(ξi , ξj ).i,jОбсудим достоинства и недостатки ковариации, как величины, характеризующей зависимость двух случайных величин.1. Если ковариация cov(ξ, η) отлична от нуля, то величины ξ и η зависимы. Чтобы судить о наличии зависимости согласно любому из определений независимости, требуется знать совместное распределение пары ξ и η.Но найти совместное распределение часто бывает сложнее, чем посчитатьматематическое ожидание произведения ξ и η.
Если нам повезёт, и математическое ожидание произведения ξ и η не будет равняться произведению ихматематических ожиданий, мы скажем, что ξ и η зависимы, н е н а х о д я ихсовместного распределения. Это очень хорошо.Пример 55. Покажем, что с помощью ковариации можно судить о зависимости даже тогда, когда для вычисления совместного распределениянедостаточно данных.
Пусть ξ и η — независимые случайные величины, идисперсия ξ отлична от нуля (что это значит?). Покажем, что ξ и ξ + η зависимы:2E ξ(ξ + η) = E ξ2 + E ξ E η,E ξ E (ξ + η) = (E ξ) + E ξ E η,2поэтому cov(ξ, ξ + η) = E ξ2 + E ξ E η − (E ξ) + E ξ E η = D ξ > 0. Следовательно, ξ и ξ + η зависимы.Упражнение. Доказать, что величины ξ и ξ + η независимы, если D ξ = 0.2.
Величина cov(ξ, η) не является «безразмерной»: если ξ — объем газа в сосуде, а η — давление этого газа, то ковариация измеряется в м3 × Па.Иначе говоря, при умножении ξ или η на какое-нибудь число ковариациятоже умножается на это число. Но умножение на число не сказывается на«степени зависимости» величин (они от этого «более зависимыми» не становятся), так что большое значение ковариации не означает более сильнойзависимости. Это очень плохо.Нужно как-то нормировать ковариацию, получив из неё «безразмерную» величину, абсолютное значение которой:а) не менялось бы при умножении случайных величин на число;б) свидетельствовало бы о «силе зависимости» случайных величин.ГЛАВА 10.
Числовые характеристики зависимости93Замечание 22. Говоря о «силе» зависимости между случайными величинами,мы имеем в виду следующее. Самая сильная зависимость — функциональная, а изфункциональных — линейная зависимость, когда ξ = aη + b п. н. Бывают гораздоболее слабые зависимости. Так, если по последовательности независимых случайных величин ξ1 , ξ2 , . . .
построить величины ξ = ξ1 + . . . + ξ24 + ξ25 и η = ξ25 ++ ξ26 + . . . + ξ90 , то эти величины зависимы, но очень «слабо»: через единственноеобщее слагаемое ξ25 . Сильно ли зависимы число гербов в первых 25 подбрасыванияхмонеты и число гербов в испытаниях с 25-го по 90-е?Итак, следующая величина есть всего лишь ковариация, нормированнаянужным образом.§ 2. Коэффициент корреляцииОпределение 47. К о э ф ф и ц и е н т о м к о р р е л я ц и и ρ(ξ, η) случайных величин ξ и η, дисперсии которых существуют и отличны от нуля,называется ч и с л оcov(ξ, η)ρ(ξ, η) = p p.Dξ DηЗамечание 23.
Чтобы разглядеть «устройство» коэффициента корреляции,распишем по определению числитель и знаменатель:E (ξ − E ξ)(η − E η)qρ(ξ, η) = q22 .E ξ − EξE η − EηЗдесь математикам уместно провести аналогии с «косинусом угла» между двумяэлементами ξ − E ξ и η − E η гильбертова пространства, образованного случайными величинами с нулевым математическим ожиданием и конечным вторым моментом, снабженного скалярным произведением cov(ξ, η) и «нормой», равной корню издисперсии, или корню из скалярного произведения cov(ξ, ξ).Пример 56. Рассмотрим продолжение примера 55, но пусть ξ и η бу-дут не только независимыми, но и одинаково распределёнными случайнымивеличинами, и их дисперсия отлична от нуля. Найдём коэффициент корреляции величин ξ и ξ + η:cov(ξ, ξ + η)DξDξ1ρ(ξ, ξ + η) = p p=p p=p p=√ .2D ξ D (ξ + η)Dξ Dξ + DηD ξ 2D ξКоэффициент корреляции величин ξ и ξ + η равен косинусу угла 45◦ , образованного «векторами» ξ и ξ + η, когда «ξ ⊥ η» и их «длина» одинакова.Упражнение.
Чтобы аналогия не заходила слишком далеко, и у читателя невозникло искушения любые случайные величины рисовать стрелочками на плоскости и вместо подсчёта математических ожиданий измерять углы, предлагаю убедиться, например, что коэффициент корреляции величин ξ и ξ2 равен:а) нулю,√ если ξ имеет нормальное распределение с нулевым средним;б) 2/ 5, если ξ имеет показательное распределение с любым параметром.94ГЛАВА 10. Числовые характеристики зависимости§ 3.
Свойства коэффициента корреляцииПредполагается, что коэффициент корреляции существует.Теорема 31. Коэффициент корреляции обладает свойствами:1) если ξ и η независимы, то ρ(ξ, η) = 0;2) всегда |ρ(ξ, η)| 6 1;3) |ρ(ξ, η)| = 1 тогда и только тогда, когда ξ и η п. н. линейно связаны, т. е. существуют числа a 6= 0 и b такие, что P(η = aξ + b) = 1.Доказательство.1) Свойство (1) мы уже много раз (сколько?) упоминали и один раз доказали.
Более того, при рассмотрении свойств математического ожиданиямы привели примеры 40 и 41 — два из многих возможных примеров того,что свойство (1) в обратную сторону неверно.2) Обозначим через σ2ξ и σ2η дисперсии ξ и η соответственно, и рассмотрим неотрицательную (почему?) дисперсию любой из двух случайных величин ϕ± = ση ξ ± σξ η:0 6 D ϕ± = D (ση ξ) + D (±σξ η) + 2cov(ση ξ, ±σξ η) == σ2η σ2ξ + σ2ξ σ2η ± 2ση σξ cov(ξ, η) = 2σ2ξ σ2η (1 ± ρ(ξ, η)).Мы получили два полезных соотношения:D ϕ−D ϕ+1 − ρ(ξ, η) = 2 2 > 0.1 + ρ(ξ, η) = 2 2 > 0,2σξ ση2σξ ση(20)Из них сразу следует, что −1 6 ρ(ξ, η) 6 1.3) В одну сторону утверждение проверяется непосредственно:Упражнение.
Воспользоваться свойствами математического ожидания и дис(персии и доказать, что1, a > 0;ρ(ξ, aξ + b) =−1, a < 0.√Не забудьте, что a2 = |a|, а не просто a!Докажем вторую часть свойства (3): если |ρ(ξ, η)| = 1, то существуютчисла a 6= 0 и b такие, что P(η = aξ + b) = 1.Рассмотрим сначала случай ρ(ξ, η) = 1. Это возможно только если вто-рое неравенство в формуле (20) превращается в равенство:D ϕ−0 = 1 − ρ(ξ, η) = 2 2 ,2σξ σηт. е. D ϕ− = 0.
Тогда, по свойству (D3), ϕ− = c п. н., где c — некотороечисло. Иначе говоря, ση ξ − σξ η = c п. н., илиσηcη=ξ −= aξ + b п. н.σξσξГЛАВА 10. Числовые характеристики зависимости95В случае ρ(ξ, η) = −1 нужно рассмотреть первое неравенство в формуле (20) и повторить рассуждения. Тем самым теорема 31 доказана.Полезно знать следующие часто употребляемые термины.Определение 48. Говорят, что ξ и η отрицательно коррелированы, если ρ(ξ, η) < 0, положительно коррелированы, если ρ(ξ, η) > 0, и некоррелированы, если ρ(ξ, η) = 0.Смысл знака ρ(ξ, η) хорошо виден в случае ρ(ξ, η) = ±1. Тогда знак ρравен знаку a в равенстве η = aξ + b п. н.
Так, ρ(ξ, η) = 1 означает, чточем больше ξ, тем больше и η. Напротив, ρ(ξ, η) = −1 означает, что чембольше ξ, тем меньше η. Похожим образом можно трактовать знак коэффициента корреляции и в случае, когда |ρ(ξ, η)| < 1, помня при этом, чтозависимость между ξ и η теперь уже не линейная и, возможно, даже нефункциональная.Так, величины ξ и ξ + η в примерах 55 и 56 положительно коррелированы, но их зависимость не функциональная.Следующее свойство показывает, что модуль коэффициента корреляциине меняется при линейных преобразованиях случайных величин.Свойство 15. Для любых случайных величин ξ и η с конечной иненулевой дисперсией при любых постоянных a 6= 0 и b имеет месторавенство:(1, a > 0;ρ(aξ + b, η) = sgn(a) · ρ(ξ, η), где sgn(a) =−1, a < 0.Доказательство.