1625915146-70d402fe54d0af3e87017c6c516bbe93 (843877), страница 19
Текст из файла (страница 19)
Действительно, для ξ ∼ Na, σ2 величина η =имеет стандартноеσнормальное распределение. Четвёртый момент этого распределения равентрём: E η4 = 3 (вычислить аналогично второму моменту в примере 59).Поэтому β2 = 0.При β2 > 0 плотность распределения имеет более острую вершину, чему нормального распределения, при β2 < 0, наоборот, более плоскую.Г Л А В А IXЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИКажется, нельзя сомневаться ни в истине того, что всё в мире можетбыть представлено числами; ни в справедливости того, что всякаяв нём перемена и отношение выражается аналитической функцией.Между тем обширный взгляд теории допускает существование зависимости только в том смысле, чтобы числа, одни с другими в связи,принимать как бы данными вместе.Н.
И. Лобачевский. Об исчезании тригонометрических строк§ 1. Ковариация двух случайных величинМы знаем, что для независимых случайных величин с конечными вторыми моментами дисперсия их суммы равна сумме их дисперсий. В общемслучае дисперсия суммы равнаD (ξ + η) = D ξ + D η + 2 E (ξη) − E ξ E η .(19)Величина E (ξη) − E ξ E η равняется нулю, если случайные величиныξ и η независимы (свойство (E7) математического ожидания).
С другойстороны, из равенства её нулю вовсе не следует независимость, как показывают примеры 49 и 50 (с. 92). Эту величину используют как «индикаторналичия зависимости» между двумя случайными величинами.О п р е д е л е н и е 39. Ковариацией cov(ξ, η) случайныхвеличин ξи η называется число cov(ξ, η) = E (ξ − E ξ)(η − E η) .С в о й с т в о 18.
Справедливы равенства: cov(ξ, η) = E (ξη) − E ξ E η;cov(ξ, ξ) = D ξ; cov(ξ, η) = cov(η, ξ); cov(c · ξ, η) = c · cov(ξ, η).У п р а ж н е н и е . Доказать свойство 18.У п р а ж н е н и е . Доказать следующее свойство 19, пользуясь равенствами(a + b)2 = a2 + b2 + ab + ba = a2 + b2 + 2ab = aa + bb + ab + baи получив аналогичные равенства для квадрата суммы n слагаемых.103§ 1. Ковариация двух случайных величинС в о й с т в о 19. Дисперсия суммы нескольких случайных величин вычисляется по любой из следующих формул:nXXD (ξ1 + . . . + ξn ) =D ξi +cov(ξi , ξj ) ==i=1nXi=1i6=jD ξi + 2Xi<jcov(ξi , ξj ) =Xcov(ξi , ξj ).i,jОбсудим достоинства и недостатки ковариации, как величины, характеризующей зависимость двух случайных величин.Если ковариация cov(ξ, η) отлична от нуля, то величины ξ и η зависимы.
Чтобы судить о наличии зависимости согласно любому из определений независимости, требуется знать совместное распределение пары ξи η. Но найти совместное распределение часто бывает сложнее, чем посчитать математическое ожидание произведения ξ и η. Если нам повезёт,и математическое ожидание ξη не будет равняться произведению их математических ожиданий, мы установим зависимость ξ и η не находя ихсовместного распределения.
Это очень хорошо.П р и м е р 64. Покажем, что с помощью ковариации можно судитьо зависимости даже тогда, когда для вычисления совместного распределения недостаточно данных. Пусть ξ и η — независимые случайные величины и дисперсия ξ отлична от нуля (что это значит? ). Покажем, что ξи ξ + η зависимы:E ξ(ξ + η) = E ξ2 + E ξ E η,E ξ E (ξ + η) = (E ξ)2 + E ξ E η.Вычитая одно из другого, получим cov(ξ, ξ + η) = D ξ > 0. Следовательно,ξ и ξ + η зависимы.У п р а ж н е н и е .
Доказать, что ξ и ξ + η независимы, если D ξ = 0.Величина cov(ξ, η) не является «безразмерной»: если ξ — объем газав сосуде, а η — давление этого газа, то ковариация измеряется в м3 × Па.Иначе говоря, при умножении ξ или η на 100 ковариация тоже увеличится в 100 раз. Но от умножения на 100 величины не стали «более зависимыми», так что большое значение ковариации не означает более сильнойзависимости. Это очень плохо.Нужно как-то нормировать ковариацию, получив из неё «безразмерную» величину, абсолютное значение которой:а) не менялось бы при умножении случайных величин на число;б) свидетельствовало бы о «силе зависимости» случайных величин.104ГЛАВА IX. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИЗ а м е ч а н и е .
Говоря о «силе» зависимости между случайными величинами, мы имеем в виду следующее. Самая сильная зависимость —функциональная, а из функциональных — линейная зависимость, когдаξ = aη + b п. н. Бывают гораздо более слабые зависимости. Так, если попоследовательности независимых случайных величин ξ1 , ξ2 , . . . построить величины ξ = ξ1 + . . . + ξ24 + ξ25 и η = ξ25 + ξ26 + . . . + ξ90 , то этивеличины зависимы, но очень «слабо»: через единственное общее слагаемое ξ25 .
Сильно ли зависимы число гербов в первых 25 подбрасыванияхмонеты и число гербов в испытаниях с 25 -го по 90 -е?Итак, следующая величина есть всего лишь ковариация, нормированная нужным образом.§ 2. Коэффициент корреляцииО п р е д е л е н и е 40. Коэффициентом корреляции ρ(ξ, η) случайныхвеличин ξ и η, дисперсии которых существуют и отличны от нуля, называется числоcov(ξ, η)ρ(ξ, η) = p p.DξDηЗ а м е ч а н и е . Чтобы разглядеть «устройство» коэффициента корреляции, распишем по определению числитель и знаменатель:E (ξ − E ξ)(η − E η)ρ(ξ, η) = q2 q2 .E ξ − EξE η − EηПеред нами — «косинус угла» между двумя элементами ξ − E ξ и η − E ηгильбертова пространства, образованного случайными величинами с нулевым математическим ожиданием и конечным вторым моментом, снабженного скалярным произведением cov(ξ, η) и «нормой», равной корнюиз дисперсии, или корню из скалярного произведения cov(ξ, ξ).П р и м е р 65.
Рассмотрим продолжение примера 64, но пусть ξ и ηбудут не только независимыми, но и одинаково распределёнными случайными величинами, и их дисперсия отлична от нуля. Найдём коэффициенткорреляции величин ξ и ξ + η :cov(ξ, ξ + η)Dξ1Dξρ(ξ, ξ + η) = p q= p p= p p= √ .2Dξ Dξ + DηD ξ 2D ξD ξ D (ξ + η)Коэффициент корреляции величин ξ и ξ + η равен косинусу угла 45◦ ,образованного «векторами» ξ и ξ + η, когда ξ и η «ортогональны» и их«длина» одинакова.105§ 2. Коэффициент корреляцииУ п р а ж н е н и е . Чтобы аналогия не заходила слишком далеко, и учитателя не возникло искушения любые случайные величины рисоватьстрелочками на плоскости и вместо подсчёта математических ожиданийизмерять углы, полезно убедиться, например, что коэффициент корреляции величин ξ и ξ2 равен:а) нулю, если ξ имеет нормальное распределение с нулевым средним;√б) 2/ 5, если ξ имеет показательное распределение.Т е о р е м а 33.
Коэффициент корреляции обладает свойствами:1) если ξ и η независимы, то ρ(ξ, η) = 0;2) всегда |ρ(ξ, η)| 6 1;3) |ρ(ξ, η)| = 1 тогда и только тогда, когда ξ и η п. н. линейно связаны, т. е. существуют числа a 6= 0 и b такие, что P(η = aξ + b) = 1.Д о к а з а т е л ь с т в о.
Свойство (1) мы уже много раз (сколько?) упоминали и один раз доказали. Более того, при рассмотрении свойств математического ожидания мы привели примеры 49 и 50 — два из многихвозможных примеров того, что свойство (1) в обратную сторону неверно.ξ − EξслуДокажем свойство (2). Рассмотрим преобразование bξ = √Dξчайной величины, называемое стандартизацией. Случайная величина bξимеет нулевое математическое ожидание и единичную дисперсию:ξ − EξE bξ = E √Dξ=Eξ − Eξ√= 0;Dξξ − EξD (ξ − E ξ)= 1.E bξ 2 = D bξ = D √=DξDξКоэффициент корреляции теперь запишется проще: ρ(ξ, η) = E bξ · bη .Далее, неравенство (x ± y)2 > 0 равносильно неравенству12− (x2 + y 2 ) 6 xy 61 2(x + y 2 ).2Подставив в него bξ вместо x, bη вместо y и взяв математические ожидания всех частей неравенства, получим свойство (2):11η 2 6 ρ(ξ, η) = E bξ·bη 6E bξ 2 + bη 2 = 1.
(20)− 1 = − E bξ 2 + b22Докажем свойство (3). В одну сторону утверждение проверяется непосредственно: если η = aξ + b, то(1, a > 0,aD ξE (ξ(aξ + b)) − E ξ · E (aξ + b)√ √ρ(ξ, aξ + b) == √ √ 2=Dξ a DξD ξ D (aξ + b)−1, a < 0.106ГЛАВА IX. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИДокажем вторую часть свойства (3): если |ρ(ξ, η)| = 1, то существуютчисла a 6= 0 и b такие, что P(η = aξ + b) = 1. Рассмотрим сначала случай ρ(ξ, η) = ρ bξ, bη = 1. Тогда второе неравенство в формуле (20) превращается в равенство:21E bξ · bη = E bξ2 + bη 2 , т. е. E bξ−bη = 0.2Если математическое ожидание неотрицательной случайной величины22bξ − bηравно нулю, то bξ − bη= 0, п.
н. Поэтому с единичной вероятностьюη − Eηξ − Eξp= √,DηDξpη= √DηDξpξ + Eη − √DηDξE ξ = aξ + b.В случае ρ(ξ, η) = −1 нужно рассмотреть первое неравенство в формуле(20) и повторить рассуждения. Тем самым теорема 33 доказана.Полезно знать следующие часто употребляемые термины.О п р е д е л е н и е 41. Говорят, что ξ и η отрицательно коррелированы, если ρ(ξ, η) < 0; положительно коррелированы, если ρ(ξ, η) > 0;некоррелированы, если ρ(ξ, η) = 0.Смысл знака ρ(ξ, η) хорошо виден в случае ρ(ξ, η) = ±1. Тогда знакρ равен знаку a в равенстве η = aξ + b п. н. Так, ρ(ξ, η) = 1 означает,что чем больше ξ, тем больше и η. Напротив, ρ(ξ, η) = −1 означает,что чем больше ξ, тем меньше η. Похожим образом можно трактоватьзнак коэффициента корреляции и в случае, когда |ρ(ξ, η)| < 1, помня приэтом, что зависимость между ξ и η теперь уже не линейная и, возможно,даже не функциональная.Так, величины ξ и ξ + η в примерах 64 и 65 положительно коррелированы, но их зависимость не функциональная.Следующее свойство показывает, что модуль коэффициента корреляции не меняется при линейных преобразованиях случайных величин.С в о й с т в о 20.
Для любых случайных величин ξ и η с конечнойи ненулевой дисперсией при любых постоянных a 6= 0 и b имеет меaсто равенство ρ(aξ + b, η) = sgn(a) · ρ(ξ, η), где sgn(a) =— знак|a|a.Д о к а з а т е л ь с т в о. Запишем ρ(aξ + b, η), не забывая про свойствадисперсии:cov(aξ + b, η)a cov(ξ, η)apρ(aξ + b, η) = q= p=· ρ(ξ, η).p|a|a2 D ξ D ηD (aξ + b) D η107§ 2. Коэффициент корреляцииП р и м е р 66. Если ξ и η суть координаты точки, брошенной наудачув треугольник D с вершинами (2, 0), (0, 0) и (0, 1), то их коэффициенткорреляции ρ(ξ, η) отрицателен. Это можно объяснить так: чем большеξ, тем меньше у η возможностей быть большой.Полезно убедиться в этом, проверив справедливость следующих высказываний.
Во-первых,((x1 − , 0 6 x 6 2,2 − 2y, 0 6 y 6 1,2fη (y) =fξ (x) =0,иначе0,иначе;и вычисленные по этим плотностям средние (вычислить) равны соответственно E ξ = 2/3 и E η = 1/3.Во-вторых, по определению многомерного равномерного распределенияв области D,Z2ZZE (ξ η) =1−x/2Zx · y · 1 dx dy =x y dy dx =0D1.60Ковариация (а с ней и коэффициент корреляции) отрицательна.У п р а ж н е н и е . Почему коэффициент корреляции в примере 66 существует? Какие свойства случайных величин гарантируют конечность второго момента? А из их ограниченности следует существование моментов?По какому из свойств математического ожидания это так?П р и м е р 67.
Найдём коэффициент корреляции между числом выпадений единицы и числом выпадений шестерки при n подбрасыванияхправильной игральной кости.Обозначим для i ∈ {1, . . . , 6} через ξi случайную величину, равнуючислу выпадений грани с i очками при n подбрасываниях кубика. Посчитаем cov(ξ1 , ξ6 ). Каждая из случайных величин ξi имеет биномиальное1n5nраспределение с параметрами n и , поэтому E ξi = , D ξi =.6636Далее заметим, что ξ1 + . . . + ξ6 = n. Из-за симметрии кубика математические ожидания E ξ1 ξ2 , E ξ1 ξ3 , .
. . , E ξ1 ξ6 одинаковы, но отличаются5nn2от E ξ1 ξ1 = E ξ21 = D ξ1 + (E ξ1 )2 =+ . Посчитаем E ξ1 (ξ1 + · · · + ξ6 ).3636С одной стороны, это число равноE ξ1 (ξ1 + . . . + ξ6 ) = E ξ1 · n =n2.6108ГЛАВА IX. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИС другой стороны,E ξ1 (ξ1 + . . . + ξ6 ) = E ξ21 + 5E ξ1 ξ6 =n25n5nn2++ 5E ξ1 ξ6 .3636n2−−, т.