Н.И. Чернова - Теория вероятностей (1115308), страница 19
Текст из файла (страница 19)
Распределение, обладающее единственной модой,называют унимодальным. Идеальным примером унимодального распределения является нормальное распределение. Плотность произвольногоунимодального распределения может быть как более плоской (равномерное распределение), так и более «островершинной» (показательное распределение) по сравнению с плотностью нормального распределения, можетбыть симметричной либо наклонённой в одну сторону. Для описания таких свойств плотности используют коэффициент эксцесса и коэффициентасимметрии .Коэффициентом асимметрии распределения с конечным третьим моментом называется числоξ−a 3,β1 = Eσpгде a = E ξ, σ = D ξ.Для симметричных распределений коэффициент асимметрии равен нулю. Если β1 > 0, то график плотности распределения имеет более крутойнаклон слева и более пологий — справа; при β1 < 0 — наоборот.Коэффициентом эксцесса распределения с конечным четвёртым моментом называется числоξ−a 4− 3.β2 = EσДля всех нормальных распределений коэффициент эксцесса равен нуξ−aлю.
Действительно, для ξ ∼ Na, σ2 величина η =имеет стандартноеσнормальное распределение. Четвёртый момент этого распределения равентрём: E η4 = 3 (вычислить аналогично второму моменту в примере 59).Поэтому β2 = 0.При β2 > 0 плотность распределения имеет более острую вершину, чему нормального распределения, при β2 < 0, наоборот, более плоскую.Г Л А В А IXЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИКажется, нельзя сомневаться ни в истине того, что всё в мире можетбыть представлено числами; ни в справедливости того, что всякаяв нём перемена и отношение выражается аналитической функцией.Между тем обширный взгляд теории допускает существование зависимости только в том смысле, чтобы числа, одни с другими в связи,принимать как бы данными вместе.Н.
И. Лобачевский. Об исчезании тригонометрических строк§ 1. Ковариация двух случайных величинМы знаем, что для независимых случайных величин с конечными вторыми моментами дисперсия их суммы равна сумме их дисперсий. В общемслучае дисперсия суммы равнаD (ξ + η) = D ξ + D η + 2 E (ξη) − E ξ E η .(19)Величина E (ξη) − E ξ E η равняется нулю, если случайные величиныξ и η независимы (свойство (E7) математического ожидания). С другойстороны, из равенства её нулю вовсе не следует независимость, как показывают примеры 49 и 50 (с. 92). Эту величину используют как «индикаторналичия зависимости» между двумя случайными величинами.О п р е д е л е н и е 39.
Ковариацией cov(ξ, η) случайныхвеличин ξи η называется число cov(ξ, η) = E (ξ − E ξ)(η − E η) .С в о й с т в о 18. Справедливы равенства: cov(ξ, η) = E (ξη) − E ξ E η;cov(ξ, ξ) = D ξ; cov(ξ, η) = cov(η, ξ); cov(c · ξ, η) = c · cov(ξ, η).У п р а ж н е н и е . Доказать свойство 18.У п р а ж н е н и е . Доказать следующее свойство 19, пользуясь равенствами(a + b)2 = a2 + b2 + ab + ba = a2 + b2 + 2ab = aa + bb + ab + baи получив аналогичные равенства для квадрата суммы n слагаемых.103§ 1.
Ковариация двух случайных величинС в о й с т в о 19. Дисперсия суммы нескольких случайных величин вычисляется по любой из следующих формул:nXXD (ξ1 + . . . + ξn ) =D ξi +cov(ξi , ξj ) ==i=1nXi=1i6=jD ξi + 2Xi<jcov(ξi , ξj ) =Xcov(ξi , ξj ).i,jОбсудим достоинства и недостатки ковариации, как величины, характеризующей зависимость двух случайных величин.Если ковариация cov(ξ, η) отлична от нуля, то величины ξ и η зависимы. Чтобы судить о наличии зависимости согласно любому из определений независимости, требуется знать совместное распределение пары ξи η. Но найти совместное распределение часто бывает сложнее, чем посчитать математическое ожидание произведения ξ и η. Если нам повезёт,и математическое ожидание ξη не будет равняться произведению их математических ожиданий, мы установим зависимость ξ и η не находя ихсовместного распределения.
Это очень хорошо.П р и м е р 64. Покажем, что с помощью ковариации можно судитьо зависимости даже тогда, когда для вычисления совместного распределения недостаточно данных. Пусть ξ и η — независимые случайные величины и дисперсия ξ отлична от нуля (что это значит? ). Покажем, что ξи ξ + η зависимы:E ξ(ξ + η) = E ξ2 + E ξ E η,E ξ E (ξ + η) = (E ξ)2 + E ξ E η.Вычитая одно из другого, получим cov(ξ, ξ + η) = D ξ > 0.
Следовательно,ξ и ξ + η зависимы.У п р а ж н е н и е . Доказать, что ξ и ξ + η независимы, если D ξ = 0.Величина cov(ξ, η) не является «безразмерной»: если ξ — объем газав сосуде, а η — давление этого газа, то ковариация измеряется в м3 × Па.Иначе говоря, при умножении ξ или η на 100 ковариация тоже увеличится в 100 раз. Но от умножения на 100 величины не стали «более зависимыми», так что большое значение ковариации не означает более сильнойзависимости. Это очень плохо.Нужно как-то нормировать ковариацию, получив из неё «безразмерную» величину, абсолютное значение которой:а) не менялось бы при умножении случайных величин на число;б) свидетельствовало бы о «силе зависимости» случайных величин.104ГЛАВА IX.
ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИЗ а м е ч а н и е . Говоря о «силе» зависимости между случайными величинами, мы имеем в виду следующее. Самая сильная зависимость —функциональная, а из функциональных — линейная зависимость, когдаξ = aη + b п. н. Бывают гораздо более слабые зависимости. Так, если попоследовательности независимых случайных величин ξ1 , ξ2 , . .
. построить величины ξ = ξ1 + . . . + ξ24 + ξ25 и η = ξ25 + ξ26 + . . . + ξ90 , то этивеличины зависимы, но очень «слабо»: через единственное общее слагаемое ξ25 . Сильно ли зависимы число гербов в первых 25 подбрасыванияхмонеты и число гербов в испытаниях с 25 -го по 90 -е?Итак, следующая величина есть всего лишь ковариация, нормированная нужным образом.§ 2.
Коэффициент корреляцииО п р е д е л е н и е 40. Коэффициентом корреляции ρ(ξ, η) случайныхвеличин ξ и η, дисперсии которых существуют и отличны от нуля, называется числоcov(ξ, η)ρ(ξ, η) = p p.DξDηЗ а м е ч а н и е . Чтобы разглядеть «устройство» коэффициента корреляции, распишем по определению числитель и знаменатель:E (ξ − E ξ)(η − E η)ρ(ξ, η) = q2 q2 .E ξ − EξE η − EηПеред нами — «косинус угла» между двумя элементами ξ − E ξ и η − E ηгильбертова пространства, образованного случайными величинами с нулевым математическим ожиданием и конечным вторым моментом, снабженного скалярным произведением cov(ξ, η) и «нормой», равной корнюиз дисперсии, или корню из скалярного произведения cov(ξ, ξ).П р и м е р 65. Рассмотрим продолжение примера 64, но пусть ξ и ηбудут не только независимыми, но и одинаково распределёнными случайными величинами, и их дисперсия отлична от нуля.
Найдём коэффициенткорреляции величин ξ и ξ + η :cov(ξ, ξ + η)Dξ1Dξρ(ξ, ξ + η) = p q= p p= p p= √ .2Dξ Dξ + DηD ξ 2D ξD ξ D (ξ + η)Коэффициент корреляции величин ξ и ξ + η равен косинусу угла 45◦ ,образованного «векторами» ξ и ξ + η, когда ξ и η «ортогональны» и их«длина» одинакова.105§ 2. Коэффициент корреляцииУ п р а ж н е н и е .
Чтобы аналогия не заходила слишком далеко, и учитателя не возникло искушения любые случайные величины рисоватьстрелочками на плоскости и вместо подсчёта математических ожиданийизмерять углы, полезно убедиться, например, что коэффициент корреляции величин ξ и ξ2 равен:а) нулю, если ξ имеет нормальное распределение с нулевым средним;√б) 2/ 5, если ξ имеет показательное распределение.Т е о р е м а 33. Коэффициент корреляции обладает свойствами:1) если ξ и η независимы, то ρ(ξ, η) = 0;2) всегда |ρ(ξ, η)| 6 1;3) |ρ(ξ, η)| = 1 тогда и только тогда, когда ξ и η п.
н. линейно связаны, т. е. существуют числа a 6= 0 и b такие, что P(η = aξ + b) = 1.Д о к а з а т е л ь с т в о. Свойство (1) мы уже много раз (сколько?) упоминали и один раз доказали. Более того, при рассмотрении свойств математического ожидания мы привели примеры 49 и 50 — два из многихвозможных примеров того, что свойство (1) в обратную сторону неверно.ξ − EξслуДокажем свойство (2).
Рассмотрим преобразование bξ = √Dξчайной величины, называемое стандартизацией. Случайная величина bξимеет нулевое математическое ожидание и единичную дисперсию:ξ − EξE bξ = E √Dξ=Eξ − Eξ√= 0;Dξξ − EξD (ξ − E ξ)= 1.E bξ 2 = D bξ = D √=DξDξКоэффициент корреляции теперь запишется проще: ρ(ξ, η) = E bξ · bη .Далее, неравенство (x ± y)2 > 0 равносильно неравенству12− (x2 + y 2 ) 6 xy 61 2(x + y 2 ).2Подставив в него bξ вместо x, bη вместо y и взяв математические ожидания всех частей неравенства, получим свойство (2):11η 2 6 ρ(ξ, η) = E bξ·bη 6E bξ 2 + bη 2 = 1.
(20)− 1 = − E bξ 2 + b22Докажем свойство (3). В одну сторону утверждение проверяется непосредственно: если η = aξ + b, то(1, a > 0,aD ξE (ξ(aξ + b)) − E ξ · E (aξ + b)√ √ρ(ξ, aξ + b) == √ √ 2=Dξ a DξD ξ D (aξ + b)−1, a < 0.106ГЛАВА IX. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИДокажем вторую часть свойства (3): если |ρ(ξ, η)| = 1, то существуютчисла a 6= 0 и b такие, что P(η = aξ + b) = 1. Рассмотрим сначала случай ρ(ξ, η) = ρ bξ, bη = 1. Тогда второе неравенство в формуле (20) превращается в равенство:21E bξ · bη = E bξ2 + bη 2 , т.
е. E bξ−bη = 0.2Если математическое ожидание неотрицательной случайной величины22bξ − bηравно нулю, то bξ − bη= 0, п. н. Поэтому с единичной вероятностьюη − Eηξ − Eξp= √,DηDξpη= √DηDξpξ + Eη − √DηDξE ξ = aξ + b.В случае ρ(ξ, η) = −1 нужно рассмотреть первое неравенство в формуле(20) и повторить рассуждения. Тем самым теорема 33 доказана.Полезно знать следующие часто употребляемые термины.О п р е д е л е н и е 41. Говорят, что ξ и η отрицательно коррелированы, если ρ(ξ, η) < 0; положительно коррелированы, если ρ(ξ, η) > 0;некоррелированы, если ρ(ξ, η) = 0.Смысл знака ρ(ξ, η) хорошо виден в случае ρ(ξ, η) = ±1.
Тогда знакρ равен знаку a в равенстве η = aξ + b п. н. Так, ρ(ξ, η) = 1 означает,что чем больше ξ, тем больше и η. Напротив, ρ(ξ, η) = −1 означает,что чем больше ξ, тем меньше η. Похожим образом можно трактоватьзнак коэффициента корреляции и в случае, когда |ρ(ξ, η)| < 1, помня приэтом, что зависимость между ξ и η теперь уже не линейная и, возможно,даже не функциональная.Так, величины ξ и ξ + η в примерах 64 и 65 положительно коррелированы, но их зависимость не функциональная.Следующее свойство показывает, что модуль коэффициента корреляции не меняется при линейных преобразованиях случайных величин.С в о й с т в о 20.
Для любых случайных величин ξ и η с конечнойи ненулевой дисперсией при любых постоянных a 6= 0 и b имеет меaсто равенство ρ(aξ + b, η) = sgn(a) · ρ(ξ, η), где sgn(a) =— знак|a|a.Д о к а з а т е л ь с т в о. Запишем ρ(aξ + b, η), не забывая про свойствадисперсии:cov(aξ + b, η)a cov(ξ, η)apρ(aξ + b, η) = q= p=· ρ(ξ, η).p|a|a2 D ξ D ηD (aξ + b) D η107§ 2. Коэффициент корреляцииП р и м е р 66. Если ξ и η суть координаты точки, брошенной наудачув треугольник D с вершинами (2, 0), (0, 0) и (0, 1), то их коэффициенткорреляции ρ(ξ, η) отрицателен. Это можно объяснить так: чем большеξ, тем меньше у η возможностей быть большой.Полезно убедиться в этом, проверив справедливость следующих высказываний.