_учебник_ Теория вероятности. Н.И. Чернова. 2007 (1185320), страница 18
Текст из файла (страница 18)
Так, у биномиального распределения с параметрами 3 и 1 ме2дианой будет любое число из отрезка [1, 2]. Действительно, ξ принимаетзначения 0, 1, 2 и 3 с вероятностями соответственно 1 , 3 , 3 и 1 .8888Поэтому для всех µ ∈ [1, 2]P(ξ 6 µ) > 1 ,2P(ξ > µ) > 1 .2Часто в таких случаях в качестве µ берут середину «отрезка медиан».Для распределений с непрерывной и строго монотонной функциейраспределения F медиана является единственным решением уравненияF (µ) = 1 . Это точка, левее и правее которой на числовой прямой сосре2доточено ровно по половине всей вероятностной «массы» (рис. 14).
Еслираспределение имеет плотность f, то площади каждой из областей подграфиком плотности слева и справа от точки µ одинаковы.Медиана является одной из квантилей распределения. Пусть для простоты функция распределения F непрерывна и строго монотонна. Тогдаквантилью уровня δ ∈ (0, 1) называется решение уравнения F (xδ ) = δ.F (x)f (x)10,81212δ0,1x0,1µx0,8xδxµxРис.
14. Медиана и квантили на графике функции распределения и плотностиКвантиль xδ уровня δ отрезает от области под графиком плотностиобласть с площадью δ слева от себя, и с площадью 1−δ — справа. Медианаявляется квантилью уровня δ = 1 .2§ 6. Другие числовые характеристики распределений101Квантили уровней, кратных 0,01, в прикладной статистике называютпроцентилями, квантили уровней, кратных 0,1, — децилями, уровней,кратных 0,25, — квартилями.Модой абсолютно непрерывного распределения называют любую точкулокального максимума плотности распределения. Для дискретных распределений модой считают любое значение ai , вероятность которого больше,чем вероятности соседних значений (соседнего, если таковое одно).Для нормального распределения Na, σ2 медиана, математическое ожидание и мода равны a.
Распределение, обладающее единственной модой,называют унимодальным. Идеальным примером унимодального распределения является нормальное распределение. Плотность произвольногоунимодального распределения может быть как более плоской (равномерное распределение), так и более «островершинной» (показательное распределение) по сравнению с плотностью нормального распределения, можетбыть симметричной либо наклонённой в одну сторону.
Для описания таких свойств плотности используют коэффициент эксцесса и коэффициентасимметрии .Коэффициентом асимметрии распределения с конечным третьим моментом называется числоξ−a 3,β1 = Eσpгде a = E ξ, σ = D ξ.Для симметричных распределений коэффициент асимметрии равен нулю. Если β1 > 0, то график плотности распределения имеет более крутойнаклон слева и более пологий — справа; при β1 < 0 — наоборот.Коэффициентом эксцесса распределения с конечным четвёртым моментом называется числоξ−a 4− 3.β2 = EσДля всех нормальных распределений коэффициент эксцесса равен нуξ−aлю.
Действительно, для ξ ∼ Na, σ2 величина η =имеет стандартноеσнормальное распределение. Четвёртый момент этого распределения равентрём: E η4 = 3 (вычислить аналогично второму моменту в примере 59).Поэтому β2 = 0.При β2 > 0 плотность распределения имеет более острую вершину, чему нормального распределения, при β2 < 0, наоборот, более плоскую.Г Л А В А IXЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИКажется, нельзя сомневаться ни в истине того, что всё в мире можетбыть представлено числами; ни в справедливости того, что всякаяв нём перемена и отношение выражается аналитической функцией.Между тем обширный взгляд теории допускает существование зависимости только в том смысле, чтобы числа, одни с другими в связи,принимать как бы данными вместе.Н.
И. Лобачевский. Об исчезании тригонометрических строк§ 1. Ковариация двух случайных величинМы знаем, что для независимых случайных величин с конечными вторыми моментами дисперсия их суммы равна сумме их дисперсий. В общемслучае дисперсия суммы равнаD (ξ + η) = D ξ + D η + 2 E (ξη) − E ξ E η .(19)Величина E (ξη) − E ξ E η равняется нулю, если случайные величиныξ и η независимы (свойство (E7) математического ожидания). С другойстороны, из равенства её нулю вовсе не следует независимость, как показывают примеры 49 и 50 (с. 92). Эту величину используют как «индикаторналичия зависимости» между двумя случайными величинами.О п р е д е л е н и е 39. Ковариацией cov(ξ, η) случайныхвеличин ξи η называется число cov(ξ, η) = E (ξ − E ξ)(η − E η) .С в о й с т в о 18.
Справедливы равенства: cov(ξ, η) = E (ξη) − E ξ E η;cov(ξ, ξ) = D ξ; cov(ξ, η) = cov(η, ξ); cov(c · ξ, η) = c · cov(ξ, η).У п р а ж н е н и е . Доказать свойство 18.У п р а ж н е н и е . Доказать следующее свойство 19, пользуясь равенствами(a + b)2 = a2 + b2 + ab + ba = a2 + b2 + 2ab = aa + bb + ab + baи получив аналогичные равенства для квадрата суммы n слагаемых.103§ 1.
Ковариация двух случайных величинС в о й с т в о 19. Дисперсия суммы нескольких случайных величин вычисляется по любой из следующих формул:nXXD (ξ1 + . . . + ξn ) =D ξi +cov(ξi , ξj ) ==i=1nXi=1i6=jD ξi + 2Xi<jcov(ξi , ξj ) =Xcov(ξi , ξj ).i,jОбсудим достоинства и недостатки ковариации, как величины, характеризующей зависимость двух случайных величин.Если ковариация cov(ξ, η) отлична от нуля, то величины ξ и η зависимы.
Чтобы судить о наличии зависимости согласно любому из определений независимости, требуется знать совместное распределение пары ξи η. Но найти совместное распределение часто бывает сложнее, чем посчитать математическое ожидание произведения ξ и η. Если нам повезёт,и математическое ожидание ξη не будет равняться произведению их математических ожиданий, мы установим зависимость ξ и η не находя ихсовместного распределения.
Это очень хорошо.П р и м е р 64. Покажем, что с помощью ковариации можно судитьо зависимости даже тогда, когда для вычисления совместного распределения недостаточно данных. Пусть ξ и η — независимые случайные величины и дисперсия ξ отлична от нуля (что это значит? ).
Покажем, что ξи ξ + η зависимы:E ξ(ξ + η) = E ξ2 + E ξ E η,E ξ E (ξ + η) = (E ξ)2 + E ξ E η.Вычитая одно из другого, получим cov(ξ, ξ + η) = D ξ > 0. Следовательно,ξ и ξ + η зависимы.У п р а ж н е н и е . Доказать, что ξ и ξ + η независимы, если D ξ = 0.Величина cov(ξ, η) не является «безразмерной»: если ξ — объем газав сосуде, а η — давление этого газа, то ковариация измеряется в м3 × Па.Иначе говоря, при умножении ξ или η на 100 ковариация тоже увеличится в 100 раз. Но от умножения на 100 величины не стали «более зависимыми», так что большое значение ковариации не означает более сильнойзависимости.
Это очень плохо.Нужно как-то нормировать ковариацию, получив из неё «безразмерную» величину, абсолютное значение которой:а) не менялось бы при умножении случайных величин на число;б) свидетельствовало бы о «силе зависимости» случайных величин.104ГЛАВА IX. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАВИСИМОСТИЗ а м е ч а н и е . Говоря о «силе» зависимости между случайными величинами, мы имеем в виду следующее. Самая сильная зависимость —функциональная, а из функциональных — линейная зависимость, когдаξ = aη + b п. н.
Бывают гораздо более слабые зависимости. Так, если попоследовательности независимых случайных величин ξ1 , ξ2 , . . . построить величины ξ = ξ1 + . . . + ξ24 + ξ25 и η = ξ25 + ξ26 + . . . + ξ90 , то этивеличины зависимы, но очень «слабо»: через единственное общее слагаемое ξ25 . Сильно ли зависимы число гербов в первых 25 подбрасыванияхмонеты и число гербов в испытаниях с 25 -го по 90 -е?Итак, следующая величина есть всего лишь ковариация, нормированная нужным образом.§ 2.
Коэффициент корреляцииО п р е д е л е н и е 40. Коэффициентом корреляции ρ(ξ, η) случайныхвеличин ξ и η, дисперсии которых существуют и отличны от нуля, называется числоcov(ξ, η)ρ(ξ, η) = p p.DξDηЗ а м е ч а н и е . Чтобы разглядеть «устройство» коэффициента корреляции, распишем по определению числитель и знаменатель:E (ξ − E ξ)(η − E η)ρ(ξ, η) = q2 q2 .E ξ − EξE η − EηПеред нами — «косинус угла» между двумя элементами ξ − E ξ и η − E ηгильбертова пространства, образованного случайными величинами с нулевым математическим ожиданием и конечным вторым моментом, снабженного скалярным произведением cov(ξ, η) и «нормой», равной корнюиз дисперсии, или корню из скалярного произведения cov(ξ, ξ).П р и м е р 65.
Рассмотрим продолжение примера 64, но пусть ξ и ηбудут не только независимыми, но и одинаково распределёнными случайными величинами, и их дисперсия отлична от нуля. Найдём коэффициенткорреляции величин ξ и ξ + η :cov(ξ, ξ + η)Dξ1Dξρ(ξ, ξ + η) = p q= p p= p p= √ .2Dξ Dξ + DηD ξ 2D ξD ξ D (ξ + η)Коэффициент корреляции величин ξ и ξ + η равен косинусу угла 45◦ ,образованного «векторами» ξ и ξ + η, когда ξ и η «ортогональны» и их«длина» одинакова.105§ 2. Коэффициент корреляцииУ п р а ж н е н и е . Чтобы аналогия не заходила слишком далеко, и учитателя не возникло искушения любые случайные величины рисоватьстрелочками на плоскости и вместо подсчёта математических ожиданийизмерять углы, полезно убедиться, например, что коэффициент корреляции величин ξ и ξ2 равен:а) нулю, если ξ имеет нормальное распределение с нулевым средним;√б) 2/ 5, если ξ имеет показательное распределение.Т е о р е м а 33.