Лекционный курс в ПДФ (1119925), страница 8
Текст из файла (страница 8)
Приведём доказательство дляслучайной величины x*.æ N - MN ö 11÷=MN * = M çMN - M MN =MN - MN = 0ç I÷ IINNNèøæ D - MD ö÷ = 1 DD - MD = DD = 1DN * = Dç2ç I÷ I 2INNNèøКовариация x* и h* называется коэффициентом корреляции случайныхвеличин x и h (обозначается rND).æ N - MN D - MD ö M N - MN D - MD ÷=×covN , D = HND = M ç=ç I÷IIINDN DèøcovN ;D M ND - MNMD==; s N = Dx ; s D = Dh.I NIDI NIDДля независимых x и h rND=0, так как в этом случае cov(x;h)=0Обратного заключения сделать нельзя.
Случайные величины могут бытьсвязаны даже функциональной зависимостью (каждому значению однойслучайной величины соответствует единственное значение другой случайнойвеличины), но коэффициент их корреляции будет равен нулю.Примеры:1. Пусть случайная величина x симметрично распределена около нуля.Тогда Мx=0. Пусть h=x2. Тогда М(x h)=М(x3)=0, так x3 тоже симметричнораспределена около нуля. С другой стороны МxМh=0, так как Мx=0. ТакимM ND - MNMD= 0.образом HND =INIDЛекция 9442. Пусть закон совместного распределения случайных величин x и h задантаблицейh12x11/501/5203/53/531/501/52/53/5Проведём вычисления:13123 8MN = 1 × + 2 × + 3 × = 2 ; MD = 1 × + 2 × = ;55555 5131 16MND = 1 × 1 × + 2 × 2 × + 3 × 1 × = ; MND - MNMD = 0 .555 5Отсюда следует, что rND=0.
При этом очевидно, что имеет место функциональная зависимость случайной величины h от случайной величины x.Коэффициент корреляции rND не меняет своей величины, если вместослучайной величины x рассматривать случайную величину x1=x+à или x2=kx (àиk—постоянные числа, k > 0), так как при перемене начала координат илипри изменении масштаба величины x нормированное отклонение не меняется.Сказанное в равной мере относится и к h.Вставка! Полезно запомнить формулуD(x±h)=Dx+Dh+2cov(x;h)Отсюда следует свойство дисперсии для независимых x и h:D(x±h)=Dx+DhСвойства коэффициента корреляции.1.–1£rND£12.Если rND=1, то h=kx+b, где k и b—константы, k>0.3.Если rND= –1, то h= kx+b, где k<0.4.Если h=kx+b, (k¹0) или x=k1h+b1, тоrND=1 при k>0rND= – 1 при k<0.Коэффициент корреляции rND достигает своих предельных значений –1 и 1в том и только в том случае, если совместное распределение x и h всеконцентрируется на некоторой прямой в плоскости x; h, то есть между x и hимеется такая линейная зависимость.Если êrNDê<1, то такой линейной зависимости нет.
Все же по мереприближения êrNDê к единице совместное распределение x; h имеет тенденциюконцентрироваться вблизи некоторой прямой линии и величину êrNDê можносчитать мерой близости к полной линейной зависимости между x и h.Лекция 945Пример. Рассчитаем коэффициент корреляции rND для случайныхвеличин при заданном законе совместного распределения123hx101/36001/36202/361/3603/36302/362/362/366/36401/369/3616/3626/366/3612/3618/3613626MN = 10 × + 20 × + 30 × + 40 ×@ 35,833636363661218MD = 1 × + 2 × + 3 ×@ 2,3363636136222DN = 10 - 35,83 × + 20 - 35,83 × + 30 - 35,83 × +3636362 26+ 40 - 35,83 ×@ 57,6436sN @ 7,6622 122 18DD = 1 - 2,3 × + 2 - 2,3 × + 3 - 2,3 ×@ 0,556363636sD @ 0,74622121M ND = 10 × 1 × + 20 × 1 × + 20 × 2 × + 30 ×1 × + 30 × 2 × +363636363616912+ 30 × 3 × + 40 × 1 × + 40 × 2 × + 40 × 3 × = 86,943636363686,94 - 2,3 × 35,83HN D =@ 0,87,6 × 0,746Введем понятие корреляционной зависимости между x и h.Пусть задан закон совместного распределения двух случайных величин x иh (как в вышеприведенном примере), и условное математическое ожидание xменяется в зависимости от значения h.
Тогда принято говорить окорреляционной зависимости x от h. Если условное математическое ожиданиеx есть линейная функция от h, то между x и h имеется линейнаякорреляционная связь или зависимость.Как правило, говоря о корреляционной зависимости, имеют в видулинейную корреляционную зависимость. Если имеется в виду нелинейнаякорреляционная зависимость, то это особо оговаривают.Можно дать определение корреляционной зависимости двух случайныхвеличин x и h как связи между тенденциями роста x и h. Например, между x иh существует прямая корреляционная зависимость, если с ростом x случайнаяЛекция 946величина h имеет тенденцию возрастать. (Это означает, что при большихзначениях x с большей вероятностью встречаются большие значения h).
Еслибольшим значениям x ñ большей вероятностью соответствуют меньшиезначения h, то есть с ростом x случайная величина h имеет тенденцию убывать,говорят, что между x и h существует обратная корреляционная зависимость.Глубина (или теснота) корреляционной зависимости (или связи)характеризуется коэффициентом rND. Чем ближе êrND ê к единице, тем теснееглубина корреляционной зависимости.Чем ближе зависимость между условным математическим ожиданием x ислучайной величиной h к линейной, и чем теснее значения x группируютсяоколо условных математических ожиданий, тем глубже (теснее)корреляционная связь.Можно говорить о совместном распределении двух непрерывныхслучайных величин.
В большинстве случаев возможен переход от непрерывныхслучайных величин к совместному распределению двух дискретных случайныхвеличин следующим образом.Нужно разбить отрезок [a; b] изменения случайной величины x на равныеотрезки [c0=a; c1]; [c1; c2]; [c2; c3],¼,[cn-1; cn=b]. За значение случайной величиныx принять середину каждого отрезка.Также надо поступить со случайной величиной h, разбив ее областьзначений [e; f] на равные отрезки [g0 = e; g1]; [g1; ge]…[gk-1; gk=f], и приняв завозможные значения h середины отрезков [gk-1; gk].
Таким образом мыполучили дискретные случайные величины x*={x1; x2; …xn} и h*={y1; y2; …yk},причем каждой паре (xi; yj) ставится в соответствие вероятностьPij = P((xÎ[ci–1; ci])∩(hÎ[gi–1; gi]))Таким образом мы придем к уже изученному материалу.Лекция 10.Распределение ?2.Пусть имеется n независимых случайных величин x1, x2, ..., xn,распределенных по нормальному закону с математическим ожиданием,равным нулю, и дисперсией, равной единице. Тогда случайная величинаnc 2 = å xi2распределена по закону, который называется “распределениеi =1c2” или “распределение Пирсона”. Очевидно, что она может приниматьлишь неотрицательные значения. Число n называется числом степенейсвободы.При n > 1 график плотности распределенияслучайной величины c2 представляет собойкривую, изображенную на рисунке 1.Для того, чтобы определить вероятностьпопадания случайной величины c2 в какой-либопромежуток из множества положительных чисел, пользуются таблицейраспределенияc2 .Обычнотакаятаблицапозволяетq0,990,9750,95...0,10,050,0110,03150,03980,0239...2,713,846,63........................102,563,253,94...16,018,323,2........................nТаблица 1.по вероятности q и по числу степеней свободы n определить такназываемый квантиль cq2, если q и cq2 связаны соотношениемP(c2 > cq2) = q.Эта формула означает: вероятность того, что случайная величина c2примет значение, большее чем определенное значение cq2, равна q.Таблица 1 представляет собой фрагмент таблицы распределения c2.Из него видно, что случайная величина c2 с 10-ю степенями свободы с47Лекция 10.вероятностью q = 0,95 принимает значение, большее 3,94, а та же величинас одной степенью свободы с вероятностью q = 0,975 превышает 0,00098.Задача.
Найти интервал (c12, c22), вкоторый случайная величина c2 с 10-юстепенямисвободыпопадаетсвероятностью, равной 0,9.Решение.Графикплотностираспределения c2 с 10-ю степенямисвободы схематично изображен нарисунке 2. Будем считать, что площади заштрихованных областей (праваяобласть не ограничена справа) равны между собой. Примем условия:P(c2 < c12) = P(c2 > c22) = (1 - 0,9)/2 = 0,05,(1)тогда P(c12 < c2 < c22) = 0,9.Равенства (1) сразу позволяют по таблице определить: c22 = 18,3. Дляопределения левой границы интересующего нас интервала придетсявоспользоваться очевидным равенством P(c2 > c12) = 0,95.
Из таблицы 1.определяем: c12 = 3,94 , и теперь можно сформулировать ответ задачи:значение случайной величины c2 с вероятностью 0,9 принадлежитинтервалу (3,94; 18,3).Распределение Стьюдента.Многие задачи статистики приводят к случайной величине видаt=N k,Dгде x и h – независимые случайные величины, причем x – нормальнораспределенная случайная величина с параметрами Mx = 0 и Dx = 1, а hраспределена по закону c2 c k степенями свободы.Закон распределения случайной величины t называется закономраспределения Стьюдента с k степенями свободы.48Лекция 10.График плотности распределения длязакона Стьюдента схематически изображен нарисунке 3.