В.Ю. Королев - Теория вероятностей и математическая статистика (1115266), страница 11
Текст из файла (страница 11)
раздел 2.3.2), юторые стохастически иезависимы, ио при этом смзаиы фуикциоиальиой зависимостью. 1.5.2. Ковариициц. Коэффициент корреляции Наряду с числовыми характеристиками центра и разброса можно ввести числовые характеристики взаимозависимости случайных величин. Опридилйиий 5.2.1. Пусть Х и У вЂ” случайиые величины. Число сот(Х, У) = Е((Х вЂ” ЕХ)(у — ЕК)] называется ковариацией случайных величин Х и У. Ковариацию удобно вычислять по формуле сои(Х, Т) = ЕХУ вЂ” ЕХ ° ЕУ.
Если ювариация случайных величин Х и У положительна, то в средием, при многократном воспроизведении стохастической ситуации, отклоиеиие случайной величины Х от своего среднего зиачеиия в ббльшую 1.5. Незаеипиикть елучаяньи величин 56 Пвимн 5.2.1. Рассмотрим случайные величины Х и У, совместное распределение вероятностей которых задается следующим соотношением Р(Х=О;У=1) =Р(Х = Р(Х 0;У=-1) — 1; У = 0) = Р(Х = 1; У = 0) Гг/г; У = /2/г) —./2/2; У = ./2/г) ~Г2/2; У = -~/2/2) — Гг/г;У=- Гг/г) =-,'. = Р(Х = Р(Х = Р(Х = Р(Х сторону влечет одновременное отклонение случайной величины У от своего среднего значения также в большую сторону и отклонение случайной величины У от своего среднего значения в ббльшую сторону влечет одновременное отклонение случайной величины Х от своего среднего значения также в ббльшую сторону. В то же время отклонение случайной величины Х от своего среднего значения в меньшую сторону влечет одновременное отклонение случайной величины У от своего среднего значения также в меньшую сторону и отклонение случайной величины У от своего среднего значения в менылую сторону влечет одновременное отклонение случайной величины Х от своего среднего значения также в меньшую сторону.
В таком случае говорят, что случайные величины Х и У наложительно коррелированы. Бели же ковариация случайных величин Х и У отрицательна, то зти случайные величины в среднем, при мнопжратном воспроизведении сгохастической ситуации, отклоняются от своих средних значенвй в разные стороны. В таком случае пвюрят, что случайные величины Х и У отринатвлъно коррвиированы. Бели спч(Х, У) = О, то говорят, что случайные величины Х и У нвкоррвлнровинн. Непзррелированиосп является более слабым свойством случайных величин, чем их независимосп. Действительно, легю видеть, что, если случайные величины' Х и У независимы, то сом(Х, У) = О. Однако обратное утверждение неверно: вз равенства нулю ковариации .
случайных величин не следует их независимость. В зтом нас убеждает следующий пример. Несложно видеть, что при этом ЕХУ = 0 ° й+О ° я+0 ° 1+О ° 1+ й ° й — 2 ° — — ц ° х+ 2 ° к — — О. 1 1 1 ! 1 1 1 1 1 1 1 1 В то же время ЕХ=О, ЕУ=О. Таким образом, соч(Х,У) = ЕХУ вЂ” ЕХ ЕУ = 0 то есп, случайные величины Х и У неюррелнрова1ш. Однаю мы заме- чаем, что, например, 0 = Р(Х = 0; У = 0) -,Ь Р(Х = 0) Р(У = 0) = и, то есть случайные величины Х и У не являя!гол независимыми.
Более того, случайные величины Х и У связаны жестюй функциональной зависимостью Х'+У'=1. Для дисперсии суммы двух случайных величин справедлива формула 0(Х+ У) = ОХ+ ОУ+ 2соч(Х, У). Отсюда вытекает, что дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых. Ковариация не является безразмерной и ее величина зависит от того, какими единипдми измериотся рассматривамые случайные величины. Другими словами, по величине ювариации нельзя судить о том, насюлью тесна взаимосвязь (взаимозависимость) случайных величин. Чтобы обойти зто препятствие, рассмотрим ел1е одну характеристику.
К 5.2. Коеориациа Коэффициент норреэяции Р(Х = -1) = Р(Х = 1) = Р(У = — 1) = Р(У = 1) Р(Х = 0) = Р(У = 0) Р(Х =.Г2!2) = Р(Х = —.Г~!2) = Р(У =.Г~!2) = Р(У = ~/2!2) 1 = ф~ 1 1 4' 58 Ь б. Иск иыыы(ыя Юерыухлы Опрндвлннин 5.2.2. Число ог(х, х( х=д(х,У] ох ох называется коэффициентом корреляции случайных величин Х и У.
Можно показать, что всегда !р(Х, У)1 ( 1. Более того, если ~р(Х, У)~ = 1, то случайные величины Х и У связаны линейной зависимостью: существуют числа а и Ь такие, что Р(У = аХ + Ь) = 1. При этом, если р = 1, то а > О, а если р = -1, то а < О. Бели случайные величины Х и У независимы, то, очевидно„р = О. Таким образом, можно сказать, что величина коэффициенте корреляции характеризует степень линейной зависимости. Близость коэффициента коррелщии к единице означает лишь наличие статистической взаимосвази, но никак не может бъпь использована для выявления направления причинно-следственной взаимосвязи. Например, коэффициент корреляции между числом пожаров в наугад выбранном районе большого города за год и числом пожарньгх частей, расположенном в этом районе, как правило, доволъно велик (например, для Ньюйорка он приблизительно равен 0,8).
Но зто совсем не означает, что чем болъше пожарных частей, тем больше пожаров. Другой пример. В Голландии значение коэффициента корреляции между числом новорожденных за год и числом гнезд аистов в соответствующем районе довольно близко к единице ( - 0,8). Однако мы не можем использовать это обстожтельство для обоснования теории о том, что детей приносят аисты.
Обьяснение здесь, увы, другое. Дело в том, что, в Голландии вообще рождаемость низка и, как правило, дети рождаются в молодых семъях, а молодые семън поселяются в отдельных новых домах, на крышах которых и вьют свои гнезда аисты. 1лз. Испытания Бернулли Рассмотрим последовательность однотипных случайных экспериментов (испытаний), в каждом из воторых возможны лишь два взаимоисключающих исхода. Условимся называть эти исходы "успех'* и "неудача". Пусп вероятность успеха одинакова для каждого испьпания и равна 1.6. Иенытанел Бернулен р, 0 < р < 1. С этими испытаниями свяжем случайные величины Хь..., Х„по следующему правилу. Если в А-м испытании зафиксирован успех, то Хь = 1, а если в й-м испытании зафиксирована неудача, то Хь = О, й = 1,..., и.
При этом, очевидно, все случайные величины Х!,... „Х, имеют одинаювое распределение: Р(Ха = 1) р = 1 — Р(Хг = О), й = 1,..., л. (6.1.1) Предположим, что рассматриваемые дихотомические испытани» независимы в том смысле, что случайные величины Хп..., Х„независимы в совокупности. Испытания, удовлетворяющие указанным условиям, называются испытаниями Бернулли. ЗАдАчА 6.1.1. Набранную книгу независимо друг от друга вычитывали два корректора. Первый юрреатор обнаружил т1 опечаток, второй заметил тз опечаток. При этом т опечатох оказались обнаруженными и первым, и вторым корреаторами. Сюлью опечаток остались незамеченными? Во-первых, казалось бы, имеющихся данных недостаточно, чтобы отвеппь на поставленный вопрос.
Действительно, как же можно подсчитать число объектов (в данном случае — оставшихся опечаток), о которых достоверно не известно, существуют они или нет! Во-вторых, ясно, что формулировха задачи не имеет строгого математичесюго вида, заранее предполагающего выбор юнкретиой математической модели, описывающей процесс отыскания опечаток. Такая ситуация, в отличие от подавляющего большинства задач, вюпочаемых в задачники по теории вероятностей, типична для практики, югда перед тем, как решить задачу, исследователь должен ее аккуратно сформулировать на математическом языке, выбрав конкретную математическую модель.
Сформулированная задача интересна тем, что показывает, как за счет выбора довольно разумной и естественной математичесюй модели можно юмпенсвровать недостаток информации и найти приемлемое решение задачи, то есть сделать на первый взгляд неразрешимую задачу вполне решаемой. Сначала заметим, что общее число замеченных опечаток равно т1+ та — т (так как опечатан, замеченные обоими юррехторами одновременно, входят как в число опечаток, замеченных первым юрреатором, ь 6. нснвиваюи Бериулаа так и число опечапж, замеченных вторым корректором, то, чтобы не считать каждую такую опечатку дважды, нз суммы т1 + тз нужно вычесть т, сравните это выражение с формулой для объединения множеств в разделе 1.2.2).
Чтобы репппь задачу, мы должны сделать дополнительные предположения и попытаться построить математическую модель (которая не должна входить в противоречие с представлением о процессе работы корректоров, основанным на здравом смысле). Итак, предположим, что первый корректор находит очередную опечатку вне зависимости, нашел он предыдущую опечатку или пропуспш ее. При этом будем считать, что для первого корректора возможности обнаружения кюкдой опечатки одинаковы и зависят от его квалификации. Таким образом, процесс вычитки кнюи первым корректором мажет быль описан последовательностью испытаний Бернулли с вероатностью успеха в отдельном испытании (обнаружения очередной опечатки) равной, скажем, рь Аналогично, процесс вычитки книги вторым зюрректором может быть описан последовательностью испытаний Бернулли с вероятностью успеха в отдельном испытании равной рз.
С этими двумя последовательностями испытаний Бернулли свпкем третью, описывающую процесс вычнзкн внип~ обоими корректорами. Для каждой опечатки возможны следующие васапшты: ° ее не заметил ни первый, ни второй ксрректс; ° ее заметил первый корректор, но не заметил второй; ° ее замепш второй корректор, но не заметил первый; ° ее заметили оба корректора. Так как по условию задачи корректоры работают независимо друг от друпь то перечисленные вьппе варианты имеют вероятности (1- р1) (1- рз), р1(1- рз), (1- р1) рз, р1 рз соответственно.
Так как в условии задачи фигурирует число опечаток, замеченных обоими корректорами одновременно, наряду с описанными выше двумя последовательностями испытаний Бернулли рассмотрим третью, в которой вероятность успеха в отдельном испытании (обнаружение опечатки обоими корректорами) равна р1рз.
Общее количество опечаток в книге обозначим л. Понятно, что зто число равно величеству испьпаний Бернулли в каждой из трех указанных выше серий. 61 1.б.!. Баиаеиааьное раещмдеаание Интунгнвно ясно, что теоретнческаа вероатнос1ь успенв в каждом нз л нспытаннй Бернулли примерно равна отношению числа зарегнстрнрованных успехов к общему числу испытаний. Более строго в этом можно убедиться на основании закона болыпнх чнсел (см.
раздел 1.8); такие см. задачу о рейтинге в разделе 2.2.4. Более того, можно замеппь, что указанное отношение являетсл нанболее правдоподобной оценкой теоретнческой вероятностн успеха (см. раздел 2.4. 1). Таким образом, нспользуя условна задачи н для удобства запнсн заменяя прнблнженные равенства строгими, мы прнходнм к системе следующнх уравнений: л$1 Р1 = л Л1 Р1Р2 = л В этой системе трн уравнения н трн неизвестных: и, р1 н )~. Репыл зту систему, мы получаем Л1 1Ш2 а=в л л3 Р1 = л12 Таяны образом, В кннГО осталось Л11Л12 — — л11 — л12 + л1 л опечапж.