ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 24
Текст из файла (страница 24)
Вероятность рождения мальчика равна 0,514.Определить вероятность того, что доля мальчиков среди 400новорожденных будет отличаться от вероятности рождения мальчика неболее чем на 0,05 в ту или другую сторону.137Решение. Рождение ребенка можно рассматривать как независимыйопыт с вероятностью «успеха» p = 0,514 (по данным статистики на каждуютысячу новорожденных приходится 514 мальчиков).
Тогда по формуле(2.13.1)æö0,052F ç =0,9545.Р (| k / n – 0,514| < 0,05)==÷ 2F(2,0004)×0,5140,486/400èøОтвет. 0,9545.Пример 2.82.2. Вероятность события P ( A) = p = 0,9. Скольконезависимых опытов нужно проделать, чтобы с вероятностью 0,95 бытьуверенным, что частота появления события в этих опытах будет отличатьсяот вероятности события не более чем на 0,05 в ту или другую сторону?Решение. Запишем формулу (2.13.1) для нашего случая:æöæ kö0,05P ç - 0,9 < 0,05 ÷ 2F ç =÷ = 0,95.×0,90,1/nè nøèøПо таблице функции Лапласа находим, что 2F(1,96) = 0,95.
Поэтому0,05× 0,05 × n / 0,3 = 1,96. Откуда n » 138,3. Условия задачи выполняютсяпри n ³ 139.Ответ. n ³ 139.Задача 2.82. Монету подбрасывают n раз. Какова вероятность того,что частота выпадения герба будет отличаться от вероятности выпадениягерба не более, чем на a в ту или другую сторону. Сколько раз нужноподбросить монету, чтобы с вероятностью P можно было утверждать, чточастота выпадения герба будет отличается от вероятности выпадения гербане более чем на a в ту или другую сторону? (См.
примеры 2.82.1, 2.82.2 иисходные данные.)Исходные данные к задаче 2.82.№naP№naP№naP1256 0,02 0,911841 0,03 0,97 21 400 0,03 0,952289 0,01 0,95 12900 0,05 0,98 22 441 0,06 0,963324 0,03 0,96 13961 0,10 0,99 23 484 0,10 0,974361 0,05 0,97 14 1024 0,03 0,90 24 576 0,10 0,995400 0,04 0,98 15 1225 0,04 0,95 25 676 0,04 0,956484 0,03 0,99 16 1600 0,02 0,96 26 729 0,10 0,967576 0,05 0,90 17256 0,04 0,97 27 641 0,10 0,988676 0,02 0,95 18289 0,03 0,98 28 900 0,10 0,959729 0,05 0,96 19324 0,02 0,99 29 961 0,10 0,99910 784 0,02 0,97 20361 0,04 0,90 30 1024 0,04 0,991382.14. КовариацияВажную информацию о системе случайных величин ( X , Y ) дают еечисловые характеристики.
К ним относятся математические ожиданиякаждой из величин M ( X ) = mx и M (Y ) = mу . Пара чисел mx и mу указываетна плоскости координаты средней точки, относительно которойпроисходит рассеяние положений случайной точки ( X , Y ) . ДисперсииoD( X ) = s = M ( Х )2х2иoD (Y ) = s = M (Y 2 )2ухарактеризуютразбросположений случайной точки вдоль соответствующих координатных осей.Для характеристики зависимости между Х и Y используют величинуs хуooХ Y)cov( X=,Y ) М ( =M [(=X – mx )(Y – m у )],которая называется ковариацией или ковариационным моментом.
Заметим,oчто cov( X , X ) = =M ( Х 2 ) s2х . Из определения ковариации следует, чтоcov( X ,Y ) = M [ XY – Xmу - Ymx + mx m у ] = M ( XY ) – M ( X ) M (Y ),откудаM ( XY ) = M ( X ) M (Y ) + cov( X , Y ).Кроме того D ( X ± Y ) D=( X ) + D (Y ) ± 2cov( X , Y ).Если случайные величины X и Y независимы, то их ковариация равнанулю и тогдаM ( XY ) = M ( X ) M (Y ) и D ( X ± Y ) D=( X ) + D (Y ).Ковариация содержит информацию о зависимости междувеличинами.
Но значение sху изменяется при изменении единиц измеренияX и Y. Поэтому для характеристики зависимости между величинами удобнорассматривать величинуoocov( X ,Y )M ( X Y ) M ( XY ) - M ( X ) M (Y )rx у ===,(2.14.1)s X sYs X sYD ( X ) D (Y )которая называется коэффициентом корреляции величин X и Y.Величины D( X ) = s2х , , D (Y ) = s 2у и cov( X ,Y ) характеризуют разбросположений случайной точка на плоскости. Эти числовые характеристикипринято записывать в виде матрицыæ s 2Xcov( X ,Y ) ö(14.2)çç÷÷ ,2cov(X,Y)sèYøкоторую называют ковариационной матрицей системы случайных величин(X,Y).1392.14.1.
Корреляционная зависимостьНаиболее простой и известной формой зависимости междувеличинами является функциональная зависимость, при которой каждомузначению аргумента соответствует строго определенное значение функции.Функциональная зависимость может быть и между случайнымивеличинами. Существует иной, широко распространенный в природе, типзависимости между случайными величинами.
Эта зависимость проявляетсяв том, что закон распределения одной случайной величины изменяется приизменении другой. Такая зависимость называется статистической.Следует заметить, что функциональная зависимость бывает лишь втеоретических построениях или в условиях специально подготовленныхопытов.
Физический опыт в том и состоит, что исследователь старается повозможности исключить влияние всех посторонних факторов и наблюдатьзависимость в чистом виде.Явления окружающего нас мира взаимосвязаны и воздействие однойпеременной на другую происходит при одновременном воздействиимножества других переменных, поэтому даже функциональныезависимости проявляются как зависимости статистические.Итак, при статистической зависимости изменение одной величиныприводит к изменению закона распределения другой.
Если Y –– дискретнаяслучайная величина, то это означает, что при каждом фиксированномзначении X = x имеется набор возможных значений y и соответствующихим вероятностей p ( y / x) = P(Y = y / X = x). Последним обозначениемподчеркивается, что речь идет о событии Y = y при условии, чтопроизошло событие X = x .Набор возможных значений y и соответствующих им условныхвероятностей образует условный закон распределения ( å р( у /х) = 1 ).уДля непрерывной случайной величины можно ввести понятиеусловной функции распределения или условной плотности вероятности.Если рассмотреть вероятности событийA= {x < X < x + dx}иB = { y < Y < y + dy}, то по аналогии с теоремой умножения вероятностейсобытий можно получить для условной плотности вероятности f ( y / x)соотношение f ( x, y ) = f1 ( x ) f ( y / x), где f ( x, y ) –– плотность вероятностисистемы ( X , Y ) , а f1 ( x) –– маргинальная плотность вероятности случайнойвеличины X.
Из этого соотношенияf ( x, y )f ( x, y )=¥.f ( y / x) =f1 ( x)ò f ( x, y)dy-¥140На протяжении этого раздела будем проводить выкладки только длядискретных случайных величин. Для непрерывных случайных величин всерассуждения и выводы останутся в силе, если заменить суммы наинтегралы, а вероятности на плотности вероятности.Статистическая зависимость сложна для изучения. Труднопроследить за изменением всего закона распределения сразу. Прощесосредоточиться на изучении изменения числовых характеристик, в первуюочередь математического ожидания. Условный закон распределения имеетчисловые характеристики такие же, как и обычные законы распределения.В частности, М (Y / х) = å ур( у / х) –– для дискретной случайной величиныуназывают условным математическим ожиданием, или средним значением Yпри заданном значении X = x .
Для непрерывной случайной величины его¥вычисляют в виде M (Y / x) =ò уf ( у / х)dу. Если условные математические-¥ожидания при разных значениях X соединить, то получится линия,называемая линией регрессии Y на X. Уравнение этой линии называютуравнением регрессии Y на X (см. рис. 2.14.1, на котором точками показанывозможные значения двумерной случайной величины ( X , Y ) ).Рис. 2.14.1Корреляционной зависимостью Y от X называется функциональнаязависимость условного среднего значения Y от X. Графикомкорреляционной зависимости служит линия регрессии. Например, ростчеловека X и его вес Y связаны статистической зависимостью.
Для каждогозначения роста существует целое распределение возможных значений веса.Между этими величинами существует и корреляционная зависимость,которая для людей зрелого возраста выражается известной формулой:Y (кг) = X (см) – 100.Вместе с изменением условного среднего значения может изменятьсяи разброс Y относительно условного среднего значения. При каждом141значении X = x можно вычислить дисперсию соответствующих значенийY. Эту дисперсию называют условной дисперсией.
Например, длядискретной случайной величины условная дисперсия равна2s 2 (Y / x=) å [ y - М (Y / x)] p ( y / x).yВсякую зависимость изучают для того, чтобы уметь по известномузначению одной величины предсказывать значение другой. Пристатистической зависимости между величинами можно использовать дляпрогноза линию регрессии. Если стало известно, что X = x , то в качествепредполагаемого значения Y можно назвать соответствующее условноесреднее значение M (Y / x) , т.е.