Теория вероятностей и математичкеская статистика (1118815), страница 7
Текст из файла (страница 7)
В этомслучаеМ(ХY) = М(Х) М(Y).Ковариация двух случайных величин характеризует как степень зависимостислучайных величин, так и их рассеяние вокруг точки (mx , m y ).Свойства ковариации случайных величин:1. C xy M ( XY ) M ( X ) M (Y ).ЗдесьmnM ( XY ) xi yi piji 1 j 1для дискретных случайных величин Х и Y и M ( XY ) xyf ( xy )dxdy для непрерывных величин.2. Ковариация двух независимых случайных величин равна нулю, т.е.Сху = 0.3.
Ковариация двух случайных величин по абсолютной величине не превосходит произведения их средних квадратических отклонений, т.е.C xy x y .Для характеристики связи между величинами Х и Y рассматривается так называемый коэффициент корреляции45rxy C xyx y,являющийся безразмерной величиной.Свойства коэффициента корреляции:1. Коэффициент корреляции удовлетворяет условию: 1 rxy 1.2.
Если случайные величины Х и Y независимы, то rxy = 0.3. Если случайные величины Х и Y связаны точной линейной зависимостьюY aX b, то rxy sgn a, т.е. rxy = 1 при а > 0 и rxy = –1 при а < 0.Пример. В двух ящиках находятся по шесть шаров; в первом ящике: 1 шар с№1, 2 шара с №2, 3 шара с №3; во втором ящике: 2 шара с №1, 3 шара с №2, 1шар с №3. Пусть Х – номер шара, вынутого из первого ящика, Y – номер шара,вынутого из второго ящика. Из каждого ящика вынули по шару. Составитьтаблицу закона распределения системы случайных величин (X, Y). Найти математические ожидания и дисперсии случайных величин X и Y. Определитькоэффициент корреляции.Решение.Случайная точка (1, 1) имеет кратность 1 2 = 2;– // –(1, 2)– // –1 3 = 3;– // –(1, 3)– // –1 1 = 1;– // –(2, 1)– // –2 2 = 4;– // –(2, 2)– // –2 3 = 6;– // –(2, 3)– // –2 1 = 2;– // –(3, 1)– // –3 2 = 6;– // –(3, 2)– // –3 3 = 9;– // –(3, 3)– // –3 1 = 3.Всего случайных точек 6 6 = 36 (n-кратную точку принимаем за n точек).
Таккак отношение кратности точки ко всему количеству точек равно вероятностипоявления этой точки, то таблица закона распределения системы случайныхвеличин имеет видY123X4611/181/121/3621/91/61/1831/61/41/12Сумма всех вероятностей, указанных в таблице, равна единице.Найдём математические ожидания случайных величин X и Ymx 1111111111 7 2 3 1 2 3 1 2 3 ;18961264361812 3my 1 111111111 11 2 3 1 2 3 1 2 3 .18123696186412 6Точка (7/3; 11/6) является центром рассеивания для заданной системы (X, Y).Так как случайные величины X и Y независимы, то математические ожиданияmx и my можно подсчитать проще, используя ряды распределения:хi123yi123pi1/61/31/2pi1/31/21/6Отсюда находимmx pi xi 1 2 3 711 11 , m y pi yi 1 .6 3 2 332 6От системы величин (X, Y) перейдём к системе центрированных величин( X , Y ), где X X m X 7 / 3, Y Y m Y 11/ 6.
Составим таблицуxyY–5/61/67/6–4/31/181/121/36–1/31/91/61/182/31/61/41/12XИмеем2222 4 1 1 1 2 1 4 1D( X ) 3 18 3 9 3 6 3 1222222 1 1 2 1 4 1 1 1 2 1 5 ; 3 6 3 4 3 36 3 18 3 12 9472222 5 1 5 1 5 1 1 1D(Y ) 6 18 6 9 6 6 6 1222222 1 1 1 1 7 1 7 1 7 1 17 . 6 6 6 4 6 36 6 18 6 12 36Отсюда x 5 / 3, y 17 / 6.Заметим, что D( X ) и D(Y ) можно найти по формуламD( X ) M ( X 2 ) [ M ( X )]2 , D(Y ) M (Y 2 ) [ M (Y )]2 .Для нахождения коэффициента корреляции воспользуемся таблицей распределения системы ( X , Y ) центрированных случайных величин.Определим ковариацию: 4 5 1 4 1 1 4 7 1 1 5 1C xy 3 6 18 3 6 12 3 6 36 3 6 9 1 1 1 1 7 1 2 5 1 2 1 1 2 7 1 3 6 6 3 6 18 3 6 6 3 6 4 3 6 124 517 1 517 2 517 3 108 72 216 3 54 36 108 3 36 24 72 412 0 0 0 0.333Так как Cxy = 0, то и коэффициент корреляции rxy = 0.Этот же результат мы могли получить и не определяя ковариации Cxy.
Действительно, полагая Y = 1, получаем, что значение Х = 1 повторяется 2 раза,значение Х = 2 – 4 раза, а значение Х = 3 – 6 раз. Значит при Y = 1 получаемряд распределения случайной величины Х:хi123pi1/61/31/2Если Y = 2, то значение Х = 1 повторяется 3 раза, значение Х = 2 – 6 раз, азначение Х = 3 – 9 раз. Следовательно, при Y = 2 получается ряд распределения случайной величины Х:хi123pi1/61/31/248Наконец, если Y = 3, то значение Х = 1 повторяется 1 раз, значение Х = 2 –2 раза, а значение Х = 3 – 3 раза. Ряд распределения случайной величины Хпри Y = 3 имеет видхi123pi1/61/31/2Итак, при различных значениях Y получаем один и тот же ряд распределенияслучайной величины Х.
Так как ряд распределения случайной величины Х независит от значений случайной величины Y, то случайные величины Х и Yнезависимы. Отсюда следует, что коэффициент корреляции равен нулю.Пример. Система случайных величин (X, Y) подчинена закону распределенияс плотностью a( x y ) в области D;f ( x, y ) вне этой области.0Область D – квадрат, ограниченный прямыми х = 0, х = 3, у = 0, у = 3. Требуется: 1) определить коэффициент а; 2) вычислить вероятность попаданияслучайной точки (X; Y) в квадрат Q, ограниченный прямыми х = 1, х = 2, у = 1,у = 2; 3) найти математические ожидания mx и my; 4) найти средние квадратические отклонения x и y.Решение. 1.
Коэффициент а находим из уравнения33a ( x y )dxdy 1, откуда0033333y2 9a ( x y )dxdy a xy dx a 3x dx 2 20000039 13 27 27 a x 2 x a 27a, 27a 1, т.е. a .2222270222. P ( X ; Y ) Q 1( x y )dxdy 27 1 12221 y2 1 1 xy dx 2 x 2 x dx 27 1 2 27 1 2149221 31 x2 3x 1 1 3 1 x dx 23 .27 1 227 2227 2 2 913. Находим математические ожидания mx и my; имеем3mx 33311 2xy 2 x ( x y )dxdy x y dx 27 0 027 0 2 0331 2 9 1 3 9 21 81 7x x 3х х dx 27 .27 0 2 27 4 0 27 4 47Следовательно, и my .44.
Находим средние квадратические отклонения x и y:2332x ( x mx )2 f ( x, y )dxdy D23317 77 x x y dydx 27 0 0 4 4433317 x ( x y )dydx 27 0 0 4332321717 7 x dydx x y dydx 27 0 0 427 0 0 4 4331 7173 x y 0 dx x 27 0 427 2 0 41 1 7 x 9 4 4Итак, x y 4 337 y 42 3dx 031 17 361 49 11 x .27 2 3 4 16 16 0 16011.4§27.
Задачи математической статистикиУстановление закономерностей, которым подчинены массовые случайныеявления, основано на изучении статистических данных – результатах наблю-50дений.Первая задача математической статистики – указать способы сбора и группировки (если данных очень много) статистических сведений.Вторая задача математической статистики – разработать методы анализастатистических данных в зависимости от целей исследования.§28.
Основные понятия математической статистикиГенеральная совокупность – совокупность всех изучаемых объектов, N – еёобъём (количество всех объектов).Выборочная совокупность – совокупность объектов, отобранных для изучения, n – объём выборки.Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.Таким образом, вместо большой совокупности объектов изучается совокупность объёма, значительно меньшего по количеству объектов (n << N).Результаты, полученные при изучении выборки, распространяются на объекты всей генеральной совокупности. Для этого выборка должна быть репрезентативной (представительной), то есть правильно представлять генеральную совокупность.
Это обеспечивается случайностью отбора.Виды отбора:– простой случайный:повторный;бесповторный;– сложный случайный:типический;механический;серийный.Простой случайный отбор – производится без деления генеральной совокупности на части.Повторный отбор – отобранный объект возвращается в генеральную совокупность.Бесповторный отбор – отобранный объект не возвращается в генеральную51совокупность.Сложный случайный отбор – производится после предварительного делениягенеральной совокупности на части.Типический отбор – генеральная совокупность делится на типы, из каждоготипа случайно отбираются объекты пропорционально объёму типов.Механический отбор – генеральная совокупность делится на части механически, из каждой части случайно отбираются объекты.Серийный отбор – генеральная совокупность делится на серии, и случайнымобразом отбираются целые серии объектов.§29. Статистическое распределение выборкии его характеристикиПусть из генеральной совокупности извлечена выборка, причем x1 наблюдалось n1 раз, x2 – n2 раз, xk – nk раз и ni = n – объем выборки.
Hаблюдаемыезначения xi называют вариантами, а последовательность вариант, записанныхв возрастающем порядке, – вариационным рядом. Числа наблюдений называются частотами, а их отношения к объему выборкиni Wi – относиnтельными частотами.Статистическим распределением выборки называют перечень вариант исоответствующих им частот или относительных частот.Результаты выборки представляются в виде статистического распределения:хiх1х2х3…хknin1n2n3kгде n1 n2 n3 nk ni n;i 1хi – варианты;ni – соответствующие им частоты;n – объём выборки;Wi ni– относительные частоты.n52…nkРаспределение относительных частот:хiх1х2WiW1W2Основные характеристики выборки:х3…хkW3…WkxB – выборочная средняя;DB – выборочная дисперсия;σB – выборочное среднее квадратичное отклонение;S 2 – исправленная дисперсия.k xi nixB i 1nx1n1 x2 n2 x3 n3 xk nk,nk ( xi xB )2 niDB i 1n( x1 xB ) 2 n1 ( x2 xB )2 n2 ( xk xB )2 nk,nDB xB2 xB2 , где xB2 B DB , S 2 x12 n1 x22 n2 xk2 nk,nnDB .n 1Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющую для каждого значения x относительную частоту события X < x:F*(x) =nx,nгде nx – число вариант, меньших x; n – объем выборки.§30.
Полигон и гистограммаПолигон абсолютных частот – это ломаная, отрезки которой соединяют точки(хi, ni).Пример.хi1,53,55,57,5ni124353ni43211,53,55,5х7,5Полигон относительных частот – это ломаная, отрезки которой соединяютточки (хi, Wi ).Пример.хi1,53,55,57,5Wi0,10,20,40,3Wi0,40,30,20,11,53,55,57,5хСтатистическое распределение может носить интервальный (непрерывный)характер.Пример.х2–55–88 – 11 11 – 14ni912246h – длина частичного интревала.h = 5 – 2 = 8 – 5 = 11 – 8 = 14 – 11 = 3.Гистограмма частот – ступенчатая фигура, состоящая из прямоугольников,основаниями которых служат частичные интервалы длиною h, а высоты равны54отношению ni / h (плотность частоты).nih843225811х14Пример. В результате испытания случайная величина Х приняла следующиезначения х1 = 2, х2 = 5, х3 = 7, х4 = 1, х5 = 10, х6 = 5, х7 = 9, х8 = 6, х9 = 8, х10 = 6,х11 = 2, х12 = 3, х13 = 7, х14 = 6, х15 = 8, х16 = 3, х17 = 8, х18 = 10, х19 = 6, х20 = 7,х21 = 3, х22 = 9, х23 = 4, х24 = 5, х25 = 6.Требуется: 1) составить таблицу, устанавливающую зависимость между значениями случайной величины и её частотами; 2) построить статистическоераспределение; 3) изобразить полигон распределения.Решение.