4 часть (1081361), страница 40
Текст из файла (страница 40)
По формулам (16) и (17) находим 1 103 ~Зо = 8 011 1,103 12,434 ю -5,705. 175,1912 Таким обрааом, прямая регрессии У на Х имеет уравнение у = -5,705+ 1,103х. Аналогично по формулам (18), (19) находим ;3'," = ' 0,599,,3~о' = 12,434 — 0,599 8,011 в 7,637. 175,1912 292,5958 1. Методы статистического описания ез льтатоа наблюдений 209 Отсюда прямая регрессии Х на У имеет уравнение х = 7,637+ 0,599у. Проверка по формуле (20) дает ~Т,АЛОГО,599 0,813, что совпадает со значением г, вычисленным в примере 8.
Прямые ре- грессии нанесены на диаграмму рассеивания на рис. 30. с» В задачах 19.70 — 19.72 вычислить коэффициенты корреляции, определить и нанести на диаграмму рассеивания прямые регрессии У на Х и Х на У по данным выборкам. 19.70. 19.71. 19.72. 19.73. Предел выносливости стали при изгибе У (Н/ммз) оценивается на основании другой ее характеристики — предела упругости при кручении Х (Н/мм~). По опытным данным для 12 марок стали найти уравнения линейной регрессии У на Х и Х на У и вычислить коэффициент корреляции между этими характеристиками.
Результаты измерений: ~~> х; = 1015, ~~~ у, = 553, ,'> хР = 90667, у~ = 26807, ~~) х;у; = 48888. 19.74. По данным измерений двух переменных вычислить коэффициент корреляции и найти уравнение линейной Регрессии У на Х. Гл. 19. Математическая статистика 210 19.75. Элементы выборки системы двух случайных величин преобразованы так же, как в задаче 19.67 (ас ) О). Как изменятся выборочные коэффициенты По и 01* линейной регрессии? 19.76 (продолжение).
Записать уравнения регрессии для выборки (и„о,), г = 1, ..., и, гле 1 1 и, = (ж, — х), о, = — (у, — у). АЖ 1/Ж 19.ТТ. По данным 1953 г. з) количество телевизионных точек и численность населения в десяти городах США характеризовались следуюшими числами (в десятках тысяч), приведенными в таблице 1.5. Нанести данные на диаграмму рассеивания, вычислить коэффициенты выборочной корреляции: а) для первых девяти городов (без Нью-Йоргга), б) для всех десяти городов.
Сравнить результаты вычислений. Найти коэффициенты линейной регрессии У на Х для десяти городов и нанести уравнение регрессии на диаграмму рассеивания. Объясните полученные результаты. Таблица 1.5 19.78. Пусть Я и Х вЂ” независимые случайные величины с распределениями гч'(О, 1) и И(тпх, сгх) соответственно. Доказать, что случайная величина У, связанная с Я и Х соотношением (7» У = тпг. + Рхг (Х вЂ” гпх) + 1 — Рэхт огг, сгх имеет нормальное распределение Аг(птт, ог), причем коэффициент корреляции между Х и У равен р», . 19.79.
Используя метод моделирования и результат предыдушей задачи, получить выборку объема и = 20 из двумерной нормально распределенной генеральной совокупности с параметрами гпх — — 1, егх — — 1г гпе = 4, сге = 1, рхт = 0,8. Предварительно вычислив выборочные коэффициенты 1?о и Ц; линейной регрессии У на Х, нанести полученные данные и прямую регрессии )Миллс Ф.
Статистические методы --М.: Госстатиадат, 19оа. ~ 1. Методы статистического описания результатов наблюдений 211 р = )зо + Дгх на диаграмму рассеивания. Найти выборочное среднее и дисперсию остатков, т.е. разностей (у; — ()зо + зЗгх;)), ! = 1, 2, ..., 20. Двумерную выборку болыиого объема представляют в виде коррелдаионной таблицы, С втой целью группируют реализации величин Л и У по интервалам длины 6, и Ью а в клетки таблицы записывают число пар исходной выборки (т.е. частоты) для каждой комбинации интервалов.
Зту процедуру можно также выполнять непосредственно по диаграмме рассеивания, нанося на нее сетку горизонтальных и вертикальных прямых, взятых с постоянными шагами 6, и 6„. Наблюдения, которые попали на верхнюю и правую границы рассматриваемого прямоугольника, относятсн соответственно к соседним верхнему и правому прямоугольникам. В дальнейших вычислениях используются середины интервалов и соответствующие частоты. Обозначим середины интервалов через х;, ! = 1, 2, ..., 6 и уз, у = 1, 2, ..., 1, а соответствующие ь частоты через и;; очевидно, у ~ и;з = п.
з=! з=! Полагаем ь Е п; =п., ~~! и;,=пь, !а я з=! Длн упрощения вьгчислений вместо середин интервалов х; и у, введем числа х! — с)"„ я Ь, р — г)» о =-~ — '-, 1=1,2,...,С Ьт где д' и г)'„— середины наиболее часто встречающихся интервалов. Определение выборочных числовых характеристик распределения по корреляционной таблице выполняется в следующей последовательности. ь Сначала вычисляют суммы ~ пьнп ~~ пзиз, у п! и! ~п зоз ч 1 % ~ 2 ь з=! з=! з=! з=! Е пе.
цзи .. Затем определяют следующие суммы: г=! з=! (21) (22) Гл. 19. Математическая статистика 212 Выборочные средние, дисперсии и коэффициент корреляции находят по формулам и,.; ~~ Я.,оа х = Ь + !( , р = 69 + <1,, (24) я я Р =6 —, 2 Ои х и Р' =Ь вЂ”, 2 'эе 9 (25) т= (26) Коэффициенты Д; и Щ* линейной регрессии У на Х и Х на У вычисляют по формулам д иа Ь ч„„ (27) ь„а„' х; — 11,5 !' = 1, 2, ..., 9, ц! = 1 у! — 9 о ! 2 у = 1, 2, ..., 7. Вычисляем следующие суммы: цьи; = 43, ~~! пцо!. — — — 15, ~ я!.иэ = 215, 9 7 2 87 !',! я! ц!о = 80 2=! 29П По формулам (21)-(23) находим 432 Я„= 215 — — аэ 170,976, Я„= 87 — 81,643, ( — 15)2 Я„„= 80 — а 95,357.
43 ( — 15) 42 (28) Г = Ь'„а". Коэффициенты бо и Доем находят по формулам (17) и (19). Пример 10. Проведя группировку выборки примера 7, вычислить выборочные средние, дисперсии, коэффициент корреляции, а также выборочные коэффициенты линейной регрессии Х на У и У на Х. 2 Выберем Ь, = 1, 69 = 2. Прямоугольная сетка, соответствующая этим значениям, нанесена на диаграмму рассеивания (рис. 30). Непосредственно по диаграмме строим корреляционную таблицу (таблица 1.6) . Находим !(' = 11,5, !('„= 9 и вычисляем значения и! и о! по формулам Гл. 19.
Математическая статистика 214 ЯОг АВОз ЯОг А1гоз 87ог А1гоз ЯОг А!гоз 57,8 17,2 54,6 17,9 54,8 18,8 51,7 19,9 61,1 16,0 62,3 1 7,8 52,2 18,8 49,2 19,3 53,9 16,1 60,0 14,8 56,2 17,0 55,2 17,8 53,3 19,9 57,9 17,1 54,0 15,5 52,6 17,6 53,8 16,3 53,6 17,2 51,5 15,3 54,0 15,0 50,4 14,4 53,0 15,3 53,3 16,6 51,6 14,9 50,9 14,7 49,6 16,1 52,2 19,5 50,5 15,6 51,1 18,1 52,2 19,5 49,2 15,7 49,3 13,2 48,8 16,4 53,5 15,9 52,3 15,9 52,9 14,8 52,1 19,8 47,3 18,7 49,8 20,2 49,3 17,6 5О,1 Ю,2 54,4 !8,2 49,0 16,8 48,9 18,2 51,3 19,7 51,6 19,6 46,2 19,! 50,4 20,2 50,7 21,5 бз,! Я,з 52,9 20,3 51,3 20,1 52,7 17,2 46,6 15,6 46,5 16,0 51,3 15,5 Ы,О 19,2 47,5 18,5 47,7 19,0 44,9 16,6 49,4 16,0 48,9 18,6 48,8 19,4 50,6 18,9 По формулам (24)-(26) вычисляем 43 ( — 15) х=1 — +11,5 12,52, у=2 ° +9 8,28, 42 ' ' ' 42 170,976 81,643 0* = 1 ' = 4,071, 17'„= 2 — ' 7,775, 42 ' ' " 42 95,357 7 774,474 47,444 Выборочные коэффициенты регрессии вычисляем по формулам (27), (28), (17) и (19): 2 95,357 1 95,357 1 170,976 ' ' ' 2 81,643 До =828 112'1252 574 78~0, 1252 058 828 772 Таким образом, уравнение линейной регрессии У на Х имеет вид р = — 5,74+ 1,12х, а уравнение линейной регрессии Х на У имеет вид х = 7,72+ 0,58у.
Расхождение полученных результатов с результатами примеров 8 и 9 обу- словлено группировкой. 1> 19.80, В таблице 1.7 приводятся результаты лабораторного ана- лиза 64 образцов сланцевых пород на содержание двуокиси крем- ния (%02) и двуокиси алюминия (А!20з) (в условных единицах). Вычислить коэффициент корреляции между этими признаками, предварительно сгруппировав эти данные в корреляционную таб- лицу.
Таблица 1.7 9 1. Методы статистического описания результатов наблюдений 21! Вычислить коэффициент корреляции и найти уравнения пря. мых регрессии У на Х и Х на У по данным в следующих корре ляционных таблицах (задачи 19.81-19.84): 19.81. 19.82. 19.83. Гл. 19. Математическая статистика 216 19.84. В задачах 19.85 — 19.90 найти числовые характеристики системы двух случайных величин и коэффициенты регрессии У на Х и Х на У по данным выборкам. 19.86. 19.8Т. 19.85. Э 1. Методы статистического описания результатов наблюдений 217 19.88.
19.90. 19.89. 19.91. Построить диаграммы рассеяния для каждого из четырех приведенных в таблице (с. 218) множеств данных э). Для каждого набора данных найдите и нанесите на диаграмму рассеяния график линейной регрессии у и т. Прокомментируйте полученные результаты. 19.92. Получить выборку объема и = 100 из генеральной совокупности, имеющей биномиальное распределение О (10; О,З). Полученные данные представить в виде статистического ряда. Построить эмпирическую функцию распределения и гистограмму частот.
Найти выборочные среднее, дисперсию, коэффициенты асимметрии и эксцесса. 19.93. Получить выборку объема и = 100 из генеральной совокупности, имеющей нормальное распределение А!(5, 2). Выполнить группировку полученных данных. Построить гистограмму частот. Найти выборочные среднее, дисперсию, коэффициенты асимметрии и эксцесса. 19.94. Решить предыдущую задачу по данным 100 реализаций случайной величины Х, имеющей экспоненциальное распределение Ех (3). ) Апясотбе г.з. Сгарпв !и Б!а!!э!!са! Апа1ув!в, Атег!сап 8!а!!я!!с!ап, 17 — 21, 1973, Гл. 19.
Математическая статистика 218 Таблица к задаче 19.91. у' х №и/и У1 Хг Хз Х1 7,46 8 9,14 6,58 10 8,04 10 10 6,95 8 5,76 6,77 8 8,14 12,74 8 7,71 7,58 13 8,74 13 13 7,114 8 8,84 8,77 8,81 9 7,814 8 8,47 9,26 8,33 11 7,04 8,84 8 14 9,96 14 8,10 14 5,25 6,13 7,24 6 6,08 8 12,5 5,39 19 4,26 4 3,10 8,15 8 6,42 8 12 10,84 12 482 7 9,13 12 5,96 74П 7,26 10 6,89 5,68 5 4,74 5,73 8 9,0 9,0 9,0 9,0 19.95. Получить выборку объема п = 100 из двумерной нормально распределенной генеральной совокупности с параметрами тх = 3, т,.