341_4- Сборник задач по математике для втузов. В 4-х ч. Ч.4_ (ред) Ефимов А.В, Поспелов А.С_2003 -432с (987780), страница 39
Текст из файла (страница 39)
Горизонтальное отклонение от цели (м) для 200 испытаний ракет: Пусть хй~, ..., хйй — вариационный ряд выборки объема и. Если пр — не целое число, то выборочной квантилью х* порядка р (О < р < < 1) называется к-й член вариационного ряда, где к = (пр) + 1. Если же пр — целое число, то соответствующая квантиль х* не определена (она р может принимать любое значение из интервала (х®, х~"~'~)). 19.55.
Вычислить выборочные квантили порядков р = 0,1; 0,5; 0,9 по данным, приведенным в задаче 19.40. 19.56. Методом моделирования получить выборку объема и = = 55 нз генеральной совокупности с распределением И(0, 1). Определить выборочную медиану и выборочные квантили порядков р = = 0,1; 0,25; 0,75; 0,9. Сравнить полученные результаты с соответствующими теоретическими значениями. 19.57 (продолженне). Решить предыдущую задачу для распределения И(10, 2). 19.58 (продолжение). Решить задачу 19.5б для распределения Ех (2). 3.
Статистическое описание и выборочные характеристики двумерного случайного вектора. Пусть (х„у;), 1 = 1, 2, ..., и, — - выборка объема и из наблюдений случайного двумерного вектора (Х, У). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания. Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения (х„у,), 1 = 1,2,,п, с вероятностями, равными 1/и.
Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа (см. гл, 18, ~3, п.1). Гл. 19. Математическая статистика 204 Пример 8. Вычислить выборочные средние, дисперсии и козффициент корреляции для выборки, приведенной в таблице 1.4.
Построить диаграмму рассеивания. а Вычисление указанных выборочных характеристик удобно выполнять в следуюшей последовательности. Сначала вычисляют суммы х;, ~ у,, ~~ х,, ~ у;, ~ ~х;уо ~~ (х;+у;) . Для контроля правильности вычислений используется тождество (х; + у;) = ~ х; + 2 ~~~ х,у; + ~ у,. Таблица 1.4 х у х у х у Выборочные средние отсюда находятся по формулам (см.
также задачу 19.59) 1 х ю1,0 Ехо н 1 у = ""ол = у .у . (11) Затем вычисляются суммы квадратов отклонений от среднего и произ- ведений отклонений от средних: ~г я, = ~~~ (х; — х) = ~~~ хг— х,г (12) 8,35 3,50 8,74 1,49 9,25 6,40 9,50 4,50 9,75 5,00 10,24 7,00 13,65 9,50 15,25 12,50 14,51 9,50 10,50 6,00 10,75 2,50 10,76 5,74 11,00 8,50 11,00 5,26 11,25 8,00 14,50 10,00 14,23 8,40 16,25 12,00 11,35 9,50 11,50 6,00 11,50 9,00 11,62 8,50 11,75 10,00 12,00 9,00 13,75 8,51 16,00 11,50 12,15 6,00 12,25 8,05 12,35 5,01 12,50 7,03 12,76 7,53 12,85 6,01 14,75 12,00 14,26 10,00 12,85 9,50 13,15 9,02 13,25 6,49 13,26 10,50 13,40 7,51 13,50 10,00 14,00 11,00 16,00 13,00 1.
Методы статистического описания результатов наблюдений 205 Отсюда (15) Объем выборки и = 42. Предварительно вычислим ~~) ун = 336,41, ~ ~х~ = 6652,25, х; = 522,23, уу = 2987,80, хщ; = 4358,626. Тогда по формуле (11) х = 12,434, у = 8,011. По формулам (12) — (14) находим 522,23т Я, = 6652,25 — — ' в 158,8182, 42 336 41з Яг — — 2987,80 — ' 292,5958, 42 Я,я = 4358,626 — ' ' в 175,1912. Окончательно из соотношений (15) получаем 158,8182 . 292,5958 42 ' ' " 42 175,1912 Гл. 19.
Математическая статистика 206 Диаграмма рассеивания приведена на рис. 30. !> !б !2 0 !О !2 !4 !6 !8 х Рис. 30 19.59. Показать, что выборочные начальные и центральные моменты порядка )с + а '!1с, а > О) по выборке (х4, у;), г = 1, ..., н, определяются формулами 1 Ь 4 рь 4 = —',! (х, — х) (у; — у)' и, в частности, 19.60. Показать, что для вычисления выборочной ковариации по двумерной выборке объема и можно использовать формулу 1 ~к у — — — х!У! — х У.
н 19.61. Показать, что для элементов выборки системы двух случайных величин выполняется равенство х!(у! — У) = ,'! у!(х! — х). 1 4210 * ~ хб и 2 !42,0 =12 = —,Р (х *) х,Р 1 с!с,! =у= у! и — 2 !40,2 ~у,7 Ь! У) ) и 3 1. Методы статистического описания результатов наблюденнй 207 19.62. Показать, что выборочный коэффициент коррелнции по выборке (х;, у;), 1 = 1, ..., и, вычисляется по формуле Вычислить коэффициенты корреляции и построить диаграммы рассеивания для следующих выборок: 19.64. 19.63. 19.66.
19.66*. Известно, что для некоторой выборки О' = 16, В" = 9. Каково наибольшее значение ковариацииу 19.67. Пусть над элементами выборки системы двух случайных величин (х;, у,), 1 = 1, 2, ..., я, выполнено линейное преобразование и; = ах;+6, ое = су,+с(,1= 1,2,...,я. Показать, что выборочные ковариацни и коэффициент корреляции связаны соотношениями й,*„, = асИ у (ас > О), твн = гну. Используя подходящее линейное преобразование, вычислить выборочный коэффициент корреляции для следующих выборок: 19.68. х 55 71 53 67 81 75 59 89 65 81 у 206 116 221 113 32 128 248 113 284 215 19.69. х 65,8 68,3 72,7 66,1 73,1 71,8 73,1 66,5 у 166,0 115,2 157,8 152,5 149,3 181,0 173,2 120,4 Выборочная линейная регрессия У на Х по выборке (х;, у,), 4 = = 1, ...,и, определяется уравнением .О у = Во + Д;х = у + т —" (х — х).
~х Гл.19. Математическая статистика 208 Коэффициенты до и Д~ нааыванпся выборочными коэуяфициентами ре- грессии. Они вычисляются по формулам п~ х;у; — (~~ хл) (~ у,) (16) и ~~~ х; — ( у х;) до =у — д,"х (17) Аналогично определяется выборочная линейная регрессия Х на У: х = до" +~9,'"у = х+ г —" (у — у), ~( Юу коэффициенты )эоы и Д," которой находится по формулам п~ ~х;у; — () х;) (~~~ у,) (18) п~ у; — ~~~ у) (19) Для контроля правильности расчетов используют соотношение (20) Прямые У = 1)о + д;х, х = )Уо'+ д',"У пересекаются в тачке с координатами (х, у).
Пример 9. Вычислить выборочные коэффициенты линейной регрессии Х на У и У на Х по выборке примера 8 (таблица 1.4). Нанести прямые регрессии на диаграмму рассеивания. < Воспользуемся результатами вычислений в примере 8. По формулам (16) и (17) находим 1 103 ~Зо = 8 011 1,103 12,434 ю -5,705.
175,1912 Таким обрааом, прямая регрессии У на Х имеет уравнение у = -5,705+ 1,103х. Аналогично по формулам (18), (19) находим ;3'," = ' 0,599,,3~о' = 12,434 — 0,599 8,011 в 7,637. 175,1912 292,5958 1. Методы статистического описания ез льтатоа наблюдений 209 Отсюда прямая регрессии Х на У имеет уравнение х = 7,637+ 0,599у. Проверка по формуле (20) дает ~Т,АЛОГО,599 0,813, что совпадает со значением г, вычисленным в примере 8. Прямые ре- грессии нанесены на диаграмму рассеивания на рис. 30.
с» В задачах 19.70 — 19.72 вычислить коэффициенты корреляции, определить и нанести на диаграмму рассеивания прямые регрессии У на Х и Х на У по данным выборкам. 19.70. 19.71. 19.72. 19.73. Предел выносливости стали при изгибе У (Н/ммз) оценивается на основании другой ее характеристики — предела упругости при кручении Х (Н/мм~). По опытным данным для 12 марок стали найти уравнения линейной регрессии У на Х и Х на У и вычислить коэффициент корреляции между этими характеристиками. Результаты измерений: ~~> х; = 1015, ~~~ у, = 553, ,'> хР = 90667, у~ = 26807, ~~) х;у; = 48888.
19.74. По данным измерений двух переменных вычислить коэффициент корреляции и найти уравнение линейной Регрессии У на Х. Гл. 19. Математическая статистика 210 19.75. Элементы выборки системы двух случайных величин преобразованы так же, как в задаче 19.67 (ас ) О).
Как изменятся выборочные коэффициенты По и 01* линейной регрессии? 19.76 (продолжение). Записать уравнения регрессии для выборки (и„о,), г = 1, ..., и, гле 1 1 и, = (ж, — х), о, = — (у, — у). АЖ 1/Ж 19.ТТ. По данным 1953 г. з) количество телевизионных точек и численность населения в десяти городах США характеризовались следуюшими числами (в десятках тысяч), приведенными в таблице 1.5.
Нанести данные на диаграмму рассеивания, вычислить коэффициенты выборочной корреляции: а) для первых девяти городов (без Нью-Йоргга), б) для всех десяти городов. Сравнить результаты вычислений. Найти коэффициенты линейной регрессии У на Х для десяти городов и нанести уравнение регрессии на диаграмму рассеивания. Объясните полученные результаты.
Таблица 1.5 19.78. Пусть Я и Х вЂ” независимые случайные величины с распределениями гч'(О, 1) и И(тпх, сгх) соответственно. Доказать, что случайная величина У, связанная с Я и Х соотношением (7» У = тпг. + Рхг (Х вЂ” гпх) + 1 — Рэхт огг, сгх имеет нормальное распределение Аг(птт, ог), причем коэффициент корреляции между Х и У равен р», . 19.79. Используя метод моделирования и результат предыдушей задачи, получить выборку объема и = 20 из двумерной нормально распределенной генеральной совокупности с параметрами гпх — — 1, егх — — 1г гпе = 4, сге = 1, рхт = 0,8.
Предварительно вычислив выборочные коэффициенты 1?о и Ц; линейной регрессии У на Х, нанести полученные данные и прямую регрессии )Миллс Ф. Статистические методы --М.: Госстатиадат, 19оа. ~ 1. Методы статистического описания результатов наблюдений 211 р = )зо + Дгх на диаграмму рассеивания. Найти выборочное среднее и дисперсию остатков, т.е. разностей (у; — ()зо + зЗгх;)), ! = 1, 2, ..., 20. Двумерную выборку болыиого объема представляют в виде коррелдаионной таблицы, С втой целью группируют реализации величин Л и У по интервалам длины 6, и Ью а в клетки таблицы записывают число пар исходной выборки (т.е. частоты) для каждой комбинации интервалов.
Зту процедуру можно также выполнять непосредственно по диаграмме рассеивания, нанося на нее сетку горизонтальных и вертикальных прямых, взятых с постоянными шагами 6, и 6„. Наблюдения, которые попали на верхнюю и правую границы рассматриваемого прямоугольника, относятсн соответственно к соседним верхнему и правому прямоугольникам.
В дальнейших вычислениях используются середины интервалов и соответствующие частоты. Обозначим середины интервалов через х;, ! = 1, 2, ..., 6 и уз, у = 1, 2, ..., 1, а соответствующие ь частоты через и;; очевидно, у ~ и;з = п. з=! з=! Полагаем ь Е п; =п., ~~! и;,=пь, !а я з=! Длн упрощения вьгчислений вместо середин интервалов х; и у, введем числа х! — с)"„ я Ь, р — г)» о =-~ — '-, 1=1,2,...,С Ьт где д' и г)'„— середины наиболее часто встречающихся интервалов. Определение выборочных числовых характеристик распределения по корреляционной таблице выполняется в следующей последовательности.