В.Е. Гмурман - Руководство к решению задач по теории вероятностей и математической статистике (1115340), страница 33
Текст из файла (страница 33)
е. разность между двумя соседними вариантамиX; Сг—ложный нуль вариант К; Лг—шаг вариант К.В этом случае выборочный коэффициент корреляцииГв= ( 2Пауии-'пйд)/{пОаОу),причем слагаемое 2Li"tiv^^^ удобно вычислять, используя расчетнуютабл. 7 (см. далее решение задачи 535). .Величины сГ, V, o„, а^ могут быть найдены либо методом произ/ведений (при большом числе данных), либо непосредственно по формулам:'и = (^Паи)/п,v^'^n^v/n,Оа=К й*—(il)2, o^ = Vv^ — {v)^.Зная эти величины, можно определить входящие в уравнения регрессии (•) и (*«) величины по формулам:x^uhi + C-if "y^vhz + Cz, Ox^ojii,Oy=^(S^2Для оценки силы линейной корреляционной связи служит выборочный коэффициент корреляции г^.Для обоснованного суждения о наличии связи между количественными признаками следует проверить, значим ли выборочный коэффициент корреляции (см.
гл. ХП1, § 12).535. Найти выборочное уравнение прямой линии регрессии К на X по данным, приведенным в корреляционной табл. 5.Таблица 5XY2025303540«.V.16263646564-.—«..10324—*68—.».——~—3121_965101844226Пх414461620п = 100191Р е ш е н и е . Составим корреляционную табл. 6 в условных вариантах, выбрав в качестве ложных нулей C i = 3 0 и С2==36 (каждая из этих вариант расположена в середине соответствующеговариационного ряда).Таблица 6и.V-2—246———10—1—810——180——32394411——412в222——1561620л=100Па411 ~^ 1 ^1 ^^—46!^1 %Найдем и и v:« = ( 2 « t t £ / ) M = (4.(—2)+14.(—1) + 4 6 .
0 + 1 б . 1+20.2)/100 = 0,34;t' = ( 2 ' ' v t ' ) / « = = ( 1 0 ( - - - 2 ) + 1 8 ( - - l ) + 44.0+22.1+6.2)/100==---0,04.Найдем вспомогательные величины и^ и v^:I ? ^ ( 2 / i e a a ) / n = ( 4 . 4 + 1 4 . 1 + l6.1+20.4)/100=l,26;t ^ = ( S ' * v ^ ' ^ ) / ' » = ( ^ 0 ' 4 + 1 8 1 + 2 2 . 1 + 6 . 4 ) / 1 0 0 = 1.04.Найдем аа и о^aa = l / l ? - ~ ( u ) « = F^l,26—0,342=1,07;а^ = К t;«—(t»)2 = |/'l,04—0,042= 1,02.Найдем ^figt^uv, для чего составим расчетную табл.
7.Суммируя числа последнего столбца табл. 7, находим2 у- (/ = 2 '^«v"^ = ^^•VДля контроля вычислений находим сумму чиселстроки:последнейСовпадение сумм свидетельствует о правильности вычислений.Пояснения к составлению табл. 7.1. Произведение частоты п^^ на варианту и, т.е. Лц^гг, записывают в правом верхнем углу клетки, содержащей значение частоты.Например, в правых верхних углах клеток первой строки записаныпроизведения: 4-(—2)= —8;,6-(—1)= —6.1921 *соа^ 11X991 см^,^1 00-<1 ^''^11 ^ 1 ^1-1— лIIсм1 ^^111ос^ь«1оW-1Г"Si1^оох»«тII^см11 "^СМЫ~1 ^1jiJсмсч1и11/ о1/S3^'^11оm111н8111100СО1Т001 ю1о 1т//<£>zl^R1О1ю[ см 1^^ оIJ 1L.WF Fd17 RСО1 о<^^1^00711::5^1О111"^1см1WSiII^1932.
Складывают все числа, помещенные в правых верхних углахклеток одной строки, и их сумму помещают в клетку этой же строки «столбца и». Например, для первой строки а = — 8 + ( — 6 ) = — 1 4 .3. Наконец, умножают варианту v нг U и полученное произведение записывают в соответствующую клетку «столбца t/(/». Например, в первой строке таблицы t; = — 2, / 7 = — 1 4 , следовательно,i;£/ = (—2).(—14) = 28.4.
Сложив все числа «столбца t>t/», получают сумму ^vU, коVторая равна искомой сумме ^Пц^^ии. Например, для табл. 72 ^ ( 7 = 8 2 , следовательно, искомая сумма y\ntipUV=^S2.VДля контроля аналогичные вычисления производят по столбцам:произведения na^v записывают в левый нижний угол клетки, содержащей значение частоты; все числа, помещенные в левых нижнихуглах клеток одного столбца, складывают и их сумму помещают в«строку К»; наконец, умножают каждую варианту и нг V и результат записывают в клетках последней строки.Сложив все числа последней строки, получают сумму 2 ^^fикоторая также равна искомой сумме y\nui,uv.2 ^ ^ = 82, следовательно,^Пц^иу^82.Например, для табл. 7иНайдем искомый выборочный коэффициент корреляции:'"^y\nuvUV'-ruIv82— 100-0,34 • (—0,04) ^ -^поао^^100.1.07.1,02==^'^^-Найдем шаги h^ и hz (разности между любыми двумя соседнимивариантами):Лх ==25—20=5; Аа = 26—16 = 10.Найдем X н"у,учитывая, что Сх = 30, 0^ = 36:x=;7I./ii + C i = 0 , 3 4 .
5 + 30 = 31,70;l7=^./ia + C2 = (—0,04). 1 0 + 3 6 = 35,60.Найдем Qjf и Oyia;p = /ii.a„ = 5.1,07 = 5,35; а^,=Лаа^ = 10-1,02 = 10,2.Подставив найденные величины в соотношение (*), получимискомое уравнение прямой линии регрессии Y на X:5^;,-35,60 = 0,76 i | | (;^-31,70).или окончательно J^;^=1,45JC—10,36.194536. Найти выборочные уравнения прямых линийрегрессии У на X и X на У по данным, приведеннымв следующих корреляционных таблицах:а)XY5100211203 '41510!140——160——2520303551081—81 5%310—-—6—180Пх4035811623—11941552л=50б)XY125150•в 1232833j4348%1—---—8381—125—3212—^ ——17187——16-—3175—200——225———250Пхj16820103-—11241л=50!6195в)XY53035100617120426140—1С—15208103—1603418021—IПх551111255——5"у——23——10——4103л = 50§ 2.
Криволинейная корреляцияЕсли график регрессии — кривая линия, то корреляцию называют криволинейной, В частности, в случае параболической корреляции второго порядка выборочное уравнение регрессии К на Xимеет видyj, = Ax^ + Bx+C.Неизвестные параметры А, В и С находят (например, методом Гаусса) из системы уравнений:( S п^х^) л + ( S п^х^) В + (^ п^х^) С = 2 ^хУхХ\( 2 ^хХ^) л + ( 2 ^хХ^) ^ + (Zif^xx) с = 2 f^x'yxXf(Еп^х^) А + (Еп^х) В + пС = Еп;^^.(*)Аналогично находится выборочное уравнение регрессии X на Y:Ху^ЛгУ^ + Вгу + Сг.Идя оценки силы корреляции Y на X служит выборочное корре*ляционное отношение (отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонениюпризнака Y)"^ух =^межгр/^общ»или в других обозначенияхЗдесьУх = У ^межгр = К ( 2 ^х (Ух—'У^)/п.=К(2^ИУ-^)^)/Л.196<Уу= 1 ^ ^ о б щ =где п—объем выборки (сумма всех частот); Пх — частота значения хпризнака X; Пу—частота значения у признака К; у^ — условнаясредняя признака К; у—общая средняя признака К.Аналогично определяется выборочное корреляционное отношениеX к У:у'537.
Найти выборочное уравнение регрессий у^ =^Ах^-^Вх + С по данным, приведенным в корреляционной табл. 8.Оценить силу корреляционной связи по выборочномукорреляционному отношению.Таблица8XY2352520——2045—30I31ПО—14849Пх203149''у/1=100Р е ш е н и е . Составим расчетную табл. 9.Таблицап^х*«xi'x^9X"хУх'';с^«х^*2352031492547,1108,67409324580160279 i 8371225 6125320 500 100020002 511 1460 4 380 13 14130 625 5325 26 624 133 1212100378158433 456 7285 32 004 148 2627122"х^*"х^х''х'Ух'''Подставив числа, содержащиеся в последней строке табл. 9,в (*), получим систему уравнений относительно неизвестных коэффициентов Л, В, С:33456 Л + 7122 В+ 1584 С = 148262,7122 А +1584 В + 378 С = 32004,1584 Л + 378 Б + 100 С = 7285.197Решив эту систему (например, методом Гаусса), найдем: Л = 2 , 9 4 ,В=7^7^ С=—1,25. Подставив найденные коэффициенты в уравнение регрессии ух = Ах^+Вх+С^окончательно получим^^=2,94х*+7,27х— 1.25.Для того чтобы вычислить выборочное корреляционное отношение t)yxf предварительно найдем общую среднюю у, общее среднееквадратическое отклонение Оу и межгрупповое среднее квадратическое отклонение а- :УхУ = ( S Луу)/л=(20>25+31>45+49> 110)7100=72,85;Oy=\^(Zny(y-^y)*)/n== ^"(20(25—72,85)«+31 (45—72,85)» + 49 (110~72,85)«)/100 =37,07;<^77^У(Епх(Ух-У)*)/п^^х= V^(20(25—72,85)«+31 (47,1—72.85)« + 49 (108,67-.
72,85)»)/100 ==35,95.Найдем искомое выборочное корреляционное отношение:г\ух = о - lOy = 35,95/37,07=0,97.^х'538. Найти выборочное уравнение регрессии у^=Лл:^4+Вх + С и выборочное корреляционное отношение г\ухпо данным, приведенным в корреляционной таблице:а)XY01201 ^^1131205351031982226«1/2021102207121917Пх41814 1202020л=100б)Xу04671911113214340710211 162280227151520021Пх181%2317212121л = 100в)XY01504551354450545544650Пх%564450/1 = 150г)XY011020511715313174813728542472349д = 1502035227234%2550Пх32826!24199д)XY720041730015215484048674140042Лдг891"у48л=150539. Найти выборочное уравнение регрессии Ху= Ay^-t+Ву + С и выборочное корреляционное отношение t\xyпо данным, приведенным в корреляционной таблице:а)Xу61153150%15141521820161618л = 50194Пх30б)XY1 ^^22101123161123Лдг1""у13032001912'25/1=50§ 3.
Ранговая корреляцияА. Выборочный коэффициент ранговой корреляции Спирмена.Пусть выборка объема п содержит независимые объекты, которыеобладают двумя качественными признаками: Л и Б. Под качественным подразумевают признак, который невозможно измерить точно,но он позволяет сравнивать объекты между собой и, следовательно,расположить их в порядке убывания или возрастания качества.Для определенности у с л о в и м с я р а с п о л а г а т ь о б ъ е к т ы впорядке у х у д ш е н и я качества.Расположим сначала объекты в порядке ухудшения качества попризнаку А. Припишем объекту, стоящему на i-м месте, число—ранг Х(, равный порядковому номеру объекта: Xi = i, Затем расположим объекты в порядке убывания качества по признаку В и припишем каждому из них ранг (порядковый номер) у/, причем (дляудобства сравнения рангов) индекс / при у по-прежнему равен порядковому номеру объекта по признаку Л.В итоге получим две последовательности рангов:по признаку А Xi Х2 .
. . х„,по признаку В Ух Уг '' • УпДля оценки степени связи признаков А )л В служат, в частности, коэффициенты ранговой корреляции Спирмена и Кендалла(см. п. Б).Выборочный коэффициент ранговой корреляции Спирмена находят по формулегде di = Xi—У/, п—объем выборки.Абсолютная величина коэффициента ранговой корреляции Спирмена не превышает единицы: | р в 1 ^ 1 *Для обоснованного суждения о наличии связи между качественными признаками следует проверить, значим ли выборочныйкоэффициент ранговой корреляции Спирмена (см. гл. XIII, § 13).540.
Знания десяти студентов проверены по двумтестам: А и В. Оценки по стобалльной системе оказалисьследующими (в первой строке указано количество балловпо тесту Л, а во второй — по тесту В):95 90 86 84 75 70 6292 93 83 80 55 60 45607257625070,^,< >Найти выборочный коэффициент ранговой корреляцииСпирмена между оценками по двум тестам.Р е ш е н и е . Присвоим ранги jc/ оценкам по тесту Л» Эти оценкирасположены в убывающем порядке, поэтому их ранги Xi равныпорядковым номерам:ранги Xi1 2 3 4 5 6 7 8 9 10оценки по тесту Л 95 90 86 84 75 70 62 60 57 50201Присвоим ранги yi оценкам по тесту В, для чего сначала рас^положим эти оценки в убывающем порядке и пронумеруем их:1 2 3 4 5 6 7 8 910.«^ч93 92 83 80 72 70 62 60 55 45^ 'Напомним, что индекс ( при у должен быть равен порядковомуномеру оценки студента по тесту Л.Найдем ранг yi.