Гмурман - Теория вероятностей и математическая статистика (969547), страница 46
Текст из файла (страница 46)
Наконец, сложив все числа последней строки, получают сумму Х иУ, которая также равна искомой сумме >, л, ио. Например, для табл. 16 имеем,Я~иУ=169; следовательно, „~~~па„ио=169. а Теперь, когда мы научились вычислять,'Яп ии, приведем пример иа отыскание выборочного коэффициента ,корреляции. Виппер я. Вычислять выоорочнын коэффициент корреляции гэ (,>~леэна — лио)/(ло и ) по данным корреляционной табл.
14. Решенне. Перейдя к условным вариантам, получим корреля,пяоняую табл. 15. Величяны й, о, о„н о„можновычислнть методом произведений; однако, поскольку числа иь о< малы, вычислим йн о, исходя нз определения средней, а о„и о — используя формулы (см. гл. ХЧ1, 4 10) йа=тт/йэ — (и)', й„=~/йт — (о)э. Найдем и я й: й = ( ~~ ~л„и)/л = (5. ( — 3) + 2? ( — 2) + 63 ( — 1) + 29 1+ +9 2)/200 = — 0,425; е=(~л„о)/л=(12 ( — 2)+43 ( — !)+47 1+19 2)/200=0,09. Вычислнм вспомогательную величину иэ„а затем о: йэ=(~~~~ ~я иэ)/л=(Ь 9+2?.4+63 !+29 1+9.4)/200=1,405; <. У< — < у= < Г4он <ожьэ- !.ке. <т, < Аналогично получям и 1,209.
Найдем искомый выборочныйкоэффициенткорреляцап, учитывая, что ранее уже вычислена сумма ~~~~~ л из=169: гэ = (~~~~ л,„ио — лйй)/(лпиоэ) =* = (169 — 200 ( — 0,425).0 09)/(200. 1,106 1,209) =0 603. Итак, гэ 0,603. П о Я с н е н и е. Покажем, что ~ л, ио = ~~.'~ оУ, где У =,~~ лаеи. ь и Рассмотрим корреляционную таблицу в условных вариантах (для про. стоты таблнпа содержит мало данных): 266 Найдем ~ л ио двумя способами: суммируя произведения частот л на Ороизведейня соответствующих условных вариант из по строкам и по столбцам. Для первой строка таблицы л„р,.(и,о,) + лизи, (иаоа) + л„р, (иаоа) = о, ~~~~~ лир,и. (р) и Для второй строки таблицы лии„(и,оа) + лил„(и)оа) +л, (иаоа) =па,Я~ лир,и.
(ре) и Сложим (и) и (ии): ~г литии = 01 и~)~~ лии,л + Оа ~ лираи. и и Итак, ~и~~ лииио= ~~ оу, а гд и=„'~л„,и. и Аналогично, суммируя произведения частот л нв произведения соответствующих условных вариант ио по столбцам, получим ~Ял из=~~а,'иУ, и где У=~~~~-л „о. й 9. Пример на отыскание выборочноуо уравнения прямой линии регрессии Теперь, когда известно, как вычисляют г„ужстно привести пример на отыскание уравнения йрямой линни регрессии. Поскольку при нахождении г, уже вычислены и, й, о„о„, то целесообразно пользоваться формулами: о„= Лао„оз — — азор„х = иЬа + с„у = ойа+-с,.
Здесь сохранены обозначения предыдущего параграфа. Рекомендуем читателю самостоятельно вывести зги формулы. 267 Пример. Найти выборочное уравнение примой линни регрессии )г иа Х по данным корреляционной табл. 14 примера предыдущего параграфа. Решен не. Напишем искомое уравнение в общем анде: и„ у» — у=ге=(" «) (е) ' оа Коэффицнент корреляции уже вычислен в предыдущем параграфе. Остается найти х, у, о н о,: х = ий,Я-с,= — 0,425 10+40=35,751 У=ода+се=0,09 !0+35=35,9; о = оей,= 1,106-10= 11,06; он ††пей, = 1,209 10= 12,09. Подставив найденные величины в (е), получим искомое уравнение ук — 35,9 = 0,603 — * (» — 35,75), 12,09 11,06 нлн окончательно у =0,659х+12,34.
Сравним условные средние, вычисленные: а) поатому уравнению) б) по данным корреляционной табл. 14. Например, при л 30: а ) уае = 0.659. ЗО+ 12 ЗЯ = 32 11'1 б) у„= (23.25+ 30. 35+ 10. 45)163= 32,94. Как видам, согласование расчетного и наблюдаемого условных средних †удовлетворительн. й 1О. Предварительные соображения к введению меры любой корреляционной связи Выше рассматривалась оценка тесноты линейной корреляционной связи. Как оценить тесноту л ю б о й кор еляциоиной связи? 6 усть данные наблюдений над количественными признаками Х и г сведены в корреляционную таблицу. Можно считать, что тем самым наблюдаемые значения 1' разбиты на группы; каждая группа содержит те значения )г, которые соответствуют определенному значению Х. Например, дана корреляционная табл. 17.
К первой группе относятся те 10 значений )г (4 раза наблюдалось у,= 3 и б раз у, = б), которые соответствуют х,=8, Ко второй группе относятся те 20 значений )г [13 раз наблюдалось у,=З и 7 разу,=б), которые соответствуют х,=й. 263 Таблица !7 условные средние теперь можно назвать групповыми средними: групповая средняя первой группы у, = (4 3+6 5)/10=4,2; групповая средняя второй груйпы у, =-(13 3+7 5)/20=3,7.
Поскольку все значения признака У разбиты на группы, можно представить общую дисперсию признака в вндв суммы внутригрупповой и межгрупповой дисперсий (см. гл. ХЧ1, ф 12): )3ебщ= ) ~евер+ 1~межгр (н) Покажем справедливость следующих утнержденнй: 1) если 1' связан с Х функциональной зависимостью, то г.гмежгр/гуебщ = 11 2) если г" связан с Х корреляционной зависимостью, то Вм, /(7, < 1. Доказательство. 1) Если Г связан с Х функциональной зависимостью, то определенному значению Х соответствует одно значение )г.
В этом случае в каждой группе содержатся равные между собой значения 1 е', поэтому групповая дисперсия каждой группы равна нулю. Следовательно, средняя арифметическая е> Например, если значению вг=з соответствует де=7, причем л,=з наблюдалось 5 раз, то в группе содержится Бзначениа у,=т. групповых дисперсий (взвешенная по объемам групп), т. е. внутригрупповая дисперсия Р, = О и равенство (о), имеет вид Робщ Рмежгр' Отсюда Р~межгр/Робщ = 1 ° 2) Если )г связан с Х корреляционной завис и м ость ю, то определенному значению Х соответствуют, вообще говоря, различные значения )г (образующие группу).
В атом случае групповая дисперсия каждой группы отлична от нуля. Следовательно, средняя арифметическая групповых дисперсий (взвешенная по объемам групп) Р чьО. Тогда одно положительное слагаемое Рм,, меньше суммы двух положительных слагаемых Р,„+ +Р Р Р~межгр ~ Робщ. РмежгргРобщ С 1' Уже нз приведенных рассуждений видно, что чем связь между признаками ближе к функциональной, тем меньше Р„и, следовательно, тем больше приближается Рм,„ К Р,б, а ЗиаЧнт, ОТНОШЕНИЕ Рм, р~Р,бщ — К Едиинцс. Отсюда ясно, что целесообразно рассматрйвать в качестве меры тесноты корреляционной зависимости отношение межгрупповой дисперсии к общей, или, что то же, отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению. $11. Выборочное корреляционное отношение Для оценки тесноты линейной корреляционной связи между признаками в выборке служит выборочный коэффициент корреляции. Для оценки тесноты н е л и н е йно й корреляционной связи вводят новые сводные характеристики: про †выборочн корреляционное отношение )г к Х; т) „ †выборочн корреляционное отношение Х к )г.
Выборочным корреляционным отношением У к Х называют отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому 270 отклонена!о признака У: т)а = о„, , /о,ем, или в других обозначениях т! „=о- /о . ла Здесь где и — обмм выборки (сумма всех частот); и„— частота значения х признака Х; па — частота значения у признака )'! у — обп(ая средняя признака )', у„ †условн средняя признака г". Аналогично определяется выборочное корреляционное отношение Х к ) ! т)ал и" /оа' а„ Прниср.
Найтн т)аа ПО даииаМ НОррЕЛИИНОИИОй табЛ. !З. Таблица 16 Решение. Найдем общую среднюю: у ( Ял у)/н (38.15+!2 25)/50* 17,4. Найдем общее среднее кнадратичесное отнлоиение: па (15,— 17,4) +12 (25 — !7,4) )/50= 4,27. Найдем межгрупповае среднее кнадратнческое отклонение: ; -~ Й .е.— «~ а'- »в У(10 (21 — 17,4)»+ 28 (15 — 17 4)в+ 12 (20 — 17,4)в)/50 = 2 73. Искомое корредяпнонное отношенне е)„= о- / ор — — 2,73/4,П = 0,0«.
2 12. Свойства выборочного корреляционного отношения Поскольку т)вр обладает теми же свойствами, что и т)р„, перечислим свойства только выборочного корре- ЛЯЦйОННОГО ОтНОШЕННЯ т)р„, КОТОРОЕ ДаЛЕЕ ДЛЯ УПРОЩЕНИЯ записи будем обозначать через т) и для простоты речи называть «корреляционным отношением». Свой ство 1. Корреляционное огпноигение удсвлетворяегп двойному неравенсгпву О~т)(1. Доказательство.
Неравенство т):О следует нз того, что т) есть отношение неотрицательных чисел— средних квадратических отклонений (межгруппового к общему). Для доказательства неравенства т) ~ 1 воспользуемся формулой )')абщ ) )ввгр+ ) веже»' Разделив обе части равенства на 17,бщ, получим 1 = с)ввгр/)')абщ + »'»ве»вгр/с)абщ» или )ввгр/~ )абщ+ т) Так как оба слагаемых неотрицательны и сумма их равна единице, то каждое из иих не превышает единицы; в частности, т)в ~ 1. Приняв во внимание, что т) » ~О, заключаем: О~т)<1. Свойство 2.
Если т)=О, то признак У с призма- колб Х корреляционной эависимогрпью не связан. Доказательство, По условию, т) = Овев»гр/аабщ = О. Отсюда о„,, =О и, следовательно, 1)„,, =О. 272 Межгрупповая дисперсия есть дисперсия условных (групповых) средних у„относительно общей средней у. Равенство нулю межгрупповой дисперсии означает, что при всех значениях Х условные средние сохраняют постоянное значение (равное общей средней). Иными словами, при т) О условная средняя не является функцией от Х, а значит, признак 1' не связан корреляционной зависимостью с признаком Х.
3 а меча н не 1. Можно доказать н обратное предложение: если признак У не связан с признаком Х корреляционной зависимостью, то т1=0. С в о й с т в о 3. Если т1 = 1, пто признан У связан с признаком Х функциональной зависимостью. Доказательство. По условию, т1 амежтр/аобщ 1' Отсюда аобщ амежтр' Возведя обе части равенства в квадрат, получим (») Робщ = Рмежев' Так как Р,б — — Р,„„р+Р„,,р, то в силу (») ( ) Р.~,-О.