М.А. Маталыцкий, Т.В. Русилко - Теория вероятностей и математическая статистика (1115300), страница 25
Текст из файла (страница 25)
Другими словами, эмпирическиеи теоретические частоты различаются незначимо.По смыслу частота есть целое число, поэтому иногда целесообразно округлить ni′ до целых, следя при этом за тем, чтобы суммаполученных таким образом теоретических частот была равна объемувыборки. Получим частоты, сумма которых равна.Замечание. Так как нормальное распределение является непрерывным, то, проверяя гипотезу о нормальном распределении на основе дискретного вариационного ряда данных, можно осуществитьпереход к интервальному вариационному ряду, считая варианты дискретного ряда серединами интервалов.
Например, в примере 17.2 перейти к интервальному рядуДалее осуществлять проверку гипотезы аналогично примеру 17.1.Задачи17.1. – 17.25. Используя данные задачи 11.1 – 11.25, при заданномуровне значимости α = 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, пользуясь критерием Пирсона.178§18. Элементы теории корреляционногои регрессионного анализаМетоды теории корреляции позволяют определить зависимость между различными факторами или случайными величинами. Термин корреляция произошел от латинского «correlatio» – соотношение, взаимосвязь.В естественных науках часто речь идет о функциональной зависимости, когда каждому значению одной величины соответствует вполне определенное значение другой. Случайные величины обычно несвязаны функциональной зависимостью.
В экономике в большинствеслучаев между переменными величинами существуют зависимости,когда каждому значению одной переменной соответствует не какое-тоопределенное, а множество возможных значений другой переменной.Иначе говоря, каждому значению одной переменной соответствует определенное условное распределение другой переменной. Например,соответствует распределение величины ηзначениюξηMη=x /((ηxξη2)==x1f ( x)y ′1n...значению′ ...n1yk,′nk ′соответствует распределениеη / ξ = x2″y1...yk″nn1″...nk ″и т.д.
Такая зависимость получила название статистической (илистохастической, вероятностной). Примером статистической связи является зависимость урожайности от количества внесенных удобрений, производительности труда на предприятии от его энерговооруженности и т.п.В силу неоднозначности статистической зависимости между идля исследователя представляет интерес усредненная схема зависимосили еготи – зависимость условного математического ожиданиястатистического аналога y x от значений x случайной величины , тоили y x = f (x) . Здесь y x – условная средняя, котоесть179рая определяется как среднее арифметическое значений η ( ), соответствующих значению ξ = x . Такая зависимость получила название корреляционной.
Корреляционной зависимостью между двумя величинаминазывается функциональная зависимость между значениями одной из нихи условным математическим ожиданием другой. Уравнениеназываназывают уравнением регрессии η на , уравнениеют выборочным уравнением регрессии η на . Функциюназывают функцией регрессии, а ее график – линией регрессии.Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей корреляционного анализа является выявление связи между случайными величинами и оценка ее тесноты. Основной задачей регрессионного анализа – установление и изучение формы зависимостимежду переменными.Данные о статистической зависимости удобно представлять ввиде корреляционной таблицы.ηСеред.y1∗ − y 2∗y 2∗ − y3∗y3∗ − y 4∗...∗∗ym− ym+1y1y2y3...ymn xiξинтервx1∗ − x 2∗x1n11n12n13...–n x1x 2∗ − x3∗x2–n22n23...–n x2x3∗ − x4∗x3––n33...–n xi 3........................x s∗ − x s∗+1xs–––...n smn xsnyjn y1n y2n y3...n ymn=¦Здесь nij – частоты появления пар ( xi , y j ) , прочерк говорит оsтом, что соответствующая пара ( xi , y j ) не встречалась, n y j = ¦ nij ,msmj =1i =1j =1i =1n xi = ¦ nij , n = ¦ n xi = ¦ n y j .180Наличие корреляции приближенно может быть определено спомощью корреляционного поля.
Его получим, если нанесем на график в определенном масштабе точки, соответствующие наблюдаемымодновременным значениям двух величин ( xi , y j ) .Пример 18.1. В таблице приведены данные, отражающие зависимость урожайности зерновой культуры η (ц) от расстояния до реки(км). Построить поле корреляции, сделать вывод.ξ ξ η5101520253035nyjРешение. Полученное корреляционное поле представлено на рис.n xi10014016018017.Так как120точки полякорреляцииконцентрируютсявдоль убывающейпрямой,томожносделатьпредположениеобобратнойлиней–––325нойзависимостимеждуурожайностьюирасстояниемдореки.Тоесть–––415– больше –расстояние8 до реки,3 тем меньше–11чемурожайностьисследуе– зерновой– культуры.10–111мой–61–4 y2 1805––––––––510376 16023104501401201005101520Рис. 17181253035xПерейдем к оценке тесноты корреляционной зависимости. Рассмотрим наиболее важный для практики случай линейной зависимости.
В теории вероятностей показателем тесноты линейной зависимости являлся коэффициент корреляции, в математической статистике таким показателем является выборочный коэффициент корреляции.Выборочным коэффициентов корреляции называется величина, рассчитываемая по формулеr=где xy =xy − x ⋅ y,σx ⋅ σ y1 s m¦ ¦ xi y j nij , x , y – выборочные средние, σ x , σ y – выбоn i =1 j =1рочные средние квадратические отклонения.Отметим основные свойства выборочного коэффициента корреляции, аналогичные свойствам коэффициента корреляции для случайных величин.1. Коэффициент корреляции принимает значения на отрезке[− 1,1] , то есть − 1 ≤ r ≤ 1 .2.
Чем ближе значение r к единице, тем более тесная линейнаязависимость между изучаемыми величинами. В зависимости от того,насколько r приближается к единице, различают слабую, умеренную, заметную, достаточно тесную и весьма тесную линейную связь.3. Если r > 0 , то говорят о прямой зависимости, то есть с увеличением значений одной из величин значения другой также увеличиваются, при r < 0 – обратную зависимость.4. Если все значения переменных увеличить (уменьшить) на однои то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится. Коэффициент корреляции есть безразмерная характеристика тесноты линейной связи.5.
При r = ±1 корреляционная связь представляет линейнуюфункциональную зависимость, при этом все точки поля корреляциилежат на одной прямой.6. При r = 0 или r близком к нулю линейная корреляционнаясвязь отсутствует. Но это не означает отсутствие другой зависимости,например, нелинейная связь может быть очень тесной.182Для ответа на вопрос о значимости коэффициента корреляциипроверяют нулевую гипотезу H 0 : rг = 0 о равенстве нулю генерального коэффициента корреляции. Если гипотеза принимается, то этоозначает, что между ξ и нет линейной корреляционной зависимости, в противном случае линейная зависимость признается значимой.Для того чтобы при уровне значимостипроверить нулевуюгипотезу при конкурирующей, надо вычислить наблюдаемое значение критерияt набл =r n−2.1− r2и по таблице критических точек распределения Стьюдента (приложение 7), по заданному уровню значимости α и числу степеней свонайти критическую точку t кр (α; k ) двухстороннейбодыкритической области.
Если t набл < t кр – нет оснований отвергнутьнулевую гипотезу. Если t набл > t кр – нулевую гипотезу отвергаем.ηαkH=n−21 : rг ≠ 0Пример 18.2. По данным примера 18.1 рассчитать выборочныйкоэффициент корреляции. При уровне значимости 0,05 проверитьнулевую гипотезу о равенстве генерального коэффициента корреляции нулю при конкурирующей гипотезе H 1 : rг ≠ 0 . Сделать вывод.Решение. Для удобства вычислений построим вспомогательнуютаблицу.ξ η1001201401601805101520253035–––––61–––––42––8105––343––––21–1–––5511115103ny j7623104n = 50yi n y j70072032201600720696070000864004508002560001296009928002yi n y j183n xi2xi n xixi n xi25501652201253001059901255002475440031259000367523300¦Находим средние значения:x=990696023300= 466 ,= 19,8 , y == 159,2 , x 2 =505050992800y2 =19856 , σ x = 466 − 19,8 2 = 8,6 ,50σ y = 19856 − 139,2 2 = 21,89 ,1(100 ⋅ 30 ⋅ 6 + 100 ⋅1 ⋅ 35 + 120 ⋅ 30 ⋅ 4 + 120 ⋅ 2 ⋅ 35 + 140 ⋅ 8 ⋅15 +50+ 140 ⋅10 ⋅ 20 + 140 ⋅ 5 ⋅ 25 + 160 ⋅ 3 ⋅ 5 + 160 ⋅ 4 ⋅10 + 160 ⋅ 3 ⋅ 15 + 180 ⋅ 2 ⋅ 5 ++ 180 ⋅1 ⋅10 + 180 ⋅ 1 ⋅ 20) = 2596.xy =Находим коэффициент корреляции:2596 − 19,8 ⋅ 159,2= −0,851 .8,6 ⋅ 21,89Проверим гипотезу о равенстве генерального коэффициента корреляции нулю.