Раздаточные материалы, страница 7
Описание файла
PDF-файл из архива "Раздаточные материалы", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 6 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
Взависимости от вида уравнений можно говорить о ЛР или НР.В общем случае эта зависимость может быть представлена в виде полинома степени k:Y ( x ) = a 0 + a1 x + a1 x 2 + ... + a k x kОпределение коэффициентов регресии производится по методу наименьших квадратов:()Q = ∑ y i − Y ( x ) → min2∂Q ∂Q ∂Q∂Q,,,...,∂a 0 ∂a1 ∂a 2∂a k⎧ ∂Q= −2∑ y − a 0 − a1 x − a 2 x 2 − ... − a k x k = 0⎪⎪ ∂a 0⎪ ∂Q= −2∑ y − a 0 − a1 x − a 2 x 2 − ... − a k x k x = 0⎪a∂⎨ 1⎪.......⎪⎪ ∂Q= −2∑ y − a 0 − a1 x − a 2 x 2 − ...
− a k x k x k = 0⎪⎩ ∂a k()()()В результате получаем систему нормированных уравнений:35⎧a 0 n + a1 ∑ x + a 2 ∑ x 2 + ... + a k ∑ x k = ∑ y⎪⎪23k +1⎪⎪a 0 ∑ x + a1 ∑ x + a 2 ∑ x + ... + a k ∑ x = ∑ yx⎨⎪........⎪k⎪a 0 ∑ x k + a1 ∑ x k +1 + a 2 ∑ x k + 2 + ... + a k ∑ x 2k = ∑ yx⎪⎩Решая полученную систему известным способом, находим коэффициенты регрессии.Измерение тесноты связи.Если бы величина Y полностью определялась аргументом Х, все точки лежали бы на линиирегрессии. Чем сильнее влияние прочих факторов, тем дальше отстоят точки от линии регрессии.В случае в) связь между Х и Y является более тесной.yyхха)в)За основу показателя, характеризующего тесноту связи, берется общий показательизменчивости дисперсии:[(σ y2 = M [(Y − m y )]2 = M Y + Y ( x ) − Y ( x ) − m y[()][][()]2=)])(= M Y − Y ( x ) + M Y ( x ) − m y + 2M Y − Y ( x ) Y ( x ) − m y1442443 14424431444244432σ y220δ2yxx∑ (Y − Y (x ))p⎛⎜⎝ y x ⎞⎟⎠ = ∑ p⎛⎜⎝ y x ⎞⎟⎠ − Y (x )∑ p⎛⎜⎝ y x ⎞⎟⎠ = 0yσ y2 = σ y2 + δ y2xσ y2(*)x- дисперсия переменной Y относительно теоретической линии дисперсии,xопределяющей влияние прочих факторов на величину Y.δ y2 - условная дисперсия, характеризует дисперсию теоретической линии регрессииxотносительно условной генеральной средней my.
Именно она определяет влияние данного фактора(Х) на величину Y и может быть использована для оценки тесноты связи между величинами Х иY.M (Y ( x ) − m y )2ηT , y =xσ y2=δ y2xσ y2- теоретическое корреляционное отношение.Изменяется от 0 до 1, что легко доказать, поделив (*) на σу2:1=σ y2xσ y2+δ y2ηT , y = 1 −x1) Если ηT,y=1, то σxxσ y2σ y2σx2y;σ y2 ≤ σ y2x=02yxВлияние прочих факторов отсутствует. Все распределение будет сконцентрировано налинии регрессии.
В этом случае между Х и Y существует простая функциональная зависимость.362) Если ηT,y=0, когда Y ( x ) = m y .xВ этом случае линия регрессии Y по Х будет горизонтальной прямой, проходящей черезцентр распределения.В случае, когда вид зависимости (форма связи) случайных величин Х и Y не установлен,часто бывает необходимо убедиться в наличии какой-либо связи вообще. Может оказаться, чтосвязь несущественна и вычисление коэффициентов регрессии неоправданно.Для объяснения такого вопроса вычисляется эмпирическое корреляционное отношение,определяемое на основе выборочных данных. При выводе формул для ЭКО пользуютсяэмпирической линией регрессии и оценкой дисперсии по выборке.Определение эмпирического корреляционного соотношения.S Y2 =[][211Y − Yi ( x ) + ∑ Yi ( x ) − Y∑nk]2= S y2( x ) + δ y2( x )y – измеряемое значение зависимой переменнойn – общее количество измеренийYi ( x ) - условное среднее (среднее значение зависимой переменной у в i-ом интервале св Х)k – общее количество интерваловY - среднее всей совокупности измеренийВ пределах каждого интервала, для всех тех значений Х, для которых естьэкспериментальные результаты (значения Y), находим средние значения.yYk (x)Sy(x)2 – составляющая полной дисперсии,y maxхарактеризует дисперсию результатов измеренийЭмпирическаяотносительно эмпирической линии регрессии, т.е.линияYсрвлияние прочих факторов на зависимую переменную Y.регрессииδy(x)2 – характеризует дисперсию эмпирическойy minхлинии регрессии относительно среднего всейхminхma xсовокупности, т.е.
влияние исследуемого фактора назависимую переменную Y.22δ y(x )S y(x )η 2 = 2 = 1 − 2 - Эмпирическое корреляционное соотношениеSySyИз сравнения с формулой для теоретического корреляционного соотношения видно: прирасчете теоретического корреляционного соотношения необходимо знать форму связи междупеременными.При вычислении эмпирического корреляционного соотношения никакие предположения оформе связи не используются, нужна только эмпирическая линия регрессии.Свойства:21. 0 ≤ η ≤ 12. если η 2 =1, все точки корреляционного поля лежат на линии регрессии – функциональная связьмежду Х и Y.3. Если η 2 =0 (когда∑ [Y ( x ) − Y ]2i[]= 0 ), отсутствует изменчивость условных средних Yi ( x ) ,эмпирическая линия регрессии проходит параллельно оси абсцисс – свзи между Х и Y нет.Эмпирическое корреляционное соотношение η 2 завышает тесноту связи междупеременными и случайными величинами, причем тем сильнее, чем меньше число измерений,поэтому η 2 рекомендуется использовать для предварительной оценки тесноты связи, а дляокончательной оценки – теоретическое корреляционное соотношение.Коэфициент корреляции.Рассмотрим случай вычисления теоретического корреляционного соотношения η т2 , когдасвязь между случайными величинами Х и Y является линейной.37Y ( x ) = a 0 + a1 xТакая форма связи между Х и Y имеет место в случае, когда случайные величиныподчиняются двуменому нормальному закону распределения.η =2т[M Y (x ) − m yσ y2] = ∑ [Y (x ) − Y ]22nσ y2Подставив вместо Y и Y их значения для случая линейной зависимости:Y =∑ y = nan0+ a1 ∑ xn= a0 + a1 xY (х)=а0 + а1хη2т∑ (a=+ a1 x − a 0 − a1 x) = ∑ a (x − x )22nσ X2=anσ Y2nσ Y2nσ Y2Заменим а1 ее значением, полученным из решения нормальных уравнений:021212a12σ x2σ y2⎡⎤⎢ ∑ xy ∑ x ∑ y ⎥2−2⎡ n∑ xy − ∑ x ∑ y ⎤ σ 2 ⎢nnn ⎥ σx =x⎥=⎢=⎢222 ⎥2⎢⎣ n∑ x 2 − (∑ x ) ⎥⎦ σ y ⎢ ∑ x 2 ⎛ ∑ x ⎞ ⎥ σ y⎟−⎜⎢⎜ n ⎟ ⎥n⎝⎠ ⎦⎥⎣⎢∑ xy − ∑ x ∑ yσ∑n=r = a1 x = nσY⎡ ∑ xy ∑ x ∑ y ⎤−⎢⎥nn ⎥⎦⎢⎣ n2σ x2σ Yx2(x − x )(y − y )nσ x σ YКоэфициент корреляции является частным случаем теоретического корреляционногосоотношения η т2 , когда связь между СВ является линейной.
В этом случае r является показателемтесноты связи.∑ x − x y − y - выборочный корреляционный моментk x, y =n∑ x−x y− yr = ρ ( x , y )ρ ( y , x )ρ x, y =2nσ xВыборочный коэфициент корреляции обладает свойствами:1. r=0, если св Х и Y независимы2. r < 1 - Для любых св Х и Y3.()()()()σ xσ Ya1 > 0⎧1⎩− 1 a 1 < 0r = 1 - Для случая линейной зависимости св Х и Y.
r = ⎨Коэфициент корреляции используется для оценки тесноты связи и в случае нелинейнойзависимости между случайными величинами.Если предварительный графический анализ поля корреляции указывает на какую либотесноту связи, полезно вычислить коэфициент корреляции.Если модуль коэфициента корреляции r = 0.8 ÷ 0.9 , то независимо от вида связи можносчитать, что она достаточно тесна, чтобы исследоват ее форму.Двумерное нормальное распределение.Его возникновение объясняется центральной предельной теоремой Ляпунова:3822⎛⎛⎛⎛ x − m x ⎞⎛ y − m y1⎜⎜ ⎜ x − m x ⎞⎟ ⎛⎜ y − m y ⎞⎟⎟⎟⎜⎜⎜+−ρ⋅ exp⎜ −⋅f xy ( x, y ) =22⎜⎜ ⎜ σ ⎟ ⎜ σ⎜⎟2σ−ρ2(1)⎜xyx⎠⎝ σ y⎠ ⎝⎝2πσ x σ y 1 − ρ⎠⎝⎝⎝ρ – коэффициент корреляции.
Х и У по отдельности распределены нормально (mx,σx) и(my,σy).В частном случае независимых СВ Х и У ρ=0:2 ⎞⎞2⎛⎛1⎜ 1 ⎜ ⎛ x − m x ⎞ ⎛⎜ y − m y ⎞⎟ ⎟ ⎟⎟⎟ +⋅ exp⎜ − ⋅ ⎜ ⎜⎜f xy ( x, y ) =⎟⎟2πσ x σ y⎜ 2 ⎜ ⎝ σ x ⎠ ⎜⎝ σ y ⎟⎠ ⎟ ⎟⎝⎠⎠⎝1Исходные плотности одномерных нормальных распределений Х и У:+∞⎛ − ( x − mx ) 2 ⎞1⎟f x ( x) =exp⎜⎜− f xy ( x, y )dx =2⎟−∞2σ2 πσ xx⎝⎠⎛σ⎛⎜⎜ y − m y − ρ ⋅ y ⋅ ( x − mx ) 2f xy ( x, y )σx⎜ 1 ⎜1f ( y / x) ==⋅ exp⎜ − ⋅ ⎜f x ( x)2 πσ y 1 − ρ 2σ y 1 − ρ2⎜ 2 ⎜⎜⎜⎝⎝Условное распределение – нормальное с условиями:σyM ( y / x) = m y + ρ( x − mx ) и σ y / x = σ y 1 − ρ2 .σxПервое условие является уравнением функции регрессии.σM ( x / y) = m x + ρ x ( y − m y ) и σ x / y = σ x 1 − ρ 2 .σy⎞ ⎞⎟ ⎞⎟⎟⎟ ⎟⎟ ⎟⎟⎠⎠⎠∫⎞⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎠Нормальная регрессия прямолинейна. Точность оценки у/х одинакова для всех х. В качествемеры тесноты связи используется коэффициент корреляции, а форму связи при этомхарактеризует коэффициент регрессии.Z=fxy(x,y) – трехмерная поверхность, сечения которой плоскостями XZ и YZ представляютсобой графики плотности одномерных распределений.Коэффициент множественной корреляцииR = β1ryx1 + β 2 ryx 2 + ...