Линейная регрессия (Практикум)
Описание файла
Файл "Линейная регрессия" внутри архива находится в следующих папках: Практикум, Задачи практикума 1. Excel-файл из архива "Практикум", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр Excel-файла онлайн
Текст из табличного файла "Линейная регрессия"
1.41 5.73 Изучается зависимость аналитического сигнала (B) от содержания вещества (A). 2.83 0.406665 Построить градуировочный график, включая формулу и коэффициент детерминаци 4.23 Оценить содержание вещества по величине сигнала (C1) и поместить в ячейку C2. 5.67 7.01 8.46 9.84 11.26 12.65 14.09 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.14 0.24 0.31 0.45 0.58 0.66 0.8 0.9 1 1.1 0.5 1 0 0.5 1 0 0.5 1 0 0 0 0 0.5 0.5 0.5 1 1 1 Проведено измерение содержания вещества в серии образцов двумя методами: стандартным (A) и новым (B).
Проверить новый метод на систематические ошибки (постоянную и линейно изменяющуюся) относительно старого. 99.1 97.99 100 99.86 98.9 100.96 101.04 100.01 101.9 При определении некоторого вещества изучается зависимость аналитического сигнала (С) от содержания примесей (A, B). Провести линейную регрессию, вывести формулу. Проверить значимость влияния каждой примеси на сигнал. Задание 1 Линейная регрессия 16 14 f(x) = 14.0587878787879 x + 0.012666666666667 R² = 0.999980383242789 12 B 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 10 8 6 4 2 0 0 0.2 0.4 0.6 A 6 4 2 0 0 0.2 0.4 0.6 A Вывод: так, как коэффициент детерминации равен 1, поэтому просле Задание 2 ВЫВОД ИТОГОВ Регрессионная статистика Множественный R R-квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения Дисперсионный анализ Регрессия Остаток Итого Y-пересечение Переменная X 1 Вывод: так, как значение R^2 (0,9976) близко к 1, величина значимости F, которая очень мал систематическая ошибка отсутствует, данный коэ попадает 1, линейная систематическая ошибка пр = 0.1943>0.05, следовательно, для уровня значи перед X1 P-значение = 9.09E-12<0.05, следова отвергаем.
Это также можно подтвердить значен незначим, а для линейного коэффициента она выс Задание 3 ВЫВОД ИТОГОВ Регрессионная статистика Множественный R R-квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения Дисперсионный анализ Регрессия Остаток Итого Y-пересечение Переменная X 1 Переменная X 2 Вывод: во всех 3-х случаях P-значения (2,19E-18, высокими следовательно, гипотеза о том, что коэф закону: y = -1.9867*X1 + 1.9533*X2 + 99.99. Т доверительный интервал для свободного члена не входит 1, поэтому все коэффициенты яв (B) от содержания вещества (A).
рмулу и коэффициент детерминации. ала (C1) и поместить в ячейку C2. ерии образцов двумя методами: метод на систематические ошибки ельно старого. а изучается зависимость ания примесей (A, B). ти формулу. й примеси на сигнал. Задание 1 Линейная регрессия x + 0.012666666666667 0.4 0.6 A 0.8 1 1.2 0.4 0.6 A 0.8 1 1.2 рминации равен 1, поэтому прослеживается явная зависимость, ошибка = 0.
Задание 2 ссионная статистика 0.998798879420774 0.997599201532195 0.997299101723719 0.017224014243685 10 df 1 8 9 SS MS F Значимость F 0.986186666666667 0.9861866666667 3324.224719101 9.092815588E-12 0.002373333333333 0.0002966666667 0.98856 Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% 0.016666666666667 0.011766241729815 1.4164817491752 0.194373787008 -0.010466335396 1.09333333333333 0.018963015572318 57.656090043474 9.09281559E-12 1.0496045410438 к значение R^2 (0,9976) близко к 1, регрессию можно считать линейной.
Это так же подтверждает большое значение F>>1, и а значимости F, которая очень мала. Так, как в доверительный интервал для свободного члена попадает 0, постоянная ая ошибка отсутствует, данный коэффициент незначим. Так, как в доверительный интервал для линейного коэффициента не ейная систематическая ошибка присутствует, данный коэффициент значим. Это также подтвержадается тем, что P-значение 5, следовательно, для уровня значимости 5 % гипотезу о равенстве свободного члена нулю принимаем. Для коэффициента значение = 9.09E-12<0.05, следовательно, для уровня значимости 5 % гипотезу о равенстве данного коэффициента нулю о также можно подтвердить значениями t-статистики: для свободного члена она низкая - 1,4165, поэтому этот коэффициент я линейного коэффициента она высокая - 57,6561, поэтому данный коэффициент значим Поэтому уравнение регрессии будет таким: y = 1,0933 * X1 Задание 3 ссионная статистика 0.998155733210134 0.996314867740261 0.995086490320348 0.084721766847592 9 df 2 6 8 SS MS F Значимость F 11.6435333333334 5.8217666666667 811.0820433437 5.004483227E-08 0.043066666666666 0.0071777777778 11.6866 Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% 99.99 0.056481177898395 1770.3242694385 2.19272744E-18 99.8517955367 -1.98666666666666 0.069175032961215 -28.719417709285 1.18028319E-07 -2.155931874297 1.95333333333334 0.069175032961215 28.237548284633 1.30555351E-07 1.7840681257032 3-х случаях P-значения (2,19E-18, 1,18E-7, 1,31E-7) меньше уровня значимости 0.05 и t-статистики являются вательно, гипотеза о том, что коэффициенты равны 0 отклоняется, т.е.
Y зависит от X1 и X2 по следующему -1.9867*X1 + 1.9533*X2 + 99.99. Также значимость всех коэффициентов можно подтвердить тем, что в интервал для свободного члена не входит 0, а в доверительный интервал для слинейных коэффициентов не ит 1, поэтому все коэффициенты являются значимыми. Поэтому влияние примесей A и B значимо.
Верхние 95% Нижние 95,0% Верхние 95,0% 0.043799668729 -0.0104663354 0.04379966873 1.137062125623 1.049604541044 1.13706212562 большое значение F>>1, и падает 0, постоянная инейного коэффициента не дается тем, что P-значение маем. Для коэффициента ого коэффициента нулю оэтому этот коэффициент уравнение регрессии будет Верхние 95% Нижние 95,0% Верхние 95,0% 100.1282044633 99.8517955367 100.128204463 -1.81740145904 -2.1559318743 -1.817401459 2.122598540964 1.784068125703 2.12259854096 Задание 1 Вывод: была построена зависимость аналитического сигнала (B) от содержания вещества (A), выведено уравнение регрессии и рассчитан коэффициент детерминации.
Так, как коэффициент детерминации равен 1, поэтому прослеживается явная зависимость, ошибка = 0. Было оценено содержание вещества по величине сигнала (C1) =(C1-0,0127)/14,059 = 0,406665 Задание 2 Вывод: так, как значение R^2 (0,9976) близко к 1, регрессию можно считать линейной. Это так же подтверждает больш и величина значимости F, которая очень мала. Так, как в доверительный интервал для свободного члена попадает систематическая ошибка отсутствует, данный коэффициент незначим.
Так, как в доверительный интервал для линейно не попадает 1, линейная систематическая ошибка присутствует, данный коэффициент значим. Это также подтвержад значение = 0.1943>0.05, следовательно, для уровня значимости 5 % гипотезу о равенстве свободного члена нулю п коэффициента перед X1 P-значение = 9.09E-12<0.05, следовательно, для уровня значимости 5 % гипотезу о равен коэффициента нулю отвергаем. Это также можно подтвердить значениями t-статистики: для свободного члена она н поэтому этот коэффициент незначим, а для линейного коэффициента она высокая - 57,6561, поэтому данный коэфф Поэтому уравнение регрессии будет таким: y = 1,0933 * X1 Задание 3 Вывод: во всех 3-х случаях P-значения (2,19E-18, 1,18E-7, 1,31E-7) меньше уровня значимости 0.05 и t-статистики являются высокими следовательно, гипотеза о том, что коэффициенты равны 0 отклоняется, т.е.
Y зависит от X1 и X2 по следующему закону: y = -1.9867*X1 + 1.9533*X2 + 99.99. Также значимость всех коэффициентов можно подтвердить тем, что в доверительный интервал для свободного члена не входит 0, а в доверительный интервал для слинейных коэффициентов не входит 1, поэтому все коэффициенты являются значимыми. Поэтому влияние примесей A и B значимо. же подтверждает большое значение F>>1, бодного члена попадает 0, постоянная ый интервал для линейного коэффициента м.
Это также подтвержадается тем, что Pвободного члена нулю принимаем. Для сти 5 % гипотезу о равенстве данного я свободного члена она низкая - 1,4165, , поэтому данный коэффициент значим X1 и 0.05 и t-статистики .е. Y зависит от X1 и фициентов можно ительный интервал и. Поэтому влияние .