183594 (584715)
Текст из файла
1. Парная линейная регрессия и корреляция
Цель работы - овладеть навыками определения параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel.
1.1 Решение задач с использованием формул
1.1.1 Параметры a и b линейной регрессии
рассчитываются с помощью метода наименьших квадратов. Для этого составим систему нормальных уравнений (1).
По исходным данным определим
,
,
,
,
в расчетной таблице 1.
Таблица 1 Расчет показателей парной линейной регрессии и корреляции
| № |
|
|
|
|
|
|
|
|
|
| 1 | 9.8 | 10.2 | 99.96 | 96.04 | 104.04 | 9.847 | 0.035 | 0.125 | -1.575 |
| 2 | 11.3 | 10.1 | 114.13 | 127.69 | 102.01 | 10.088 | 0.001 | 0.000 | 11.300 |
| 3 | 11.5 | 10.1 | 116.15 | 132.25 | 102.01 | 10.120 | -0.002 | 0.000 | 11.500 |
| 4 | 11.3 | 9.2 | 103.96 | 127.69 | 84.64 | 10.088 | -0.096 | 0.788 | 11.300 |
| 5 | 10.9 | 10.7 | 116.63 | 118.81 | 114.49 | 10.023 | 0.063 | 0.458 | 10.900 |
| 6 | 11.4 | 9 | 102.6 | 129.96 | 81 | 10.104 | -0.123 | 1.218 | 11.400 |
| 7 | 12.6 | 10.4 | 131.04 | 158.76 | 108.16 | 10.297 | 0.010 | 0.011 | 12.409 |
| 8 | 12.2 | 11.1 | 135.42 | 148.84 | 123.21 | 10.232 | 0.078 | 0.753 | 12.164 |
| Итого | 91 | 80.8 | 919.89 | 1040.04 | 819.56 | 80.797 | -0.034 | 3.353 | 79.397 |
| Среднее | 11.375 | 10.1 | 114.986 | 130.005 | 102.445 | 10.100 | -0.004 |
Система нормальных уравнений составит:
Решив систему, получим: a = 8,2717; b = 0,1607.
Уравнение линейной регрессии имеет вид:
.
Параметры уравнения можно определить и по следующим формулам:
= 10,1 – 0,1608. 11,375= 8,2709
Величина коэффициента регрессии b = 0,1607 означает, что с ростом среднедушевых доходов на 1 тыс. руб. общий коэффициент рождаемости увеличится в среднем на 0,1607 раз.
1.1.2 Средний коэффициент эластичности для линейной регрессии находится по формуле:
0,181
При увеличении величины среднедушевого дохода на 1%, общий коэффициент рождаемости в среднем увеличится на 0,181%.
1.1.3 Линейный коэффициент парной корреляции (r) определяется по формуле:
,
где средние квадратические отклонения:
тогда
, значит связь между среднедушевым доходом и рождаемостью очень слабая.
1.1.4 Определим коэффициент детерминации:
Таким образом, вариация величины рождаемости на 3,6% зависит от вариации уровня среднедушевых доходов населения, а на остальные (100%-3,6%) 96,4% − от вариации факторов, не включенных в модель.
Подставляя в уравнение регрессии фактические значения x, определим теоретические (расчетные) значения
(таблица 1) и найдем величину средней ошибки аппроксимации (
):
=
=0,425
Так как допустимый предел значений
не более 8-10%, качество модели по данному показателю удовлетворительное. Однако средняя ошибка аппроксимации не является главным критерием оценки значимости модели.
С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования:
Fфакт=
=
.
Fтабл = 5,99 при
.
Так как Fфакт < Fтабл, уравнение регрессии не значимо, статистически не надежно.
1.2 Решение задачи с помощью MS Excel
1.2.1 Параметры линейной регрессии
можно определить с помощью встроенной статистической функции ЛИНЕЙН MS Excel. Порядок вычисления следующий:
1) ввожу исходные данные (рисунок 1).
2) выделяю область пустых ячеек 52 (5 строк, 2 столбца) с целью вывода результатов регрессионной статистики или область 12 – для получения только оценок коэффициентов регрессии;
3) активизирую Мастер функций любым из способов:
а) в главном меню выбираю Вставка / Функция;
б) на панели инструментов Стандартная щелкаю по кнопке Вставка функции;
Рисунок 1 Ввод данных для корреляционно-регрессионного анализа
4) в окне «Категория» выбераю Статистические, в окне «Функция» – ЛИНЕЙН. Щелкаю по кнопке ОК (рисунок 2);
Рисунок 2 Диалоговое окно Мастер функций
5) заполняю аргументы функции (рисунок 3):
Рисунок 3 Диалоговое окно Аргументы функции
Щелкаю по кнопке ОК;
6) в левой верхней ячейке выделенной области появился первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажимаю на клавишу , а затем – на комбинацию клавиш + + .
Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме:
| Значение коэффициента b | Значение коэффициента a |
| Среднеквадратическое отклонение b | Среднеквадратическое отклонение a |
| Коэффициент детерминации R2 | Среднеквадратическое отклонение y |
| F – статистика | Число степеней свободы |
| Регрессионная сумма квадратов | Остаточная сумма квадратов |
Результаты вычислений функции ЛИНЕЙН представлены на рисунке 4.
Рисунок 4 Результаты вычислений функции ЛИНЕЙН
1.2.2 С помощью инструмента анализа данных Регрессия, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий следующий:
1) проверяю доступ к пакету анализа. В главном меню последовательно выбераю Сервис / Настройки. Устанавливаю флажок Пакет анализа;
2) в главном меню выбираю Сервис / Анализ данных / Регрессия. Щелкаю по кнопке ОК;
3) после вызова режима Регрессия на экране появляется диалоговое окно (рисунок 5), в котором задаются следующие параметры:
Рисунок 5 Диалоговое окно режима Регрессия
Результаты регрессионного анализа для исходных данных представлены на рисунке 6.
Вывод итогов
| Регрессионная статистика | |
| Множественный R | 0,19101862 |
| R-квадрат | 0,03648811 |
| Нормированный R-квадрат | -0,1240972 |
| Стандартная ошибка | 0,74755394 |
| Наблюдения | 8 |
Дисперсионный анализ
| df | SS | MS | F | Значимость F | |
| Регрессия | 1 | 0,12697864 | 0,126978637 | 0,2272195 | 0,6504571 |
| Остаток | 6 | 3,35302136 | 0,558836894 | ||
| Итого | 7 | 3,48 |
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | |
| Y-пересечение | 8,271668362 | 3,844685341 | 2,151455224 | 0,07495556 | 1,135937744 | 17,67927447 |
| Переменная X 1 | 0,160732452 | 0,337194727 | 0,476675461 | 0,6504571 | 0,664353319 | 0,985818223 |
Вывод остатка
| Наблюдение | Предсказанное Y | Остатки | Стандартные остатки |
| 1 | 9,846846389 | 0,353153611 | 0,510263509 |
| 2 | 10,08794507 | 0,012054934 | 0,017417896 |
| 3 | 10,12009156 | -0,020091556 | -0,029029827 |
| 4 | 10,08794507 | -0,887945066 | -1,28297135 |
| 5 | 10,02365209 | 0,676347915 | 0,977239505 |
| 6 | 10,10401831 | -1,104018311 | -1,595170599 |
| 7 | 10,29689725 | 0,103102747 | 0,148970781 |
| 8 | 10,23260427 | 0,867395727 | 1,253280084 |
2. Нелинейные модели регрессии и их линеаризация
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.













