Проверка адекватности нелинейной корреляционной модели
§ 7. Проверка адекватности нелинейной корреляционной модели.
Коэффициент детерминации и его свойства
Коэффициент детерминации
Коэффициент корреляции используется для оценки качества уравнения линейной регрессии. Если же уравнение нелинейное, то аналогичную роль играет коэффициент детерминации R2.
В числителе стоят теоретические значения , которые подсчитываются по построенной теоретической формуле, по уравнению регрессии.
В знаменателе – данные наблюдений yi .
В идеальном для нас случае, когда все данные наблюдений лежат точно на построенной линии регрессии, теоретические значения и данные наблюдений yi просто совпадают. Числитель при этом будет равен знаменателю и коэффициент детерминации R2 равен 1.
Рекомендуемые материалы
Чем больше разброс данных наблюдений относительно построенной линии регрессии, тем меньше коэффициент детерминации R2
Свойства коэффициента детерминации:
1.
2. Если R2 близок к 1, это означает, что зависимость между факторами близка к функциональной и разброс данных наблюдений относительно построеннной линии регрессии очень мал. Уравнение хорошо описывает результаты нкаблюдений.
3. Если R2 уменьшается, это значит, что увеличивается разброс точек на кореляционном поле относительно построенной линии регрессии (или статистическая зависимость очень слабая, или уравнение регрессии подобрано неверно).
Итак, ОБЩИЙ ВЫВОД:
Коэффициент детерминации R2 характеризует степень тесноты
любой корреляционной зависимости, (не обязательно линейной)
т.е. показывает, насколько разбросаны статистические данные
вокруг построенной линии регрессии.
Замечание 1. Вообще говоря, значение коэффициента детерминации не говорит о том, есть ли между факторами зависимость и насколько она тесная. Оно говорит только о качестве того уравнения, которое мы построили.
Удобно сравнивать коэффициенты детерминации для нескольких разных уравнений регрессии построенных по одним и тем же данным наблюдений. Из нескольких уравнений лучше то, у которого больше коэффициент детерминации.
Замечание 2. Для парной линейной регрессии коэффициент детерминации точно равен квадрату коэффициента корреляции:
R2 = r2
Проверка адекватности корреляционной модели
Как для r, так и для R2 необходимо проводить исследования его статистической значимости. При этом здесь используют F-критерий Фишера:
Здесь R 2 - коэффициент детерминации
n - объем выборки; (n–2) – число степеней свободы.
Технология проверки такова:
· Подсчитываем наблюдаемое значение критерия Фишера
· По таблицам критических точек распределения Фишера находим критическое значение критерия .
· Сравнивая, делаем вывод об адекватности (или неадекватности) линейной корреляционной модели. Чем больше Fнабл по сравнению с Fкр , тем выше адекватность. Поэтому вывод должен содержать оценку степени адекватности.
23 МИД Франции - лекция, которая пользуется популярностью у тех, кто читал эту лекцию.
Пусть по наблюдаемым значениям х и y вычисленное значение R2 = 0,7. При этом, в расчете используют 15 наблюдений (n = 15). Проверим адекватность корреляционной модели.
По таблице распределения Фишера с (1,13) степенями свободы и при уравнении значимости 5% находят критические значения критерия Фишера:
Fкр. = 4,67
Тогда, Fнабл. > Fкр., и Н0 отвергается. Это означает, что значение R2 статистически значимо и с вероятностью 0,95 делается вывод об адекватности принятой математической модели.
Но степень адекватности не очень высокая.