181009 (685702), страница 5
Текст из файла (страница 5)
,
де n — обсяг сукупності, т — кількість коефіцієнтів регресії.
Розрахунок характеристик щільності зв'язку ґрунтується на декомпозиції (розкладанні) варіації у за джерелами формування:
,
де
— загальна сума квадратів відхилень, зумовлена впливом усіх можливих факторів;
— факторна сума квадратів відхилень, зумовлена впливом включених у модель факторних ознак
;
— залишкова сума квадратів відхилень, розмір якої залежить від потужності впливу не включених у модель факторів.
Відношення факторної суми квадратів до загальної характеризує частку варіації у, пов'язану з варіацією включених у модель факторів, і називається множинним коефіцієнтом детермінації
.
За відсутності зв'язку
= 0. Якщо зв'язок функціональний, то
= 1. Очевидно, що
пов'язаний із стандартним відхиленням
. При зменшенні
значення
зростатиме і навпаки. Корінь квадратний із коефіцієнта детермінації називають коефіцієнтом кореляції
. Для моделі врожайності рису R = 0,8394,
= 0,7029, тобто 70,29% варіації врожайності рису лінійно пов'язані з агротехнічними факторами, включеними в модель.
Окрім названих множинних коефіцієнтів щільності зв'язку, в комп'ютерних програмах передбачено розрахунок
з урахуванням числа ступенів вільності:
,
де
— оцінка дисперсії результативної ознаки у;
— оцінка залишкової дисперсії.
Скоригований коефіцієнт множинної детермінації
відрізняється від
співвідношенням числа ступенів вільності дисперсій: залишкової
і загальної
. Для розглянутої моделі це співвідношення становить (34-1) : (34-6-1) = 1,2222, а
= 1-(1-0,7029) • 1,2222 = 0,6369.
У моделях множинної регресії поряд з оцінкою сукупного впливу всіх включених у модель факторів вимірюється кореляція між функцією у та кожним окремим фактором
, при елімінуванні впливу інших факторів. Для цього використовують частинні коефіцієнти детермінації
. Схему розрахунку
розглянемо на прикладі фактора
моделі врожайності рису. До введення його в модель п'ять факторів пояснювали 64,61% варіації врожайності (
= 0,6461), не поясненими залишалися (1 - 0,6461) • 100 = 35,39% варіації. Фактор
додатково пояснив 0,7029 — 0,6461 =0,0568 варіації у, що відносно не поясненої іншими факторами варіації становить 0,0568:0,3539 = 0,1605. Це і є частинним коефіцієнтом детермінації фактора
.
Отже, розрахунок
ґрунтується на порівнянні двох регресійних моделей: повної, з урахуванням фактора
і скороченої, у якій фактор
відсутній. Чисельник
дорівнює різниці сукупних коефіцієнтів детермінації цих моделей, знаменник — одиниці мінус сукупний коефіцієнт детермінації скороченої моделі. Загальну схему його розрахунку можна представити як відношення сум квадратів: частинної
і залишкової
:
,
де
;
— діагональний елемент оберненої матриці.
Корінь квадратний із частинного коефіцієнта детермінації називають частинним коефіцієнтом кореляції.
Іноді для характеристики ролі кожного фактора у відтворенні варіації у сукупний коефіцієнт детермінації розкладають на складові:
,
де
— коефіцієнт окремої детермінації, який залежить від потужності впливу і-го фактора на y та щільності зв'язку між ними (
— парний коефіцієнт кореляції).
Ефекти впливу факторів на врожайність рису та характеристики щільності зв'язку наведено в табл. 2.3.
Таблиця 2.3
| Фактор | | | | | |
| | 0,597 | 0,965 | 0,192 | 0,1146 | 0,0727 |
| | 0,614 | 3,400 | 0,248 | 0,1521 | 0,1160 |
| | 0,489 | 0,501 | 0,045 | 0,0221 | 0,0039 |
| | 0,638 | 7,500 | 0,264 | 0,1687 | 0,1168 |
| | 0,411 | 1,730 | 0,029 | 0,0119 | 0,0020 |
| | 0,716 | 3,443 | 0,362 | 0,2335 | 0,1605 |
У таблиці для кожного фактора наведено три характеристики спільності зв'язку: парний коефіцієнт
, частинний
і коефіцієнт окремої детермінації
. Найбільші значення мають парні коефіцієнти кореляції. Це пояснюється тим, що фактори взаємозалежні, і парний коефіцієнт кореляції акумулює вплив інших факторів. Частинні коефіцієнти характеризують відносну зміну залишкової дисперсії за рахунок відповідного фактора; для кожного з них база порівняння інша, а тому аналітичні можливості їх обмежені. Коефіцієнти окремої детермінації, сума яких дорівнює множинному коефіцієнту детермінації
= 0,7029, упорядковуючи фактори за потужністю впливу, практично дублюють висновки, які можна зробити на основі бета-коефіцієнтів.
Перевірка істотності зв'язку статистичне формулюється як перевірка нульових гіпотез:
;
. Гіпотеза
відхиляється чи визнається допустимою на основі статистичних критеріїв, зокрема дисперсійного F-критерію, статистична характеристика якого розраховується відношенням оцінок факторної і залишкової дисперсій:
або
.
Критичні значення
, де
— рівень істотності,
,
— числа ступенів вільності чисельника та знаменника, наведено в додатку 10. Оскільки F-критерій функціонально зв'язаний з коефіцієнтом детермінації
, то перевірку істотності зв'язку можна здійснити, використовуючи безпосередньо критичні значення
, наведені в додатку 11.
Паралельно з оцінюванням адекватності моделі проводиться перевірка істотності впливу окремих факторів
, на у за допомогою t-критерію:
,
де
— стандартна похибка коефіцієнта регресії;
—оцінка залишкової дисперсії;
— діагональний елемент оберненої матриці С.
Критичні значення
, де
наведено в додатку 5. Ефект впливу і-го фактора визнається істотним, якщо
. Так, при
= 0,05 і
= 20 коефіцієнт
в 2,15 раза перевищує стандартну похибку
, що свідчить про його значущість (істотність).
Довірчі межі ефекту впливу визначаються за правилами вибіркового методу
, де
— значення двостороннього t-критерію.
Рівняння регресії має такий вигляд:
.
Із збільшенням цукристості буряка на 1%, за умови незмінності інших факторів, вихід цукру з 1 т сировини зростає в середньому на 0,953%; щодо порушень технології зберігання та переробки сировини, то вони мають негативний вплив, особливо порушення технології зберігання. Включені в модель фактори пояснюють 84,5% варіації виходу цукру з 1 т сировини; ефекти впливу усіх факторів істотні.
-
Методи і моделі прогнозування багатовимірних процесів
-
-
Багатофакторні індексні моделі
-
При вивченні функціональних зв'язків між показниками широко використовуються індексні моделі. Основою індексної моделі є мультиплікативний зв'язок між певною множиною показників; один з них розглядається як результат у, інші - як фактори
:
.
Послідовність факторів у моделі не може бути довільною, вона визначається економічним змістом показників і методикою їх розрахунку. Кожний наступний фактор-множник розраховується на одиницю попереднього, а отже, добуток будь-якої кількості факторів є економічно змістовною величиною. Наприклад, прибутковість активів компанії у є функцією прибутковості продажу продукції
та оборотності мобільних активів
, тобто
. Оборотність мобільних активів
, в свою чергу, є функцією оборотності матеріальних запасів
і частки матеріальних запасів у мобільних активах
. Отже,
.
Схематично послідовність розширення моделі можна представити так:
і т.д.
Характерною рисою мультиплікативної моделі є взаємозв'язок факторів: чисельник розрахункової формули одного фактора є знаменником розрахункової формули наступного. Введення в ланцюгову схему нового фактора означає лише деталізацію функціонального зв'язку і не змінює його сутності. Ступінь деталізації залежить від мети дослідження.
При побудові індексної моделі функція
розглядається для двох періодів: базисного
і поточного
.
Абсолютну і відносну зміну показника-функції у можна розкласти за факторами-множниками
. Оцінювання ступеня та абсолютного розміру впливу кожного з них на динаміку функції здійснюється в рамках індексної моделі, в якій відтворюються взаємозв'язки між показниками:
















