180577 (628709), страница 3
Текст из файла (страница 3)
Розрахунок описової статистики і перевірка однорідності вибіркової сукупності
Групування вихідних даних проводиться з метою аналізу структури і закономірностей розподілу досліджуваних показників. У відповідних дослідженнях групування виконують для кожного досліджуваного показника. У курсовій роботі його слід виконати тільки для результативного показника Y, але різними способами.
Якщо варіація ознаки виявляється в порівняно вузьких межах і розподіл носить більш менш рівномірний характер, то будують угрупування з рівними інтервалами.
Нерівні інтервали застосовуються в статистиці, коли значення ознаки варіюють нерівномірно і в значних розмірах, що характерне для більшості соціально – економічних явищ, особливо при аналізі макроекономічних показників.
2.2.1 Групування з використанням рівних інтервалів
Групування з рівними інтервалами доцільні в тих випадках, коли варіація виявляється в порівняно вузьких інтервалах і розподіл одиниць сукупності по даній ознаці є практично рівномірною. Оптимальну кількість груп K з рівними інтервалами визначимо по формулі Стерджесса:
,
K=1+3,322*lg36=7
де n – кількість спостережень (обсяг вибірки); n=36;
lg n – десятковий логарифм числа n.
Отримане значення К округляємо до цілого у велику сторону. Потім розраховуємо ширину групувального інтервалу h:
,
де
max – максимальне значення показника, що вивчається, у вибірці;Ymax=9948
min – мінімальне значення показника, що вивчається, у вибірці.Ymin=994
Значення h також округляємо до цілого у велику сторону.
h=
=1279
Після цього можемо встановити межі групувальних інтервалів:
-
нижня межа першого групувального інтервалу
a1=Ymin;
a1=994;
-
верхня межа першого групувального інтервалу
b1=a1+h;
b=969+1279=2273;
Межі наступних інтервалів встановлюємо так: нижня межа чергового інтервалу приймається рівній верхній межі попереднього інтервалу, а верхня межа дорівнює нижній плюс ширина групувального інтервалу. В результаті весь діапазон зміни значень змінної розбивається на 7 рівних по величині інтервалів.
Одночасно зі встановленням меж групувальних інтервалів задаємо умови віднесення спостережень на інтервал. Їх задаємо у вигляді подвійної нерівності:
ak Y bk, k=1,2,3, ..., K.
Відповідно до цієї умови на інтервал з номером k відносимо ті значення досліджуваної ознаки, які більше або рівні нижньої границі і менше верхньої границі.
Далі розподілимо одиниці вибіркової сукупності (підприємства) по інтервалах у залежності від величини результативної ознаки.
Таблиця 2.4 – Групування підприємств по величині валового доходу, тис. грн.
| Номер інтервалу, k | Межі інтерва-лів | Частота fk | Кумулятивна частота, | Частка, wk=fk/n | Кумулятивна частка, |
| 1 | 994-2273 | 4 | 4 | 4/36=0,111 | 0,111 |
| 2 | 2273-3552 | 3 | 4+3=7 | 3/36=0,083 | 0,111+0,083=0,194 |
| 3 | 3552-4831 | 5 | 7+5=12 | 5/36=0,138 | 0,194+0,138=0,332 |
| 4 | 4831-6110 | 12 | 12+12=24 | 12/36=0,333 | 0,332+0,333=0,665 |
| 5 | 6110-7389 | 5 | 24+5=29 | 5/36=0,138 | 0,665+0,138=0,803 |
| 6 | 7389-8668 | 4 | 29+4=33 | 4/36=0,111 | 0,803+0,111=0,914 |
| 7 | 8668-9948 | 3 | 33+3=36 | 3/36=0,083 | 0,914+0,083=0,997 |
| Разом | - | 36 | - | 1 | - |
Після рознесення даних до інтервалів, у табл. 4 підраховуємо частоту попадання спостережень до інтервалу(fk),розраховуємо частки(wk), кумулятивні частоти(Sf) та частки(Sw).
2.2.2 Групування з використанням нерівновеликих інтервалів
Групування з нерівновеликими інтервалами застосовуються для опису статистичних даних розподілу, що мають явну асиметрію, частот і часток. Ширину і межі цих інтервалів встановлюють на основі логічного аналізу попередніх відомостей про якісні і кількісні характеристики досліджуваного явища.
У курсовій роботі в якості одного з можливих рішень задачі групування підприємств за розмірами валового доходу використовуємо досить просту формалізовану процедуру розділення підприємств на групи.
Ця процедура виділення груп об'єктів з нерівними інтервалами досліджуваної ознаки така. Необхідно ранжирувати значення ознаки. Потім весь інтервал її можливих значень [964; 9964] розділити на два інтервали, відокремлюваних друг від друга середнім значенням о
знаки
.
Ymin = 994
= 5330.08 Ymax=9948
На першому інтервалі [994; 5330.08] будуть розташовані варіанти досліджуваної ознаки менше середнього значення
, на другому [5330.08;9964] – більше, ніж середнє значення
.
У випадку асиметричного розподілу точка, що відповідає середньому значенню ознаки
=5330.08, не ділитиме інтервал [994;9948] на рівні частини, а буде зміщена до якого-небудь з кінців інтервалу.
Вибираємо з двох інтервалів, розділених значенням середньої величини, інтервал найменшої довжини, для чого порівнюємо по модулю величини
=5330.08-994=4336.08 і
=9948-5330.081=4617.92.
Довжину найменшого з двох порівнюваних інтервалів поділяємо навпіл і отримане значення
додаємо до середнього
і вичитаємо з нього.
∆Y=4336.08/2=2168.04.
=5330.08-2168.04=3162.04;
=5411+2223,5=7498.12.
Одержуємо координати двох точок (3162.04) і (7498.12), які відзначаємо на числовій осі варіаційного ряду вліво і вправо від середнього значення:
Дрібні Середні Великі
994 3162.04 5330.08 7498.12 9948
В результаті числова вісь, що відповідає ранжированому варіаційному ряду досліджуваної ознаки, розділяється на три інтервали [994;3162,04], [3162.04;7498,12] і [7498,12;9948], довжини яких можуть бути інтерпретовані як величини, що відмежовують дрібні, середні і великі одиниці сукупності.
Після встановлення меж інтервалів розробимо таблицю частот і часток та побудуємо гістограму розподілу підприємств.
Таблиця 2.5 – Групування підприємств за обсягом валового доходу, тис.грн.
| Номер інтерва-лу, K | Межі інтервалів | Частота fk | Кумулятивна частота, | Частка, wk=fk/n | Кумулятивна частка, | ||||||
| 1 | 994-1122 | 1 | 1 | 0,03 | 0,03 | ||||||
| 2 | 1122-8802 | 32 | 33 | 0,89 | 0,92 | ||||||
| 3 | 8802-9948 | 3 | 36 | 0,08 | 1 | ||||||
| Разом | 36 | 1 | |||||||||
Рис. 2.1 - Гістограма розподілу значень Y
2.2.3 Розрахунок узагальнюючих характеристик і перевірка однорідності вибіркової сукупності
Наступний етап аналізу сукупності спостережень - розрахунок узагальнюючих характеристик досліджуваної статистичної сукупності. Цей розрахунок можна виконати за не згрупованими або згрупованими даними (на підставі частотної таблиці). Більш точними є результати, отримані з використанням не згрупованих даних.
У курсовій роботі розрахунок зазначених показників описової статистики виконаємо для кожної змінної за не згрупованими даними. Для розрахунку використаємо формули, що приведені в табл. 2.6.
Таблиця 2.6 – Формули для розрахунку узагальнюючих показників вибіркових сукупностей
| Узагальнюючі показники | Результативна змінна Y | Факторні змінні Xi |
| Середнє | | |
| Середнє квадратич-не відхилення | | |
| Коефіцієнт варіації | | |
Примітка. 1) i-номер спостереження, i =1,2...,n; 36
2) j - номер чинника, j = 1,2,3,4,5
Таблиця 2.7 – Розрахунки узагальнюючих показників вибіркових сукупностей
| Узагальнюючі показники | Результативна змінна Y | Факторні змінні X1 | Факторні змінні Х2 | Факторні змінні Х3 | Факторні змінні Х4 | Факторні змінні Х5 |
| Середнє | 5330.08 | 3604.306 | 1293.528 | 1.467 | 2.723 | 3.996 |
| Середнє квадратич-не відхилення | 2234.139 | 1549.276 | 472.749 | 0,124 | 0,228 | 23,449 |
| Коефіцієнт варіації, | 42.984 | 36.547 | 35,326 | 8,453 | 8.373 | 586,812 |
Розрахунок виконується на підставі вихідних даних, приведених у табл. 2.3. Проаналізувавши дані таблиці 2.3, можна зробити такі висновки:











