183927 (567015), страница 2
Текст из файла (страница 2)
95,4% значений располагаются в диапазоне ( ),
99,7% значений располагаются в диапазоне ( ).
Если полученная в табл. 9 структура рассеяния хi по 3-м диапазонам незначительно расходится с правилом «трех сигм», можно предположить, что распределение единиц совокупности по данному признаку близко к нормальному.
Расхождение с правилом «трех сигм» может быть существенным. Например, менее 60% значений хi попадают в центральный диапазон ( ) или значительно более 5% значения хi выходит за диапазон (
). В этих случаях распределение нельзя считать близким к нормальному.
Задача 3. Для ответа на вопросы 4а) – 4в) необходимо воспользоваться табл.8 и сравнить величины показателей для двух признаков.
Для сравнения степени колеблемости значений изучаемых признаков, степени однородности совокупности по этим признакам, надежности их средних значений используются коэффициенты вариации V признаков.
Задача 4. Интервальный вариационный ряд распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлен в табл.7, а его гистограмма и кумулята – на рис.2.
Возможность отнесения распределения признака «Среднегодовая стоимость основных производственных фондов » к семейству нормальных распределений устанавливается путем анализа формы гистограммы распределения. Анализируются количество вершин в гистограмме, ее асимметричность и выраженность «хвостов», т.е. частоты появления в распределении значений, выходящих за диапазон ( ).
1. При анализе формы гистограммы прежде всего следует оценить распределение вариантов признака по интервалам (группам). Если на гистограмме четко прослеживаются два-три «горба» частот вариантов, это говорит о том, что значения признака концентрируются сразу в нескольких интервалах, что не соответствует нормальному закону распределения.
Если гистограмма имеет одновершинную форму, есть основания предполагать, что выборочная совокупность может иметь характер распределения, близкий к нормальному.
2. Для дальнейшего анализа формы распределения используются описательные параметры выборки – показатели центра распределения ( , Mo, Me) и вариации (
). Совокупность этих показателей позволяет дать качественную оценку близости эмпирических данных к нормальной форме распределения.
Нормальное распределение является симметричным, и для него выполняются соотношения:
=Mo=Me
Нарушение этих соотношений свидетельствует о наличии асимметрии распределения. Распределения с небольшой или умеренной асимметрией в большинстве случаев относятся к нормальному типу.
3. Для анализа длины «хвостов» распределения используется правило «трех сигм». Согласно этому правилу в нормальном и близким к нему распределениях крайние значения признака (близкие к хmin и хmax) встречаются много реже (5-7 % всех случаев), чем лежащие в диапазоне ( ). Следовательно, по проценту выхода значений признака за пределы диапазона (
) можно судить о соответствии длины «хвостов» распределения нормальному закону.
II. Статистический анализ генеральной совокупности
Задача 1. Рассчитанные в табл.3 генеральные показатели представлены в табл. 4.
Таблица 4 - Описательные статистики генеральной совокупности
Обобщающие статистические показатели совокупности по изучаемым признакам | Признаки | |
Среднегодовая стоимость основных производственных фондов | Выпуск продукции | |
Стандартное отклонение | ||
Дисперсия | ||
Асимметричность As | ||
Эксцесс Ek |
Для нормального распределения справедливо равенство
RN=6N.
В условиях близости распределения единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.
Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.
Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность
= |
-
|
определяет ошибку репрезентативности для средней величины признака.
Так как ошибки выборки всегда случайны, вычисляют среднюю и предельную ошибки выборки.
1. Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой) выражает среднее квадратическое отклонение выборочной средней
от математического ожидания M[
] генеральной средней
.
Для изучаемых признаков средние ошибки выборки даны в табл. 3:
- для признака Среднегодовая стоимость основных производственных фондов
=……………….,
- для признака Выпуск продукции
=………………..
2. Предельная ошибка выборки определяет границы, в пределах которых лежит генеральная средняя
. Эти границы задают так называемый доверительный интервал генеральной средней
– случайную область значений, которая с вероятностью P, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.
Для уровней надежности P=0,954; P=0,683 оценки предельных ошибок выборки даны в табл. 3 и табл. 4.
Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:
,
Предельные ошибки выборки и ожидаемые границы для генеральных средних представлены в табл. 5.
Таблица 5 - Предельные ошибки выборки и ожидаемые границы для генеральных средних
Доверительная вероятность Р | Коэффициент доверия t | Предельные ошибки выборки, млн. руб. | Ожидаемые границы для средних | ||
для первого признака | для второго признака | для первого признака | для второго признака | ||
0,683 | 1 | | | ||
0,954 | 2 | | |
Задача 3. Рассчитанные в табл.3 значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.
1. Показатель асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.
Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака (среднее значение
больше серединного Me и модального Mo).
Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me
меньше серединного Me и модального Mo).
Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:
|As| 0,25- асимметрия незначительная;
0,25<|As| 0,5- асимметрия заметная (умеренная);
|As|>0,5- асимметрия существенная.
2. Показатель эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.
Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.
Если Ek>0, то вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.
Если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону от xmax до xmin.
Для нормального распределения Ek=0. Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.
При незначительном отклонении Ek от нуля форма кривой эмпирического распределения незначительно отличается от формы нормального распределения.
III. Экономическая интерпретация результатов статистического исследования предприятий.
-
Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?
-
Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов и выпуска продукции?
Ответ на вопрос следует из анализа данных табл.9, где приведен диапазон значений признака ( ), содержащий наиболее характерные для предприятий значения показателей.
-
Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?
Ответы на вопросы следуют из значения коэффициента вариации (табл.8), характеризующего степень однородности совокупности (см. вывод к задаче 3б). Максимальное расхождение в значениях показателей определяется размахом вариации Rn. (табл.8).
-
Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных производственных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показатели? Какие именно это предприятия?
Структура предприятий представлена в табл. 7 Рабочего файла.
-
Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?
Ответ на вопрос следует из вывода к задаче 5 и значения коэффициента асимметрии (табл. 8).
-
Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях каждого показателя можно ожидать?
Ответ на первый вопрос следует из данных табл.11. Максимальное расхождение в значениях показателя определяется величиной размаха вариации RN.
Приложение
Результативные таблицы и графики
Аномальные единицы наблюдения | |||
Номер предприятия | Среднегодовая стоимость основных производственных фондов, млн.руб. | Выпуск продукции, млн. руб. | |
11 | 710,00 | 1800,00 | |
30 | 2270,00 | 600,00 | |
Таблица 3 | |||
Описательные статистики | |||
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." x | По столбцу "Выпуск продукции, млн.руб", y | ||
Столбец1 |
| Столбец2 |
|
Среднее | 1670 | Среднее | 1565,2 |
Стандартная ошибка | 52,99212694 | Стандартная ошибка | 63,21505713 |
Медиана | 1688 | Медиана | 1554 |
Мода | 1730 | Мода | 1560 |
Стандартное отклонение | 290,2498329 | Стандартное отклонение | 346,2431277 |
Дисперсия выборки | 84244,96552 | Дисперсия выборки | 119884,3034 |
Эксцесс | -0,344943844 | Эксцесс | -0,205332365 |
Асимметричность | -0,152503649 | Асимметричность | 0,042954448 |
Интервал | 1200 | Интервал | 1440 |
Минимум | 1070 | Минимум | 840 |
Максимум | 2270 | Максимум | 2280 |
Сумма | 50100 | Сумма | 46956 |
Счет | 30 | Счет | 30 |
Уровень надежности(95.0%) | 108,3810672 | Уровень надежности(95.0%) | 129,2893067 |
Предельные ошибки выборки | |||
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." | По столбцу "Выпуск продукции, млн.руб" | ||
Столбец1 |
| Столбец2 |
|
Уровень надежности(68.0%) | 53,61761954 | Уровень надежности(68.0%) | 63,9612161 |
Выборочные показатели вариации | |||
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." | По столбцу "Выпуск продукции, млн.руб" | ||
Стандартное отклонение | 285,371337 | Стандартное отклонение | 340,423501 |
Дисперсия | 81436,8 | Дисперсия | 115888,16 |
Коэффициент вариации, % | 17,08810401 | Коэффициент вариации, % | 21,74952089 |
Карман | Частота | ||
1 | |||
1310 | 3 | ||
1550 | 5 | ||
1790 | 11 | ||
2030 | 7 | ||
2270 | 3 | ||
|
| ||
Интервальный ряд распределения предприятий по стоимости основных производственных фондов | |||
Группа предприятий по стоимости основных фондов | Число предприятий в группе | Накопленная частость группы.% | |
1070-1310 | 4 | 13,33% | |
1310-1550 | 5 | 30,00% | |
1550-1790 | 11 | 66,67% | |
1790-2030 | 7 | 90,00% | |
2030-2270 | 3 | 100,00% |
Рис. 1
Рис. 2
0>0>