181846 (629220), страница 2
Текст из файла (страница 2)
Используя в аналитических группировках методы математической статистики, можно определить показатель тесноты (силы) связи между изучаемыми признаками.
В зависимости от степени сложности массового явления и от задач анализа группировки могут производиться по одному или нескольким признакам.
Если группы образуются по одному признаку, группировка называется простой, группировка по двум и более признакам называется сложной.
Если группы, образованные одному признаку, делятся на подгруппы по второму а последние - на подгруппы по третьему и т.д. признакам, т.е. в основании группировки лежит несколько признаков взятых в комбинации, то такая группировка называется комбинационной. Комбинационная группировка позволяет выявить и сравнить различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированных группировок по ряду группировочных признаков. Однако при изучении влияния большого числа признаков применение комбинационных группировок, становится невозможным, поскольку чрезмерное дробление информации затушевывает проявления закономерностей. Даже при наличии большого массива первичной информации приходится ограничиваться двумя - четырьмя признаками.
Использование в статистических исследованиях ЭВМ и статистической теории распознавания образов позволило разработать метод группировки совокупности единиц одновременно по множеству характеризующих признаков. Такие группировки получили название многомерных.
Многомерная группировка, или многомерная классификация, основана на измерении сходства или различия между объектами (единицами): единицы, отнесенные к одной группе (классу), различающихся между собой меньше, чем единицы, отнесенные к различным группам (классам). Мерой близости (сходства) между объектами могут служить различные критерии. Самой распространенной.мерой близости является евклидово расстояние между объектами, представленными точками в n-мерном пространстве. Чем меньше это расстояние, тем больше близость.
Задача многомерной группировки сводится к выделению сгущений точек (объектов) в n-мерном пространстве. Группы (кластеры) формируются на основании близости объектов одновременно по всему комплексу признаков, описывающих объект. Нахождение этих групп осуществляется методами кластерного анализа, на ЭВМ.
Многомерные группировки позволяют решать целый ряд таких важных задач экономико-статистического исследования, как формирование однородных совокупностей, выбор существенных признаков, выделение типичных групп объектов и др.
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить, количество групп и интервалы группировки. Интервал - количественное значение, отделяющее одну единицу (группу) от другой, т.е. интервал очерчивает количественные границы групп.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе. Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.
Таким образом; при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество выделяемых групп существенное влияние доказывает степень вариации группировочного признака: чем она больше, тем больше следует образовать групп.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
n = 1 + 3,322 lg N (4)
где N – численность единиц совокупности.
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы.
Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке товаров по одному цвету, по наименованию и т.д.). Для группировок групп с равными интервалами величина интервала:
(5)
где Xmax, Xmin – наибольшее и наименьшее значения признака;
n – число групп.
Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы и открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов
Все вышесказанное относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки и могут быть несопоставимы из-за различного числа выделяемых групп или неодинаковых границ интервалов. Для приведения таких: группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная, группировка – образование новых групп на основе ранее осуществленной, группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путём их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Статистические ряды распределения.
После определения группировочного признака и границ групп строится ряд распределения.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет, судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.
Ряды распределения, построенные по количественному признаку, называются вариационными. Например, распределение продукции по стоимости, по массе, по количеству затраченного времени на изготовление единицы продукции.
Вариационные ряды распределения состоят из двух элементов вариантов и частот.
Вариантами называются числовые значения количественного признака в вариационном ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты положительные (прибыль) и отрицательные, (убыток) числа. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.
Частости – это частоты, выраженные в виде относительных величин, (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения (например; количество готовой продукции на складе(шт.)), интервальные – на непрерывных признаках (имеющих любые значения, в том числе и дробные).
Первым шагом в упорядочении первичного ряда является его ранжирование; т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.
Например, масса изделий 22 наименований характеризуется следующими данными:
2, 4, 5, 5, 6, б, 5, 6, 6, 7, 7, 8, 8, 9, 10, 11, 4, 3, 3, 4, 4 и 5 килограммов. Ранжированный ряд:
2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 10, 11 килограммов. При рассмотрении Первичных данных можно видеть, что одинаковые варианты признака у отдельных единиц повторяются (здесь и далее f – частота повторений, n – объём изучаемой совокупности). Способы построения дискретных и интервальных рядов различны. Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, обозначаемые через Xi а затем подсчитывается частота повторения каждого варианта fi.. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых приводятся варианты, а в другой – частоты. Построение дискретного вариационного ряда не составляет труда.
Проиллюстрируем построение интервального вариационного ряда по данным приведенного выше примера распределения изделий по массе.
Для нашего примера, согласно формуле Стерджесса (4), при N=22 число групп п = 5. Зная число групп, определим величину интервала по формуле (5):
i = (Xmax – Xmin) / n = (11 – 2) / 5 = 1,8 ≈ 2
В результате получим следующий ряд распределения изделий по массе (Σf = 22):
X… 2 – 4 4 – 6 6 – 8 8 – 10 10 – 12
f… 3 8 6 3 2
Как видно из данного распределения, основная масса рабочих имеет стаж работы от 4 до 8 лет3.
Глава 2. Расчётная часть
Задание 1
По исходным данным табл. 1:
1. Постройте статистический ряд распределения организаций по признаку уровень выпуска продукции, образовав пять групп с равными интервалами.
-
Постройте графики полученного ряда распределения. Графически определите значения моды и медианы.
3. Рассчитайте характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
4. Вычислите среднюю арифметическую по исходным данным (табл. 1), сравните её с аналогичным показателем, рассчитанным в п. 3 настоящего задания. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Таблица 1 Исходные данные
№ организации | Выпуск продукции, млн. руб. | Среднесписочная численность работников, чел. | Затраты на Фонд производство заработной продукции платы, млн. руб. млн. руб. |
1 | 36,450 | 162 | 11,340 30,255 |
2 | 23,400 | 156 | 8,112 20,124 |
3 | 46,540 | 179 | 15,036 38,163 |
4 | 59,752 | 194 | 19,012 47,204 |
5 | 41,415 | 165 | 13,035 33,546 |
6 | 26,860 | 158 | 8,532 22,831 |
7 | 79,200 | 220 | 26,400 60,984 |
8 | 54,720 | 190 | 17,100 43,776 |
9 | 40,424 | 163 | 12,062 33,148 |
10 | 30,210 | 159 | 9,540 25,376 |
11 | 42,418 | 167 | 13,694 34,359 |
12 | 64,575 | 205 | 21,320 51,014 |
13 | 51,612 | 187 | 16,082 41,806 |
14 | 35,420 | 161 | 10,465 29,753 |
15 | 14,400 | 120 | 4,320 12,528 |
16 | 36,936 | 162 | 11,502 31,026 |
17 | 53,392 | 188 | 16,356 42,714 |
18 | 41,000 | 164 | 12,792 33,62 |
19 | 55,680 | 192 | 17,472 43,967 |
20 | 18,200 | 130 | 5,850 15,652 |
21 | 31,800 | 159 | 9,858 26,394 |
22 | 39,204 | 162 | 11,826 32,539 |
23 | 57,128 | 193 | 18, 142 45,702 |
24 | 28,440 | 158 | 8,848 23,89 |
25 | 43,344 | 168 | 13,944 35,542 |
26 | 70,820 | 208 | 23,920 54,454 |
27 | 41,832 | 166 | 13,280 34,302 |
28 | 69,345 | 207 | 22,356 54,089 |
29 | 35,903 | 161 | 10,948 30,159 |
30 | 50,220 | 186 | 15,810 40,678 |
Решение:
1. Построим интервальный вариационный ряд с 5 равными интервалами, для этого построим ранжированный ряд предприятий по производительности труда в порядке возрастания. Результаты представлены в таблице 2.
Таблица 2 Ранжированный ряд по признаку выпуск продукции
№ организации | Выпуск продукции, млн. руб. | Среднесписочная численность работников, чел. | Фонд заработ- Затраты на ной платы, производство млн.руб. продукции, млн. руб. |
15 | 14,4 | 120 | 4,320 12,528 |
20 | 18,2 | 130 | 5,850 15,652 |
2 | 23,4 | 156 | 8,112 20,124 |
6 | 26,86 | 158 | 8,532 22,831 |
24 | 28,44 | 158 | 8,848 23,89 |
10 | 30,21 | 159 | 9,540 25,376 |
21 | 31,8 | 159 | 9,858 26,394 |
14 | 35,42 | 161 | 10,465 29,753 |
29 | 35,903 | 161 | 10,948 30,159 |
1 | 36,45 | 162 | 11,340 30,255 |
16 | 36,936 | 162 | 11,502 31,026 |
22 | 39,204 | 162 | 11,826 32,539 |
9 | 40,424 | 163 | 12,062 33,148 |
18 | 41 | 164 | 12,792 33,62 |
5 | 41,415 | 165 | 13,035 33,546 |
27 | 41,832 | 166 | 13,280 34,302 |
11 | 42,418 | 167 | 13,694 34,359 |
25 | 43,344 | 168 | 13,944 35,542 |
3 | 46,54 | 179 | 15,036 38,163 |
30 | 50,22 | 186 | 15,810 40,678 |
13 | 51,612 | 187 | 16,082 41,806 |
17 | 53,392 | 188 | 16,356 42,714 |
8 | 54,72 | 190 | 17,100 43,776 |
19 | 55,68 | 192 | 17,472 43,967 |
23 | 57,128 | 193 | 18,142 45,702 |
4 | 59,752 | 194 | 19,012 47,204 |
12 | 64,575 | 205 | 21,320 51,014 |
28 | 69,345 | 207 | 22,356 54,089 |
26 | 70,82 | 208 | 23,920 54,454 |
7 | 79,2 | 220 | 26,400 60,984 |
Итого | 1320,64 |
В случае если интервалы равные, то их величина определяется по формуле (5):