142326 (726539)
Текст из файла
Реферат
Социальные различия имущественной обеспеченности населения в российских регионах
(на основе данных Госкомстата РФ)
Москва, 2008
Содержание
Введение
Выбор методов
Описание использованных данных
Анализ и интерпретация
Список использованных источников
Приложение. Порядок выполнения анализа в SPSS
Введение
Проблема изучения различий в материальной обеспеченности населения России в региональном аспекте является весьма актуальной для нашей страны. Дело в том, что огромная территория страны подразделена на множество регионов, каждый из которых имеет своё управление, свой климат, природные богатства, свой экономический и социальный потенциал, даже своё законодательство по отдельным вопросам. При этом для обеспечения территориально-административной целостности страны выгодно было бы, чтобы между российскими регионами не существовало чрезмерных различий в экономическом развитии и уровне жизни населения. Исключительная поляризация регионов по социально-экономическим показателям приводит к нарушению различных миграционных балансов, появлению устойчиво отсталых регионов, перенаселению отдельных регионов (например, московский регион) с сопутствующим этим процессам багажом социальных проблем. Кроме прочего, сильная дифференциация между регионами способствует усилению социальной напряжённости, лишает население России понимания того, что они живут в единой стране (вспомним хотя бы многочисленные шутки и анекдоты относительно того, что современная Москва – это государство в государстве и москвичи, порой, не понимают, что за пределами Москвы есть ещё «какая-то Россия»).
Поэтому я воспользовавшись процедурами кластерного анализа решила посмотреть, можно ли разбить российские регионы на однородные группы по ряду показателей, характеризующих обеспеченность и неравенство населения по денежным доходам (например, коэффициенты неравенства доходов – Джини и коэффициент фондов, соотношения различных показателей доходов с величиной прожиточного минимума (далее – с ПМ), численности населения с доходами, ниже ПМ). Ясно, что в России есть «богатые» и «бедные» регионы. Однако, поскольку прожиточный минимум в бедных регионах, как правило ниже ПМ в богатых, можно предположить, что в этом плане уровень жизни в первых и вторых может и не слишком различаться. Ответ на этот вопрос (есть ли обособленные группы регионов или нет) и поможет нам дать проводимый далее анализ.
Естественно, что в данной работе используются данные региональной статистики, которые являются большой частью всей государственной статистики. Положительным моментом, связанным с использованием официальных статистических данных для характеристики уровня жизни населения является «повсеместный охват всей территории страны и единообразная методология и методика получения данных, что важно для межрегиональных сравнений» [2]. Л. А. Беляева отмечает и недостатки, связанные с использованием официальной статистики: недоучёт реальных доходов вследствие их сокрытия населением, условности, связанные с расчётом величины прожиточного минимума (она используется в нашей работе), а также – принципиальный недостаток, связанный с потерей связи опубликованных данных со многими параметрами, которые влияют на положение каждого отдельного индивида. Но в данном случае нас интересуют межрегиональные сопоставления, это во-первых, а во вторых – общие закономерности в развитии регионов, так что от точной оценки доходов тут, конечно, мало что зависит. В работе изучается социально-экономическое положение (прежде всего - дифференциация по доходам) в регионах РФ. Исследуются различия в социально-экономическом положении населения в регионах. На основе статистических исследований Росстата, построена разобрана кластерная модель распределения регионов России по социально-экономическому положению. Методологическая часть содержит краткое описание используемых методов анализа: теоретические аспекты, а также практическое применение для построения статистической модели - группировки регионов России по показателям обеспеченности населения.
Итак, целью данной работы являлось распределение регионов России по однородным группам и установление качественных взаимосвязей между группами регионов с близкими значениями показателей социально-экономического положения. Задача решается с помощью кластерного анализа в системе SPSS.
Выбор методов
При анализе социально-экономических процессов приходится довольно часто сталкиваться с многомерностью их описания. В маркетинге, например, это случается при решении задачи сегментирования рынка, в экономике – при построении типологии стран, в социологии – при анализе мнений респондентов по разным вопросам, в социальной статистике – как сейчас, при изучении регионов, каждый из которых описывается по множеству параметров. Многомерный анализ, куда входит и кластерный анализ - важный количественный инструмент исследования социально-экономических процессов, которые характеризуются большим числом показателей. Название кластерный анализ происходит от английского cluster (гроздь, скопление). Впервые определение кластерного анализа и его описание были даны в 1939 Трионом (Tryon). «Главное назначение кластерного анализа - разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней. Методы кластерного анализа можно применять в самых различных случаях, даже в тех случаях, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству» [9].
Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы экономической информации, делать их компактными и наглядными, то есть, в нашем случае – рассматривать не каждый регион в отдельности, а группы регионов, сравнивать их между собой.
Для проведения кластерного анализа используются различные компьютерные программы. Процесс кластерного анализа данных в системе SPSS включает в себя следующие этапы:
-
Ввод данных в систему;
-
Преобразование данных, адекватное методу кластерного анализа;
-
Визуализацию данных с помощью различных типов графиков;
-
Реализацию алгоритма метода кластерного анализа;
-
Вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;
-
Интерпретацию полученных результатов.
Общий принцип кластерного анализа (КА) такой. Если некая совокупность содержит набор объектов, свойства которых описываются с помощью некоторых признаков, то задача КА заключается в разбиении совокупности объектов на группы, такие, чтобы каждый объект входил только в одну группу, объекты из одной и той же группы были похожи друг на друга, а объекты из разных групп имели заметные различия. Группы сходных друг с другом объектов называют кластерами. Разбивку исходной совокупности на кластеры называют кластерным решением [4, 5].
Как правило, общее количество кластеров и их примерный состав заранее не известны. Для отыскания и исследования кластеров применяются вычислительные алгоритмы, использующие различные способы измерения сходства объектов и групп объектов и различные схемы поиска кластерного решения. В данной работе используются алгоритмы кластерного анализа иерархический и k-средних. Их взаимодействие такое. С помощью иерархического анализа мы проводим предварительный анализ и находим, на какое число кластеров можно было бы разбить всю совокупность регионов. После этого мы проводим кластерный анализ методом k-средних, задав разбиение на выбранное число кластеров. Такая схема рекомендуется в некоторых методических публикациях [5].
Важно отметить ещё такой момент. Довольно часто признаки имеют разный масштаб и разные единицы измерения. Признак, имеющий большую изменчивость (большую дисперсию), вносит больший вклад в величину расстояния между объектами, чем другие признаки при проведении кластерного анализа. И наоборот: признаки с малой изменчивостью (малой дисперсией) фактически не влияют на величины. Поэтому при больших различиях изменчивости рекомендуется провести стандартизацию данных и попробовать найти кластерное решение на основе стандартизированных данных. Стандартизация заключается в вычитании из значения признака его среднего значения и делении результата на стандартное отклонение признака. Стандартизированные значения иногда также называют Z-вкладами [7].
Описание использованных данных
В данной работе используются данные из сборника Госкомстата «Социальное положение и уровень жизни населения России. 2005» за 2004 год [1]. То есть, сборник выпущен в 2005 году, но, поскольку статистическому учёту на такой большой территории как Россия присуще некоторое запаздывание, данные относятся к 2004 году.
Данный вид информации собирается Федеральной службой государственной статистики (Росстатом). Как следует из методологических пояснений к данным, «главной задачей Росстата является удовлетворение потребностей органов власти и управления, средств массовой информации, населения, научной общественности, международных организаций в разнообразной, объективной и полной информации … Международная экспертиза признала статистические данные Федеральной службы государственной статистики надежными … Сбор статистических данных проводится органами государственной статистики в соответствии с Федеральной программой статистических работ, ежегодно утверждаемой Росстатом по согласованию с Правительством Российской Федерации. Обследование организовано во всех субъектах Российской Федерации» [1]
Таким образом, в нашем распоряжении имеются данные о социально-экономической обстановке по регионам Российской Федерации. Указанный уровень обобщения (регион) будет представлять исходные данные для построения кластерной модели в нашей работе. См. пример данных в таблице 1. Полностью данные приведены в сборнике [1].
Таблица 1 «Показатели социально-экономической дифференциации регионов РФ за 2004 г» (фрагмент)
| Регион | Коэффициент Джини | Коэффициент фондов | Соотношение среднедушевых денежных доходов с величиной ПМ, % | Соотношение среднемесячной начисленной зарплаты с величиной ПМ, % | Соотношение среднего размера назначенных месячных пенсий с величиной ПМ, % | Численность населения с денежными доходами ниже величины ПМ |
| Белгородская область | 0,352 | 10,2 | 244,2 | 263,o | 125,2 | 21,2 |
| Брянская обл. область | 0,355 | 10,3 | 223,2 | 209,2 | 125,2 | 25,3 |
| … | … | … | … | … | … | … |
| Санкт-Петербург | 0,410 | 15,3 | 381,3 | 267,3 | 106,2 | 13,5 |
Единицей наблюдения является регион, а показателями – статистика по этому региону, полученная на основе исследований. Хотя данные присутствовали почти по всем российским регионам, в анализе была использована информация только по 70 из них, включая Москву и Санкт-Петербург (о причинах этого см. ниже).
Регион характеризуется 6 показателями. По результатам кластерного анализа можно ожидать появление «богатых» и «бедных» регионов (или же регионов с высоким и низким уровнем жизни). В данном случае нас интересует типовые группы регионов рассматриваемых по схожим социально-экономическим показателям.
Для работы с базой данных и статистического анализа используется статистический пакет SPSS 13.0 для Windows. Для обработки в статистическом пакете информация должна быть организована в особом виде. Традиционным представлением является прямоугольная таблица, матрица данных. В исходных данных представлена статистика по регионам, а также – информация по группам регионов (федеральным округам) и России в целом. Для того чтобы обработать данные в статистическом пакете, нужно привести их к нужной структуре т.е. оставить только информацию по регионам.
В файле данных информация по показателям социально-экономического положения представлена переменными (информация об одном и том же показателе записывается в один столбец, а регион формирует строку файла данных). Список переменных с их краткой характеристикой из [1] представлен в таблице 2.
Таблица 2 «Список переменных »
| № | Имя | Тип | Описание | Смысл показателя |
| 1 | Region | Номинальный | Регион | Регион |
| 2 | Gini | Числовой | Коэффициент Джини | (индекс концентрации доходов / заработной платы) Характеризует степень отклонения линии фактического распределения общего объема доходов /заработной платы от линии их равномерного распределения. |
| 3 | Fond | Числовой | Коэффициент Фондов | Коэффициент дифференциации доходов / заработной платы. Характеризует степень соц. расслоения и определяется как соотношение между средними уровнями денежных доходов / заработной платы 10% процентов населения (работников) с самыми высокими доходами и 10 % процентов населения (работников) с самыми низкими доходами / заработной платой |
| 4 | Sdohod | Числовой | Соотношение среднедушевых денежных доходов с величиной ПМ, % | Характеризует общий уровень денежных доходов населения относительно установленного прожиточного минимума |
| 5 | Szarplata | Числовой | Соотношение среднемесячной начисленной зарплаты с величиной ПМ, % | Характеризует общий уровень заработной платы населения относительно установленного прожиточного минимума |
| 6 | Spensii | Числовой | Соотношение среднего размера назначенных месячных пенсий с величиной ПМ, % | Характеризует общий уровень пенсий населения относительно установленного прожиточного минимума. |
| 7 | ChislMin | Числовой | Численность населения с денежными доходами ниже величины ПМ | Определяется на основе данных о распределении населения по величине среднедушевых денежных доходов и является результатом их соизмерения с величиной прожиточного минимума |
На практике большую проблему представляют пропущенные значения (пункты, по которым отсутствует информация). Связано это с тем, что нельзя отнести регион к какому либо кластеру, не имея полной информации о нем. В данной таблице пропусков довольно мало. Информация полностью отсутствует по Чеченской Республике. Статистические исследования в этом регионе не проводились в связи с проходившими на территории Чечни военными действиями. Также, вне зоны нашего внимания останутся такие регионы как Архангельская область, Пермская область, Тюменская область, Красноярский край, Иркутская область и Читинская область из-за частичного или полного отсутствия статистических данных. По остальным регионам, включая Москву и Петербург, все данные находятся в нашем распоряжении. Поэтому в дальнейшем исключим выше перечисленные субъекты из рассмотрения, и модель будем строить на базе информации о 70 регионах РФ.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.












