Социальная статистика (856391), страница 6
Текст из файла (страница 6)
Числовые характеристики распределения данныхМы рассмотрели частотное распределение значений рассматриваемого признака. Каждоераспределение может дать представление об изучаемой совокупности. Однако, этим анализраспределения данных признака не ограничивается, т.к. частотное распределение ничего не говорит остатистических закономерностях, которые описывали бы числовые характеристикиизучаемойсовокупности.К характеристикам распределения, описывающим количественно его структуру и строениеотносятся :• характеристики положения;• рассеивания;• ассиметрии и эксцесса.15Оценка центральной тенденцииК характеристикам положения относятся следующие оценки центральной тенденции: мода (Мо),медиана (Ме), квантили и среднее арифметическое (М).Важное значение имеет такая величина признака, которая встречается чаще всего в изучаемомряду, в совокупности.
Такая величина называется модой (Мо). В дискретном ряду Мо определяется безвычисления как значение признака с наибольшей частотой(например, по данным таблицы 2.1. Мо= 13).При расчете моды может возникнуть несколько ситуаций:1. Два значения признака, стоящие рядом, встречаются одинаково часто. В этом случае модаравна среднему арифметическому этих двух значений. Например, в следующем ряду данных : 12, 13,14, 14, 14, 16, 16, 16, 18, 19Мо= (14+16)/2= 15.2. Два значения, встречаются также одинаково часто, но не стоят рядом. В этом случае говорят,что ряд данных имеет две моды, т.е.
он бимодальный.3. Если все значения данных встречаются одинаково часто, то говорят что ряд не имеет моды.Чаще всего встречаются ряды данных с одним модальным значением признака. Если в рядуданных встречается два или более равных значений признака, то говорят о неоднородностисовокупности.Вторая числовая характеристика ряда данных называется медианой (Ме) – это такое значениепризнака, которое делит ряд пополам. Иначе, медиана обладает тем свойством, что половина всехвыборочных значений признака меньше её, половина больше.
При нечетном числе элементов в рядуданных, медиана равна центральному члену ряда, а при четном среднему арифметическому двухцентральных значений ряда. В нашем примере (таблица 2.1.) Ме=(13+13)/2=13. Вычисление медианыимеет смысл только для порядкового признака.Среднее арифметическое значение признакагде xi – значения признакаn – количество данных в рассматриваемом ряду.Среднее арифметическое значение признака, вычисленное для какой-либо группы,интерпретируется как значение наиболее типичного для этой группы человека. Однако бывают случаи,когда подобная интерпретация несостоятельна (в случае, если существует большая разница междуминимальным и максимальным значениями признака).Квантиль – это такое значение признака, которое делит распределение в заданной пропорции :слева 0,5%, справа 99,5%; слева 2,5%, справа 97,5% и т.п.
Обычно выделяют следующие разновидностиквантилей:Квартили Q1, Q 2, Q3 – они делят распределение на четыре части по25% в каждой;Квинтили К1, К2, К3, К4 – они делят распределение на пять частей по20% в каждой;Децили D1, ..., D9, их девять, и они делят распределение на десять частейпо 10% в каждой;Процентили P1, Р2 ...,Р99, их девяносто девять, и они делят распределение на сто частей по 1% вкаждой части.Поскольку процентиль — наиболее мелкое деление, то все другие квантили могут бытьпредставлены через процентили.
Так, первый квартиль — это двадцать пятый процентиль, первыйквинтиль — второй дециль или двадцатый процентиль, и т.п.Характеристики рассеиванияИспользуя для описания ряда значений признака, только меру центральной тенденции, можносильно ошибиться в оценке характера изучаемой совокупности. Это хорошо видно на следующемпримере.
Допустим, мы изучаем средний возраст в двух группах, состоящих каждая из 6-ти человек.Значения признака распределились следующим образом:1 группа – 10, 10, 10, 50, 50, 502 группа – 30, 30, 30, 30, 30, 3016Подсчитав среднее значение в каждой из групп, получим М1= 30 и М2=30. Т.е. мы получилиодинаковые значения, тогда как совершенно очевидно, что выборки взяты из разных совокупностей.Ошибка произошла из-за разброса значений возраста в этих группах.Существует несколько способов оценки степени разброса или рассеивания данных. Основнымихарактеристиками рассеивания являются: размах (R), дисперсия (D), среднеквадратическое(стандартное) отклонение (σ— сигма), коэффициент вариации( V).Простейший из параметров распределения, размах — это разность между максимальным иминимальным значениями признака: R = xmax – xmin .Дисперсия показывает разброс значений признака относительно своего среднегоарифметического значения, то есть насколько плотно значения признака группируются вокруг М; чембольше разброс, тем сильнее варьируются результаты испытуемых в данной группе, тем большеиндивидуальные различия между испытуемыми:Из формулы видно, что дисперсия имеет "квадратный размер": если величина измерена в баллах,то дисперсия характеризует ее разброс в "баллах в квадрате", и т.п.
Большую наглядность в отношенииразброса имеет среднеквадратическое отклонение, так как его размерность соответствует размерностиизмеряемой величины:Коэффициент вариации вообще не имеет размерности, что позволяет сравнивать вариативностьслучайных величин, имеющих различную природу:2.3.3. Нормальное распределение признакаРаспределением признака называется закономерность встречаемости разных его значений(Плохинский Н.А., 1970, с.
12).В социальных исследованиях чаще всего ссылаются на нормальное распределение.Нормальное распределение характеризуется тем, что крайние значения признака в немвстречаются достаточно редко, а значения, близкие к средней величине - достаточно часто. Нормальнымтакое распределение называется потому, что оно очень часто встречалось в естественно - научныхисследованиях и казалось "нормой" всякого массового случайного проявления признаков.
Этораспределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии,Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). Графикнормального распределения представляет собой колоколообразную кривую (см. рис.2.1).Рисунок 2.1. Кривая нормального распределения17Нормальное распределение выражается следующей формулой:где fотн. - относительные частоты появления каждого конкретного значения случайнойвеличины хi Предполагается, что переменная хi, может принимать бесконечно большие и бесконечномалые значения, количество измерений бесконечно, а интервал квантования мал.По этой формуле при различных значениях среднего арифметического (М) и стандартногоотклонения (σ) получается семейство нормальных кривых.Нормальное распределение имеет колоколообразную форму, асимптотически приближается коси X (то есть может принимать сколь угодно малые значения по ординате при стремлении иксзначений к плюс или минус бесконечности), значения моды, медианы и среднего арифметическогоравны между собой.Свойством нормальных распределений является наличие определенного количества случайнойвеличины (случаев, испытуемых), приходящегося на интервалы между значениями σ, обычно этоколичество измеряют в процентах от общего числа случаев, испытуемых.
Считается, что нормальноераспределение характеризует такие случайные величины, на которые воздействует большое количестворазнообразных факторов, причем сила воздействия одного отдельно взятого фактора значительноменьше суммы воздействий остальных факторов. В результате получается, что чаще наблюдаютсянекоторые средние значения измеряемого параметра, реже крайние, и чем сильнее отличается какое-тозначение от среднего, тем реже оно встречается.
Многие биологические параметры распределеныподобным образом (рост, вес и т.п.).Параметры распределения - это его числовые характеристики, указывающие, где "в среднем"располагаются значения признака, насколько эти значения изменчивы и наблюдается липреимущественное появление определенных значений признака. Наиболее практически важнымипараметрами являются математическое ожидание (М), дисперсия(D), стандартное отклонение(σ),показатели асимметрии (А) и эксцесса (Е).Характеристики ассиметрии и эксцессаМера асимметрии — коэффициент асимметрии (As), рассчитываемый по формулеАссиметрия характеризует степень ассиметричности распределения.
Коэффициент асимметрииизменяется от минус до плюс бесконечности (-∞ < As<+∞), для симметричных распределений As=0 .Мера эксцесса (островершинности) — коэффициент эксцесса (Еx), рассчитываемый по формуле:Коэффициент эксцесса также изменяется от минус до плюс бесконечности(-∞ < Ex<+∞), и Еx=0 для нормального распределения.18Раздел 3.
Специальные методы статистики, применяемые вдемографииРассматриваются задачи изучения состава населения, характеристики состава населения,группировки населения и система показателей.Изучение любого социального процесса начинается с учета численности и структуры группнаселения. Определенным категориям лиц предназначены услуги дошкольных учреждений, учебныхзаведений, служб трудоустройства, служб семьи, диспансеров различного профиля и т. д. Потребности,в удовлетворении которых нуждается каждый человек (пища, одежда, жилье и др.), не могут бытьадресованы абстрактному человеку или суммарной численности жителей, так как, объем и структурапотребностей у разных групп населения существенно различаются.
Подтверждением этому служат,например, разрабатываемые типовые модели потребления продуктов питания для людей разного пола,возраста, вида трудовой деятельности, состояния здоровья. Существенно дифференцированы, также,образ жизни и структура потребностей горожан и сельских жителей, представителей разных социальныхи этнических групп.Необходимо, чтобы социальные процессы в данных конкретно-исторических условияхпротекали, в режиме, близком к оптимальному.