Статистическое изучение вариаций
Тема №5
Статистическое изучение вариаций
1. Абсолютные показатели вариации
2. Относительные показатели вариации
3. Вариации альтернативного признака
4. Виды дисперсий и правила их сложения
5. Анализ частотных распределений.
Средние величины и показатели вариации широко применяются для характеристики статистических совокупностей по варьирующим признакам.
Средняя величина является обобщенной характеристикой для однородной совокупности и определяет общие условия в отношении изучаемого признака. Но для всесторонне характеристики вариационного ряда необходимо установить степень колебаемости для некоторых значений признака.
Рекомендуемые материалы
Показатели вариации – показатели, характеризующие колебаемость признаков.
Для определения абсолютной меры колебаемости признаков или величины вариации применяют абсолютные средние размеры вариации:
· размах вариации;
· среднее линейное отклонение;
· дисперсия признака;
· среднее квадратическое отклонение.
1. Размах вариации – это абсолютная разность между max и min значениями признака в совокупности:
2. Среднее линейное отклонение определяется из отклонений индивидуальных значений признака от средней величины без учета знака этих отклонений. Оно измеряет отклонение средней варианты. Формула среднего линейного отклонения не взвешенной и взвешенной:
3. Дисперсия – определяется как среднее из отклонений индивидуальных значений признака от средней величины, возведенной в квадрат. Формула дисперсии не взвешенная и взвешенная:
4. Среднее квадратическое отклонение показывает на сколько в среднем отклоняются конкретные значения признака от их среднего значения. Выражается в тех же единицах измерения, что и сам признак. Формула среднего квадратического отклонения не взвешенная и взвешенная:
Среднее квадратическое отклонение является мерой надежности средней величины, т.е. чем оно меньше, тем точнее среднее арифметическое отражает собой всю изученную совокупность.
Свойства дисперсии:
1. D(С) = 0
2. Постоянный множитель можно выносить за знак дисперсии, возводя его при этом в квадрат:
3. Дисперсия суммы и разности определенного выражения равна сумме их дисперсий:
4. Дисперсия произведения случайных величин равна произведению их дисперсий:
5. Дисперсия равна разности между математическим ожиданием квадрата случайной величины и квадрата ее математического ожидания:
Для сравнения интенсивности вариации и сравнения ее в различных совокупностях применяют относительные показатели вариации. Они вычисляются как отношение абсолютных показателей силы вариации к средней арифметической величине признака.
1. Относительный размах вариации: Он отражает относительную меру колебаний кратных значений вокруг средней.
2. Относительное линейное отклонение: Он отражает долю усредненного значения абсолютного отклонения от средней величины.
3. Коэффициент вариации: С помощью этого показателя можно определить однородна ли исследуемая совокупность: если , то совокупность однородна.
Дисперсия альтернативного признака:
· p – доля единиц, обладающих данным признаком
o m – число единиц, обладающих данным признаком;
o n – объем совокупности;
· q – доля единиц, которые не обладают данным признаком .
Пример: вычислить дисперсию альтернативного признака по следующим данным – налоговой службой одного из районов города проверено 86 киосков и в 37 обнаружены финансовые нарушения.
Предельное значение дисперсии альтернативного признака равна 0,25 , при
Виды дисперсии и правила их сложения:
1. Общая дисперсия измеряет вариации признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:
2. Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изученного признака, возникающие под влиянием признака фактора, положенного в основание группировки:
– среднее значение признака в отдельной группе;
– среднее значение признака по всей совокупности.
Межгрупповая дисперсия доли:
3. Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака фактора положенного в основание группировки:
Общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсии, проявляющего под влиянием группировочного признака, и дисперсии, возникающей под действием всех прочих факторов:
Правило сложения дисперсии применяется при вычислении показателей тесноты связей и ряде других случаев:
1. Показатель эмпирический коэффициент детерминации показывает удельный вес общей вариации изучаемого признака, обусловленного вариацией обусловленного признака. Он представляет собой долю межгрупповой дисперсии в общей:
2. Эмпирическое корреляционное отношение: Чем ближе к 1, тем связь теснее.
Во многих вариационных рядах распределения можно заметить определенную зависимость между изменением значения варьирующегося признака и частот. Частоты могут сначала увеличиваться, с увеличением значений признака, а затем с середины ряда уменьшаться. Такие закономерности изменения частот в вариационных рядах называются закономерностями распределения.
Одна из важнейших целей изучения вариационных рядов – это выявить закономерность распределения и определить ее характер.
Кривая распределения – это график, изображенный в виде непрерывной линии, изменения частот в вариационном ряду функционально связанного с изменением варианты.
Кривые распределения бывают:
· одновременные:
o симметричные;
o ассиметричные.
· многовременные.
1. При изучении ассиметрии изучают показатель ассиметрии, который определяется по формуле:
Для интервального вариационного ряда существуют следующие формулы для подсчета моды и медианы:
· – нижняя граница модального интервала;
· h – величина модального интервала;
· – частота модального интервала;
· – частота интервала предшествующего модальному;
· – частота интервала следующего за модальным.
Модальный интервал – тот интервал, в котором наблюдается наибольшая частота.
Медианный интервал – тот интервал, в котором сумма накопленных частот превышает половину.
– нижняя граница медианного интервала;
h – величина медианного интервала;
Обратите внимание на лекцию "3.1. Внутреннее построение микропроцессора".
n – число единиц или объем совокупности;
– сумма накопленных частот, предшествующих медианному интервалу;
– частота медианного интервала.
Если, , то правосторонняя ассиметрия, если , то левосторонняя ассиметрия. Если , то ассиметрия значительна, если , ассиметрия незначительна.
2. Показатель эксцесса определяется по формуле:
Если , то распределение островершинное, если , то распределение плосковершинное.