Полный конспект лекций по статистике. (Конспект лекций по статистике), страница 5
Описание файла
Файл "Полный конспект лекций по статистике." внутри архива находится в папке "Конспект лекций по статистике". Документ из архива "Конспект лекций по статистике", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "теория вероятности и математическая статистика" в общих файлах.
Онлайн просмотр документа "Полный конспект лекций по статистике."
Текст 5 страницы из документа "Полный конспект лекций по статистике."
Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Величина интервала определяется по формуле , где
xmax, min - максимальное и минимальное значение признака, к – число групп.
Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается , где к – число вариантов значения признака.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.: , при этом
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.
В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.
Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения. Его кривая выражается уравнением
где у - ордината кривой нормального распределения; - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.
Теоретические частоты при нормальном распределении определяются по формуле: , где N = f – сумма всех эмпирических частот вариационного ряда; h – величина интервала в группах.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии ( ), такой ряд выравнивается по кривой Пуассона.
Кривую Пуассона можно выразить отношением , где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.
Теоретические частоты при распределении Пуассона определяют по формуле: f’ = N Px , где N – общее число единиц ряда.
Для расчета обобщающих показателей и для графического изображения вариационных рядов с неравными интервалами используют плотность распределения, которая определяется по формулам:
где - абсолютная плотность распределения в j-м интервале, - относительная плотность распределения в j-м интервале; ij – величина интервала.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее распространенным является критерий согласия К. Пирсона, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам:
Вычисленное значение критерия 2расч необходимо сравнить с табличным (критическим) значением 2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.
Если 2расч 2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского (КРом), который, используя величину 2, предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения: , где m - число групп; k = (m - 3 ) - число степеней свободы при исчислении частот нормального распределения.
Если вышеуказанное отношение 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле: , где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; f - сумма эмпирических частот.
По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
При анализе вариационного ряда и его свойств используют графические методы. Интервальный ряд изображаю столбиковой диаграммой или гистограммой, в которой основания столбиков, расположенные на оси – абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты.
Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого ряда называют полигоном.
Преобразованной формой вариационного ряда является ряд накопленных частот. Это ряд значений числа единиц совокупности с меньшими или равными нижней границе соответствующего интервала значениями признака. Такой ряд называют кумулятивным. Можно построить кумулятивное распределение «не меньше, чем» – кумулята, и «больше, чем» – огива.
Тема № 8. Выборочное наблюдение.
Основы выборочного метода
Выборочное наблюдение – одно из наиболее современных видов статистического наблюдения. Выборочное наблюдение – это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных, для того чтобы охарактеризовать всю совокупность в целом.
Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или репрезентатировать соответствующие показатели совокупности в целом.
Логика выборочного наблюдения
-
определение объекта и целей выборочного наблюдения;
-
выбор схема отбора единиц для наблюдения;
-
расчет объема выборки;
-
проведение случайного отбора установленного числа единиц из генеральной совокупности;
-
наблюдение отобранных единиц по установленной программе;
-
расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
-
определение ошибки, ее размера;
-
распространение выборочных данных на генеральную совокупность;
-
анализ полученных данных.
Основные преимущества
-
Выборочное наблюдение можно осуществить по более широкой программе.
-
Выборочное наблюдение более дешевое с точки зрения затрат на его проведение.
-
Выборочное наблюдение можно организовать тогда и в тех случаях, когда отчетностью мы воспользоваться не можем.
Основные недостатки
-
Полученные данные всегда содержат в себе ошибку, о результатах наблюдения можно судить лишь с определенной степенью достоверности. Но по сравнению с другими видами наблюдения это достоинство выборочного метода.
-
Для его проведения требуются квалифицированные кадры.
Вся совокупность единиц, из которых производится отбор, называется генеральной. Совокупность единиц отобранных называется выборочной.
Ошибки выборки
Чтобы оценить степень точности выборочного наблюдения, необходимо оценить величину ошибок, которые могут возникнуть в процессе проведения выборочного наблюдения.
О
сновное внимание уделяется случайным ошибкам репрезентативности.