Конспект лекций по метрологии (1024349), страница 6
Текст из файла (страница 6)
Пусть случайная величина принимает значения на интервале [a, b] (не обязательно конечном), тогда
СВОЙСТВА ПЛОТНОСТИ ВЕРОЯТНОСТИ
СВОЙСТВА ХАРАКТЕРИСТИЧЕСКОЙ ФУНКЦИИ
5. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Аппарат математической статистики является основным при обработке результатов наблюдений, поскольку только с его помощью удается получить оценки значений измеряемой величины.
Рассмотрим две, наиболее часто используемые, характеристики случайной величины
m - описывающую центр ее рассеяния и - описывающую величину рассеяния. Значения этих величин можно определить, воспользовавшись выражениями
К сожалению, практическая ценность этих формул невелика, т.к. плотность вероятности случайного процесса w(x) до проведения эксперимента неизвестна (если предположить, что вид закон распределения случайной величины известен, то до начала эксперимента неизвестны его параметры. ).
5.1. ОЦЕНКИ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК СЛУЧАЙНОГО ПРОЦЕССА
На практике вместо величин используют их оценки, полученные по независимым наблюдениям случайной величины
Особенностью оценки любого параметра случайного процесса является то, что относительно ее нельзя сказать, верна она или неверна, так как в определенном смысле задается она произвольно. Тем не менее желательно иметь некоторый критерий, который позволил бы определить качество оценки. Для определения качества оценки используют три критерия в соответствии с которыми:
-
Оценка должна быть несмещенной.
-
Оценка должна быть эффективной.
-
Оценка должна быть состоятельной.
НЕСМЕЩЕННОСТЬ
Оценка называется несмещенной, если ее математическое ожидание совпадает с ее истинным значением
ЭФФЕКТИВНОСТЬ
Оценка называется эффективной, если ее дисперсия при стремлении объема выборки n к бесконечности стремится к нулю
где - оценка какого либо параметра случайной величины.
СОСТОЯТЕЛЬНОСТЬ
Оценка называется состоятельной, если она при объеме выборки n, стремящемся к бесконечности, сходится по вероятности к истинному значению
т.е. вероятность того, что , где - как угодно малое положительное число, при n, стремящемся к бесконечности, стремится к нулю.
В качестве примера рассмотрим оценку среднего значения последовательности независимых случайных величин
т.е. оценка не смещена.
Покажем теперь, что оценка эффективна.
Откуда
Рассмотрим теперь оценку дисперсии
И так оценка дисперсии является смещенной. Однако это можно исправить если в качестве оценки для дисперсии взять величину
Следует отметить, что выражение (2) дает несмещенную оценку дисперсии, если в него вместо оценки среднего подставить математическое ожидание m, действительно
5.2. ВАЖНЕЙШИЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ
5.2.1. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Плотность вероятности нормально распределенной случайной величины имеет вид
где mx - математическое ожидание случайной величины,
2 - дисперсия случайной величины.
Если ввести в рассмотрение стандартизованную случайную величину
то выражение для w(z) будет иметь вид
Действительно
Моменты распределения нормально распределенной случайной величины равны
5.2.2. Хи - КВАДРА РАСПРЕДЕЛЕНИЕ
Пусть z1, z2, .........,zn независимые стандартизованные нормально распределенные случайные величины.
Определим новую случайную величину
Эта величина называется (хи - квадрат) случайной величиной с n - степенями свободы (приложение 5).
Выражение для плотности вероятности этой величины имеет вид
Среднее значение и дисперсия случайной величины, распределенной по закону ,равны
Распределение - является частным случаем гамма распределения. Частными случаями
- распределения являются распределения
Распределение - при n стремится к нормальному распределению. Так при n>30 величина
- распределена приближенно по нормальному закону с математическим ожиданием
и дисперсией
В качестве примера найдем, чему равна дисперсия среднеквадратического отклонения
5.2.3. РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА
Пусть y и z независимые случайные величины. При этом
y- распределено по , а z - стандартизованная, нормально распределенная случайная величина.
Определим случайную величину вида
эта величина имеет распределение Стьюдента с n- степенями свободы (приложение 4). Плотность вероятности случайной величины, имеющей распределение Стьюдента, имеет вид
В качестве примера найдем закон распределения выборочного среднего при неизвестной дисперсии
т.е. данная величина имеет распределение Стьюдента.
5.2.4. F - РАСПРЕДЕЛЕНИЕ ФИШЕРА
Пусть y1 и y2 - независимые случайные величины, распределенные по с n1 и n2 степенями свободы соответственно (приложение 6). Определим величину
Случайная величина - имеет распределение Фишера
с n1 и n2 - степенями свободы (приложение 5).
В качестве примера найдем закон распределения отношения выборочных дисперсий двух независимых случайных величин x, y.
если случайные величины x, y взяты из одной генеральной выборки, то и отношение
- будет иметь распределение Фишера.
5.4. ОТСЕВ ГРУБЫХ ПОГРЕШНОСТЕЙ
Следует особо подчеркнуть, что отбрасывание аномальных значений, исходя только из статистических соображений, может оказаться весьма опасной процедурой. Дело в том, что их присутствие может говорить о том, что исследуемое явление отличается от предполагаемого экспериментатором.
Существует достаточно большое количество критериев, предназначенных для исключения из последовательности наблюдений грубых погрешностей (промахов). Рассмотрим один из критериев, основанный на использовании свойства распределения Стьюдента. В соответствии с данным критерием вначале вычисляются среднее и оценка дисперсии последовательности наблюдений в соответствии с выражениями (1), (2), а затем вычисляется статистика
где - экстремальный (наибольший или наименьший) элемент последовательности наблюдений. Статистика t в случае нормального распределения последовательности наблюдений имеет распределение Стьюдента. На графике (Рис.1) дана зависимость параметра tn распределения Стьюдента от числа экспериментальных данных при уровне значимости =0.05
Если для данного уровня значимости выполняется условие t tn, то наблюдение исключается. После чего, вычисляются оценки среднего и дисперсии для исправленной последовательности наблюдений и вновь выполняется проверка для экстремального значения исправленной последовательности. Процедура повторяется до тех пор, пока не выполнится условие t tn. Статистика t определяется из таблицы приложения 3. Можно предположить, что данный критерий является завышенным, в результате чего будут
Рис.5.1.
отсеяны не только аномальные, но и часть полезных значений.
5.5. ПРоверка гипотез о виде закона распределения случайной величины
Как было отмечено выше, существенным условием при получении интервальных оценок статистических характеристик случайной величины является условие нормальности распределения случайной величины. В связи с этим возникает необходимость проверки гипотезы о виде закона распределения случайной величины.
Наиболее распространенными критериями проверки вида закона распределения случайной величины являются:
-
Критерий Пирсона (критерий 2 ).
-
Критерий Колмогорова.
Следует отметить, что при использовании данных и подобных им критериев проверяется гипотеза о том, что экспериментальные данные не противоречат проверяемой гипотезе. Следовательно одной и той же гипотезе могут удовлетворять (особенно при не очень больших объемах выборки) экспериментальные данные имеющие различные законы распределения (см. приложения 8,9).
5.5.1. КРИТЕРИЙ ПИРСОНА
В соответствии с критерием, область в пределах которой лежат значения выборки случайных величин xi, i=1,2,......,n, разбивается на m интервалов (не обязательно равных). Положим для простоты, что интервалы одинаковы, тогда длина интервала будет равна
Обозначим через mk число попаданий случайной величины xi в k- тый интервал K, тогда случайная величина
где вероятность попадания случайной величины x в k-тый интервал
WT - аналитическое выражение для плотности вероятности случайного процесса, на соответствие которой проверяют экспериментальные данные. При достаточно большом объеме выборки n30 случайная величина будет распределена по закону хи - квадрат с числом степеней свободы, равным
где r - число связей, определяемых, как число параметров теоретической плотности вероятности, вычисляемых по выборке случайной величины.