М.А. Маталыцкий, Т.В. Русилко - Теория вероятностей и математическая статистика (1115300), страница 21
Текст из файла (страница 21)
Тогда получаемl¦ ni ≤.Задачи12.1. – 12.25. Используя данные задачи 11.1 – 11.25, вычислить:а) выборочную среднюю,б) моду,в) медиану распределения.Согласно условию задачи указать смысл полученных характеристик.§13. Показатели вариации, моментыСредние величины не отражают изменчивости (вариации) значений признака.Простейшим показателем вариации является вариационныйразмах R = x max − x min .Наибольший интерес представляет мера рассеяния наблюденийвокруг средней арифметической – дисперсия.Дисперсией (выборочной дисперсий) вариационного ряда называется величина1 s¦ ( xi − x) 2 ni .n i =1При расчете дисперсии и других числовых характеристик интервальD = ( x − x) 2 =144ных рядов в качестве xi также используют середины интервалов.Часто для вычисления дисперсии используют упрощенную формулу:2D = x2 − x ,1 s 2¦ x i ni .n i =1Если признак ξ измеряется в метрах, то, очевидно, его дисперсия – в метрах квадратных. Желательно в качестве меры вариациииметь характеристику, выраженную в тех же единицах, что и значения признака.
Такой характеристикой является среднее квадратическое отклонение:где x 2 =.Отношение среднего квадратического отклонения к средней величине признака, выраженное в процентах, называют коэффициентом вариации:σ⋅100 % .xCD ==CxCconst+ x =2 D xσDD= x D=−Cx D x Если коэффициент вариации признака, принимающего толькоположительные значения, высок (например, более 100 %), то, как правило, это свидетельствует о неоднородности значений признака.Дисперсия обладает следующими свойствами, аналогичнымисвойствам дисперсии случайной величины:1.
D (C ) = 0 , C = const ;2., C = const ;3.,.Пример 13.1. Вычислить дисперсию, среднее квадратическоеотклонение и коэффициент вариации напряжения тока в электросетидля примера 11.1.Решение.v=Вычислим дисперсию по упрощенной формулеx2 =1(106 2 + 107 2 ⋅ 3 + 108 2 ⋅ 4 + 109 2 ⋅ 6 + 110 2 ⋅ 8 +30+ 1112 ⋅ 5 + 112 2 ⋅ 2 + 113 2 ) = 11992,9 .145.D = 11992,9 − 109,5 2 = 2,65 .Среднее квадратическое отклонение σ = 2,65 = 1,63 . Вариация1,63⋅100 % = 1,49 % .109,5Средняя арифметическая и дисперсия вариационного ряда являются частными случаями более общего понятия – моментов.ν-го порядка вариационного ряда опНачальный момент ~v=kределяется по формуле:1 s~ν k = ¦ xik ni .n i =1~-го порядка вариационного рядаЦентральный момент µkопределяется по формуле:~ = 1 s ( x − x) k n .µ¦ ikin i =1~ = D.ν1 = x ,, µОчевидно, что ~2Коэффициентом асимметрии вариационного ряда называетсячисло.~Если A s = 0 , то распределение имеет симметричную форму, то естьварианты, равноудаленные от x , имеют одинаковую частоту.
При~~A s > 0 ( A s < 0 ) говорят о положительной (отрицательной) или пра-восторонней (левосторонней) асимметрии.Эксцессом вариационного ряда называется число~1 s~ µEx = 44 − 3 =( xi − x) 4 ni − 3 .4 ¦σnσ i =1Эксцесс является показателем крутости кривой распределения вариационного ряда по сравнению с нормальным распределением, дис-146~персия которого равна σ 2 .
При Ex = 0 распределение нормальное.~Если Ex > 0 , то кривая распределения имеет более острую вершину,~чем при нормальном распределении, если Ex < 0 – более плоскую.Пример 13.2. Вычислить коэффициент асимметрии и эксцессраспределения напряжения тока в электросети для примера 11.1.Решение. Сначала находим центральные моменты третьего ичетвертого порядков:~ = 1 8 ( x − 109,5) 3 n = -0,4; µ~ = 1 8 ( x − 109,5) 4 n = 18,06 .µ¦ i¦ iii4330 i =130 i =1~~µ~− 0 .418,06~ µ4=−0,09;Ex=−3=− 3 = −0,44 . ПоТогда A s = 33 =34σ1,63σ1,634скольку найденные показатели близки к нулю, то можно сделать вывод, что рассматриваемое в примере 11.1 распределение по асимметрии и крутости приближается к нормальной кривой.CВычисление выборочной средней и дисперсии можно упростить,если использовать не первоначальные варианты xi , а новые вариантыui =xi − C,kгде C и k – специально подобранные постоянные. Тогда согласносвойствам средней арифметической и дисперсии§ x−C· x−C, следовательно x = k u + C ,u =¨¸=k© k ¹§ x − C · D( x)2D (u ) = D¨¸ = 2 , следовательно D ( x) = k D (u ) .kk©¹Данный метод дает существенное упрощение в случае большихзначений xi .
В качестве постоянной k рекомендуется брать величи– варианту, имеющую наибольну интервала по x , а в качествешую частоту (середину интервала, имеющего наибольшую частоту).147Задачи13.1. – 13.25. Используя данные задачи 11.1 – 11.25, вычислить:а) выборочную дисперсию,б) среднее квадратическое отклонение,в) вариацию,г) коэффициент асимметрии,д) эксцесс.На основе полученных результатов сделать выводы.§14. Статистические оценки параметровраспределения.
Методы нахождения оценокОсновная задача теории оценок выглядит следующим образом.Имеется случайная величина ξ , для которой известен вид ее плотности распределения вероятностей с точностью до неизвестных параметров. Например, известно, что величина ξ нормальная, то есть ееплотность вероятностей имеет вид,но параметры a и , характеризующие эту плотность вероятностей,нам неизвестны. Нашей задачей является оценка этих неизвестныхпараметров. Будем пока считать, для простоты, что у нас имеется всего лишь один неизвестный параметр , подлежащий оценке.Разумеется, оценить неизвестный параметр можно только наоснове опытных данных.
Имея выборку, мыдолжны указать число θ̂ , которое близко к истинному значению неизвестного параметра θ , то есть мы должны указать оценкувестного параметра θ . Значит, мы должны каждой выборкенеизпо-ставить в соответствии некоторое число θ̂ , которое будет называться148оценкой неизвестного параметра θ . Другими словами, оценкафункция от опытных данных:естьθˆ = T ( x1 , x 2 ,..., x n ) = T ( X ) .Задачей теории оценки как раз и является указание вида функции T ( X ) .Ясно, что функцию T ( X ) следует выбирать таким образом, чтобы ее значения как можно точнее оценивали значения неизвестногопараметра θ .
К оценкам предъявляются требования, ограничивающие выбор функции. Рассмотрим эти требования.1. Несмещенность – требование отсутствия систематическихошибок, или требование того, чтобы оценка в среднем совпадала систинным значением неизвестного параметра:ˆ =θ.M (θ)2. Эффективность. Оценкой качества оценка является ее вариация:V (θˆ ) = M (θˆ − θ) 2 .Для несмещенной оценки она совпадает, очевидно, с дисперсиnDP)sОценка называется эффективной, если ее вариация является миˆθ̂T(Xей.θx → θ¦ ( xi − x ) 2 nin →∞nнимальнойсреди вариаций всех возможных оценок параметра θ ,D = i =1s2 =вычисленныхn −1n − 1 по одному и тому же объему выборки .3.
Состоятельность. Данное требование состоит в том, чтобы.Желательно использовать оценки, удовлетворяющие одновременно трем перечисленным требованиям.Несмещенной оценкой математического ожидания случайной величины ξ служит выборочная средняя. Смещенной оценкой дис-персии случайной величины ξ служит выборочная дисперсия.
Не-смещенной оценкой дисперсии случайной величины ξ служит «ис-правленная» выборочная дисперсия149.Точечной называют оценку, которая определяется одним числом.Рассмотрим основные методы нахождения точечных оценок.Метод моментовМетод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов (начальных или центральных) соответствующим эмпирическим моментам того же порядка.Напомним, что теоретические моменты для дискретной величины определяются по формулам:nni =1i =1ν k = ¦ x ik p i , µ k = ¦ ( xi − M ξ ) k pi ,для непрерывных:+∞+∞−∞−∞ν k = ³ x k p ξ ( x)dx , µ k = ³ ( x − M ξ ) k p ξ ( x)dx .Если распределение определяется одним параметром, то для егоотыскания достаточно одного уравнения, чаще всего используют уравнениеν =~ν , то есть M = x .1ξ1Если распределение определяется двумя параметрами, то чащевсего используют систему:ν1 , ν1 = ~, то есть®~¯µ 2 = µ 2 ;°M ξ = x,®°̄ Dξ = D.Разумеется, что для вычисления выборочных характеристик надорасполагать выборкой.Пример 14.1.
Найти оценку параметра λ распределения Пуассона с помощью метода моментов.Решение. Распределение Пуассона задается вероятностями, k = 0,1,2,... . В данном случае для нахождения единствен-ν1 или M ξ = x . Матеманого параметра достаточно приравнять ν 1 = ~150тическое ожидание распределения Пуассона равно λ . Следовательно,оценка параметразакона Пуассона есть выборочная средняя:λ̂ = x .Пример 14.2. Случайная величина ξ – время безотказной работы прибора, имеет показательное распределение:, x ≥ 0.Ниже приведено эмпирическое распределение среднего времени работы n = 200 элементов:xi2,57,512,517,522,527,5ni1334515421Найти методом моментов точечную оценку неизвестного параметра показательного распределения.Решение. Будем использовать уравнение, то есть M ξ = x .1λxˆp1 (=x1~νν1= 1λe − λxожидание показательного распределения равно .,2λ ξ= ) == 0Математическоеλx 51Значит λˆ = .xОпределим выборочную среднюю:x=1(2,5 ⋅ 133 + 7,5 ⋅ 45 + 12,5 ⋅ 15 + 17,5 ⋅ 4 + 22,5 ⋅ 2 + 27,5 ⋅ 1) = 5 .200Тогда получим оценку параметра λ :.Оценки метода моментов состоятельны, однако по эффективности они не являются наилучшими.
Тем не менее метод моментов часто используется на практике, так как приводит к сравнительно простым вычислениям.151Метод максимального правдоподобияОсновным методом получения оценок параметров генеральнойсовокупности по данным выборки является метод максимальногоправдоподобия, предложенный Р.Фишером.Основу метода составляет функция правдоподобия, выражающая плотность вероятности (вероятность) совместного появлениярезультатов выборки x1 , x 2 , ...,x n :L( x1 , x 2 , ...,x n ; θ) = L( X ; θ) = p ( x1 , θ) p ( x 2 , θ)...
p ( x n , θ) ,где в случае непрерывного распределения p( x, θ) – плотность распределения вероятностей исследуемой случайной величины, в случае дискретного распределения p( x, θ) – вероятность того, что в результате испытания случайная величина примет значение x .Согласно методу максимального правдоподобия в качествеоценки неизвестного параметра принимается такое значение, которое максимизирует функцию L . То есть оценка θ̂ являетсяточкой максимума функции правдоподобия.Нахождение оценки θ̂ упрощается, если максимизировать несаму функцию L , а ln L , поскольку максимум обеих функций достигается при одном и том же значении θ . Функцияназываетсялогарифмической функцией правдоподобия.Точку максимума функции ln L по аргументу θ можно искать,например, так:1.
Найти производную.2. Найти критическую точку θ ∗ из уравненияd ln L=0.dθd 2 ln L, если вторая прозводнаяdθ 2при θ = θ ∗ отрицательна, то θ ∗ – точка максимума.Найденную точку максимума θ ∗ принимают в качестве оценки.максимального правдоподобия параметра θ ,3. Найти вторую производную152В случае, когда надо оценить не один параметр θ , а несколько, оценки максимального правдоподобия для этих параметров находят из системы уравнений:∂L( X ; θ1 , θ 2 , ..., θ k )= 0 , i = 1, k .∂θ iПример 14.3.