Лекции по ТВиМС (554989), страница 11
Текст из файла (страница 11)
На практикетакая обстановка встречается нередко. Пусть рассматривается отклонение Yкакого-то параметра, например радиоэлектронного устройства от номинала.Это отклонение (при известных допущениях) может быть представлено каксумма n элементарных отклонений, связанных с отдельными причинами:nY = ∑ Xii =1где, например:X1 – отклонение, вызванное влиянием температуры;Х2 – отклонение, вызванное влиянием влажности воздуха;Х3 – отклонение, вызнанное недостаточной чистотой материала изделия;…Хn – отклонение, вызнанное недостаточной чистотой материала изделия.Число n этих элементарных отклонении весьма велико, как и число nпричин, вызывающих суммарное отклонение Y. Обычно слагаемые X1, X2, …,Xn сравнимы по порядку своего влияния на рассеивание суммы.
Действительно,если бы какая-то из случайных величин X1, X2, …, Xn оказывала существеннобольшее влияние на рассеивание суммы, чем все остальные, было быестественно принять специальные меры для того, чтобы устранить главнуюпричину рассеивания; поскольку такие меры не предпринимаются, можнопредположить, что оставшиеся случайные слагаемые сравнимы по порядкусвоего (равномерно малого) влияния на рассеивание суммы.Нормальный закон широко распространен в технике; в большинствеслучаев ошибки измерения параметров, ошибки выполнения команд, ошибкиввода различных величин в техническое устройство распределены понормальному (или близкому к нормальному) закону; такая ошибка обычноможет быть представлена в виде суммы многих «элементарных ошибок» Xi,каждая из которых связана с отдельной, практически независимой от другихпричиной.
Именно в применении к теории ошибок был впервые обоснованЛапласом и Гауссом нормальный закон.На практике при суммировании величин с одинаковым закономраспределения закон распределения суммы можно считать нормальным, еслиn>10...20.Пример 1. Пусть Х – случайная величина, равномерно распределенная наинтервале [0, 1], и формируется, например, генератором псевдослучайныхвеличин. На основании центральной предельной теоремы величинаY= σ (12∑xi = 1i− 6 ) + m(12.11)будет иметь практически нормальный закон распределения с параметрами m, σ.Пример 2.
Докажем теоремы Муавра–Лапласа (см. (3.11), (3.12)), т.е. чточисло появлений событий А в n независимых одинаковых опытах распределенопо нормальному закону, если количество опытов n велико, а вероятности p и qне малы, так что выполняются следующие условия:0 < np − 3 npq , np + 3 npq < n .(12.12)Пусть Xi – индикатор события А в i-м опыте, тогда число появленийnсобытий А в n опытах равно Y = ∑ X i , причем 0 ≤ Y ≤ n .
На основанииi =1центральной предельной теоремы величина Y будет иметь практическинормальныйзаконраспределенияспараметрамиnmY = ∑ mi = np , σ Y =i =1n∑Di =1i= npq . Условие (12.12) получено на основанииправила 3σ Y для величины Y, так чтобы практически все значения нормальнойвеличины Y находились в интервале [0; n].ЛЕКЦИЯ 13Математическая статистика. Основные понятияМатематической статистикой называется наука, занимающаясяметодами обработки опытных данных, полученных в результате наблюденийнад случайными явлениями. Любой такой результат можно представить каксовокупность значений, принятых в результате n опытов случайнойодномерной или многомерной величиной.Генеральной совокупностью опыта называется множество объектов, изкоторых производится выборка.
Каждый из объектов задает фиксированноезначение случайной величины X. Количество (N) входящих в генеральнуюсовокупность объектов называют объемом генеральной совокупности. Онаможет состоять из бесчисленного множества объектов.Выборка – множество {x1 , x2 ,..., xn } случайно отобранных объектов (значений)из генеральной совокупности. Объемом выборки n называется число входящих внее объектов. К выборке предъявляется требование, чтобы она адекватнопредставляла генеральную совокупность, т.е. была репрезентативной(представительной).
В силу закона больших чисел можно утверждать, чтовыборка будет репрезентативной, если ее осуществлять случайно, т.е. каждый изобъектов генеральной совокупности имеет одинаковую вероятность попасть ввыборку. Очевидно, что можно осуществить в одинаковых условиях k выборокобъема n и получить различные совокупности значений случайной величины X:{x1(1) ,..., xn(1)},{x1(2) ,..., xn(2)},...,{x1(k ) ,..., xn(k )} .
Пусть для генеральной совокупности опытаслучайная величина X имеет функцию распределения F(x), тогда каждую извыборок {x1(1) ,..., xn(1)},{x1(2) ,..., xn(2)},...,{x1(k ) ,..., xn(k )} можно рассматривать, какреализацию n-мерной случайной величины (Х1,...,Хn), где составляющая Хi, i == 1, ..., n, есть значение величины Х в i-м опыте. Очевидно, что всесоставляющие Хi будут иметь одинаковый закон распределения F(x). Так каккомпоненты Хi независимы, то функция распределения n-мерной случайнойвеличины (X1, X2, …, Xn) определяется формулойF(x1, x2, …, xn) = F(x1) F(x2)...F(xn).Вариационным рядом называется выборка { xˆ1 , xˆ2 ,..., xˆn }, полученная врезультате расположения значений исходной выборки в порядке возрастания.Значения xˆ i называются вариантами.Одной из главных задач математической статистики является определениезакона распределения случайной величины Х.Оценка закона распределенияЭмпирическая функция распределения случайной величины X равначастоте того, что X примет значение меньшее, чем аргумент функции x, иопределяется формулой⎧0, x ≤ xˆ1 ,⎪:⎪⎪iF * ( x ) = p* ( X < x ) = ⎨ , xˆi < x ≤ xˆi +1 ,⎪n⎪:⎪⎩1, x > xˆn .(13.1)При n →∞ эмпирическая функция распределения F*(x) сходится повероятности к теоретической функции распределения F(x).Основные свойства функции F*(x).1.
0 ≤ F*(x) ≤ 1.2. F*(x) – неубывающая ступенчатая функция.3. F*(x) = 0, для x ≤ x̂1 .4. F*(x) = 1, для x > xˆ n .Эмпирическая функция распределения является наилучшей оценкойзакона распределения (несмещенной, состоятельной, эффективной). Недостатокфункции F*(x) заключается в ее невысокой наглядности: визуально сложноопределить закон распределения случайной величины X.Статистический ряд распределения вероятностей определяется поисходной выборке объемом n, если анализируемая случайная величина Хявляется дискретной с известным множеством значений { x1 , x 2 , ..., x m } :xjp *jх1х2....хmk1k2....kmkj*Здесь p j =– частота появления j-го значения;nkj – число значений xj в выборке.Свойства статистического ряд распределения вероятностей:m1.∑j =1m2.∑j =1kj= n .p *j = 1 .Интервальный статистический ряд вероятностей строится поисходной выборке, если анализируемая случайная величина Х являетсянепрерывной:j1AjA1BjB1hjh1νjν1p *jp1*f j*f1*0MAMBMhMνMpM*fM*Здесь j – номер интервала;M – число непересекающихся и примыкающих друг к другу интервалов, накоторые разбивается диапазон значений [ xˆ1 , xˆ n ] :( )⎧ int n , n ≤ 100,⎪M≈⎨⎪⎩ int ( ( 2 ÷ 4 ) ⋅ lg ( n ) ) , n > 100,(13.2)где int(x) – целая часть числа x .
Желательно, чтобы n без остатка делилось на M;Aj, Bj – левая и правая границы j-го интервала (Aj+1 = Bj), причемA1 = xˆ1 , B M = xˆ n ;hj = Bj – Aj – длина j-го интервала;νj – количество чисел в выборке, попадающих в j-й интервал;ν jp *j =– частота попадания в j-й интервал;np *jνj*=fj =– статистическая плотность вероятности в j-м интервале.hjnh jПри построении интервального статистического ряда вероятностейиспользуют следующие методы разбиения диапазона значений на интервалы:1) равноинтервальный, т.е. все интервалы одинаковой длины:xˆ − xˆ1hj = h = n, ∀j ;(13.3)MA j = xˆ1 + ( j − 1) h , j = 2, M .(13.4)2) равновероятностный, т.е.
границы интервалов выбирают так, чтобы вкаждом интервале было одинаковое число выборочных значений (необходимо,чтобы n без остатка делилось на M):n1, p *j =ν j =ν =∀j ;(13.5)MMAj =xˆ ( j −1)ν + xˆ ( j −1)ν +1, j = 2, M .(13.6)2Гистограмма – статистический аналог графика плотности вероятности*f (x) случайной величины, и она строится по интервальному статистическомуряду. Гистограмма представляет собой совокупность прямоугольников,построенных, как на основаниях, на интервалах hj статистического ряда с*высотой равной статистической плотности вероятности f j в соответствующеминтервале.Для равноинтервального метода все прямоугольники гистограммыимеют одинаковую ширину, а для равновероятностного метода – одинаковуюплощадь.
Сумма площадей всех прямоугольников гистограммы равна 1.Достоинства гистограммы: простота построения, высокая наглядность.f*(x)f*jf*1A1xB1A3B3A2B2A4AjBjAMBMЛЕКЦИЯ 14Точечные оценки числовых характеристикСтатистической оценкой Q̂ параметра Q распределения называетсяприближенное значение параметра, вычисленное по результатам эксперимента(по выборке).
Статистические оценки делятся на точечные и интервальные.Точечной называется оценка, определяемая одним числом. Точечнаяоценка Q̂ параметра Q случайной величины X в общем случае равнаQˆ = ϕ ( x1 , x2 ,..., xn ) ,(14.1)где xi – значения выборки.Очевидно, что оценка Q̂ – это случайная величина, так как она являетсяфункцией от n-мерной случайной величины (X1, X2, …, Xn), где Хi – значениевеличины Х в i-м опыте, и значения Q̂ будут изменяться от выборки к выборкеслучайным образом. К оценкам предъявляется ряд требований.1. Оценка Q̂ называется состоятельной, если при увеличении объемавыборки n она сходится по вероятности к значению параметра Q:pQˆ ⎯⎯⎯→ Q ⇒ lim( P( Qˆ − Q < ε )) = 1, ∀ε > 0 .(14.2)n →∞n→∞Состоятельность – это минимальное требование к оценкам.2.
Оценка Q̂ называется несмещенной, если ее математическое ожиданиеточно равно параметру Q для любого объема выборки:(14.3)M [ Qˆ ] = Q , ∀ n .D ⎡⎣ Qˆ ⎤⎦ = 0.Несмещенная оценка является состоятельной, если limn→ ∞3. Несмещенная оценка Q̂ является эффективной, если ее дисперсияминимальна по отношению к дисперсии любой другой оценки этого параметра:D ⎡⎣ Qˆ ⎤⎦ = m in .(14.4)Оценка математического ожидания.
На основании теоремы Чебышевав качестве состоятельной оценки математического ожидания может бытьиспользовано среднее арифметическое значений выборки x , называемоевыборочным средним:m *X = x =1nnxi .∑i =1Определим числовые характеристики оценки ⎯x.1 n1 n1 nM [ x ] = M [ ∑ X i ] = ∑ M [ X i ] = ∑ mX = mX ,n i =1n i =1n i =1т.е. оценка несмещенная.1 n1 n1 n1D[ x ] = D[ ∑ X i ] = 2 ∑ D[ X i ] = 2 ∑ DX = D X .n i =1n i =1n i =1n(14.5)(14.6)Оценка (14.5) является эффективной, т.е. ее дисперсия минимальна, есливеличина X распределена по нормальному закону.Состоятельная оценка начального момента k-го порядка определяется поформуле1 nk(14.7)αˆ k ( x ) = ⋅ ∑ ( xi ) .n i =1Оценка дисперсии. В качестве состоятельной оценки дисперсии можетбыть использовано среднее арифметическое квадратов отклонений значенийвыборки от выборочного среднего:1 n1 n 222S = ⋅ ∑ ( xi − x ) = ∑ xi − ( x ) 2 .(14.8)n i =1n i =1Определим математическое ожидание оценки S2. Так как дисперсия независит от того, где выбрать начало координат, выберем его в точке mX, т.е.перейдем к центрированным величинам:21 n o2 ⎛ 1 n o ⎞n −1 n o2 2 n o oM [S ] = M [ ∑ X i − ⎜ ∑ X i ⎟ ] = M [ 2 ∑ X i − 2 ∑ X i X j ] =n i =1n i =1n i< j⎝ n i =1⎠ooon −1 n2 nn −1 n2 nn −1= 2 ∑ M [ X i2 ] − 2 ∑ M [ X i X j ] = 2 ∑ D X − 2 ∑ K ij =DX .n i =1n i< jn i =1n i< jn2Ковариация Kij = 0 , так как опыты, а следовательно, и Хi − значениевеличины Х в i-м опыте − независимы.