Лекции по ТВиМС (554989), страница 13
Текст из файла (страница 13)
U α = σ U ⋅ arg Φ (0.5 − α ) .σUЕсли значение, вычисленное по формуле (15.1), больше, чем критическоезначение, т.е. U > U α , то гипотеза H0 отклоняется, в противном случае нетоснований ее отклонить.Критерии согласияКритериями согласия называются критерии, используемые для проверкигипотез о предполагаемом законе распределения.Критерий согласия Пирсона ( χ ). Это один из наиболее частоприменяемых критериев. Алгоритм проверки следующий.1.
Построить интервальный статистический ряд и гистограмму.2. По виду гистограммы выдвинуть гипотезу:H0 – величина X распределена по такому-то закону: f(x) = f0(x),H1 – величина X не распределена по такому-то закону: f(x) ≠ f0(x),где f0(x), F0(x) – плотность и функция гипотетического закона распределения.23.
Используя метод моментов или максимального правдоподобия,определить оценки неизвестных параметров Qˆ1 , ..., Qˆ m гипотетического законараспределения.4. Вычислить значение критерия по формулеMχ 2 = n∑(p j − p*j)pjj =12M(ν j − np j )j =1np j=∑2,(15.2)где pj – теоретическая вероятность попадания случайной величины в j- йинтервал при условии, что гипотеза H0 верна:Bjp j = p( Aj ≤ X < Bj ) = ∫ f0 (x)dx = F0 ( Bj ) − F0 ( Aj ) .(15.3)AjЗамечания. При расчете p1 и pM в качестве крайних границ первого ипоследнего интервалов A1, BM следует использовать теоретические границыгипотетического закона распределения. Например, для нормального закона A1= -∞, BM = +∞. После вычисления всех вероятностей pi проверить, выполняетсяли контрольное соотношениеM1 − ∑ pi ≤ 0,01 .j =1χ 2 распределена по закону, которыйназываетсяχ 2 .
Данное распределение не зависит от закон распределенияВеличинараспределениемвеличины X, а зависит от параметра k, который называется числом степенейсвободы:ku−1 −⎧12u e 2 , u ≥ 0,⎪ k⎪⎛k⎞f k (u ) = ⎨ 2 2 Γ ⎜ ⎟(15.4)⎝2⎠⎪⎪⎩ 0, u < 0,∞α −1 − tгде Γ (α ) = ∫ t e dt – гамма-функция.0Таккаканалитическоевыражениеf 2(x)χχ являетсяплотностираспределениядовольно сложным, то в практике используюттаблицу значений χα2 ,k , рассчитанных из2уравнения p ( χзначений k.2> χ α2 , k ) = α , для различныхαχ2α, k5. Из таблицы распределения χ выбирается значение χα2 ,k , где α –заданный уровень значимости (α = 0,05 или α = 0,01), а k – число степенейсвободы, которое определяется по формулеk = M - 1 - s.Здесь s – число неизвестных параметров гипотетического законараспределения, значения которых были определены в п.
3.6. Если значение, вычисленное по формуле (15.2), больше, чем критическое2значение, т.е. χ > χα ,k , то гипотеза H0 отклоняется, в противном случае нетоснований ее отклонить.Критерий согласия Колмогорова. Алгоритм проверки следующий:1. Построить вариационный ряд и график эмпирической функциираспределения F*(x).2. По виду графика F*(x) выдвинуть гипотезу:H0 : F(x) = F0(x),H1 : F(x) ≠ F0(x),где F0(x) – функция гипотетического закона распределения.3. Используя метод моментов или максимального правдоподобияопределить оценки неизвестных параметров Qˆ1 , ..., Qˆ m гипотетического законараспределения.4.
Рассчитать 10...20 значений функции F0(x) и построить ее график водной системе координат с функцией F*(x).5. По графику определить максимальное по модулю отклонение междуфункциями F*(x) и F0(x).22nZ = max F * ( xi ) − F0 ( xi ) .(15.5)i =16. Вычислить значение критерия Колмогороваλ = n ⋅Z .(15.6)Величина λ распределена по закону Колмогорова, который не зависит отзакона распределения величины X,:F (λ ) =∞∑ ( −1) ek−2 k 2 λ 2k = −∞.Так как аналитическое выражение функциираспределения F (λ ) является довольно сложным,то в практике используют таблицу значений λγ ,рассчитанных из уравнения p (0 ≤ λ < λγ ) = γ .7.
Из таблицы распределения Колмогоровавыбрать критическое значение λγ , γ = 1 − α .α –заданный уровень значимости (α = 0,05 или α = 0,01).(15.7)f (x)λγλγ8. Если λ > λγ , то нулевая гипотеза H0 отклоняется, в противном случаенет оснований ее отклонить.2Достоинствами критерия Колмогорова по сравнению с критерием χ :являются возможность его применения при очень маленьких объемах выборки(n < 20), более высокая "чувствительность", а следовательно, меньшаятрудоемкость вычислений. Недостатком является то, что эмпирическаяфункция распределения F*(x) должна быть построена по несгруппированнымвыборочным данным, что затруднительно при больших объемах выборки.Кроме этого, следует отметить, что критерий Колмогорова можно применятьтолько в случае, когда гипотетическое распределение полностью известнозаранее из каких-либо теоретических соображений, т.е. когда известен нетолько вид функции распределения F0(x), но и все входящие в нее параметрыQ1, ..., Qk.
Такой случай сравнительно редко встречается на практике. Обычноиз теоретических соображений известен только общий вид функции F0(x), авходящие в нее числовые параметры определяются по данному2статистическому материалу. При применении критерия χ это обстоятельствоучитывается соответствующим уменьшением числа степеней свободыраспределения k. Критерий. Колмогорова такого согласования непредусматривает. Если все же применять этот критерий в тех случаях, когдапараметры теоретического распределения определяются по статистическимданным, критерий дает заведомо заниженные значения λ; поэтому мы в рядеслучаев рискуем принять как правдоподобную гипотезу, которая вдействительности плохо согласуется с опытными данными.ЛЕКЦИЯ 16Статистическая обработка двухмерных случайных величинПусть проводится n независимых опытов, в каждом из которыхдвухмерная случайная величина (Х,У) принимает определенные значения ирезультаты опытов представляют собой двухмерную выборку вида {(х1, у1), (х2,у2),…,(хn, уn)}.
Статистическая обработка опытных данных включает в себяобработку и анализ составляющих Х и У, как одномерных величин (см. лекции13−15), и вычисление оценок и анализ параметров, присущих толькодвухмерным (многомерным) случайным величинам. Как правило,определяются следующие оценки числовых характеристик случайной величины(Х,У):оценки математических ожиданий:1 nm = x = ∑ xi ;n i =11 n*mY = y = ∑ yi ;n i =1*X(16.1)(16.2)оценки дисперсии:1 n1 n 2n 22⋅ ∑( xi − x ) =xi −x ;(16.3)∑n −1 i =1n −1 i =1n −11 n1 n 2n 22S02 ( y) =yi −y .⋅ ∑( yi − y ) =(16.4)∑n −1 i=1n −1 i=1n −1Оценка корреляционного момента.
Состоятельная несмещенная оценкакорреляционного момента равна1 n*K XY=⋅ ∑ ( xi − x )( yi − y ),(16.5)n −1 i =1где xi, yi – значения, которые приняли случайные величины X, Y в i-м опыте;x , y – средние значения случайных величин X и Y соответственно.Оценкакоэффициентакорреляции.Состоятельнаяоценкакоэффициента корреляции равнаK *XY*RXY =,(16.6)S 0 ( x ) S0 ( y )S02 ( x) =где S0 ( x), S0 ( y ) – оценки среднеквадратического отклонения случайныхвеличин X и Y соответственно.Доверительный интервал для коэффициента корреляции снадежностью γ для случая двумерного нормального распределения имеет видe2a − 1e 2b − 1< RXY < 2b,e2a + 1e +1(16.7)*⎛ 1 + R XY0,5ln=⋅aгде⎜*⎝ 1 − R XY*zγ⎛ 1 + R XY⎞⎞b=⋅+0,5ln−;⎜⎟* ⎟R−13−n⎝XY ⎠⎠zγn−3;γz γ = arg Φ ( ) – значение аргумента функции Лапласа, т.е. Ф(zγ) = γ .22Статистические критерии двухмерных случайных величинГипотезаоботсутствиикорреляционнойзависимости.Предполагается, что двухмерная случайная величина (X, Y) распределена понормальному закону.
Алгоритм проверки следующий.1. Формулируется гипотеза:H0: R X Y = 0 ;H1: R X Y ≠ 0 .Здесь R X Y – теоретический коэффициент корреляции.*2. Вычисляется оценка коэффициента корреляции R X Y по формуле (16.6)3. Если объем выборки не велик ( n < 50 ), определяется значение критерияR X* Y n − 2t =,(16.8)2*1 − (R XY )который распределен по закону Стьюдента с (n-2) степенями свободы, еслигипотеза H0 верна.4. По заданному уровню значимости α вычисляется доверительнаявероятность γ =1 − α и из таблицы Стьюдента выбирается критическоезначение t γ , n − 2 .5. Еслиt > t γ , n − 2 , то гипотеза H0 отклоняется, а следовательно,величины X, Y коррелированы. В противном случае гипотеза H0 принимается.3*. Если объем выборки велик (n > 50 ), то определяется значениекритерияR X* Y nZ =,(16.9)2*1 − (R XY )который распределен практически по нормальному закону, если гипотеза H0верна.4*.
По заданному уровню значимости α из таблицы функции Лапласа1−α⎛1−α ⎞.определяется критическое значение Z α = arg Φ ⎜⎟ , т.е. Φ ( Zα ) =2⎝ 2 ⎠5*. Если Z > Z α , то гипотеза H0 отклоняется, а следовательно,величины X, Y коррелированы. В противном случае гипотеза H0 принимается.t-критерий. t-критерий служит для сравнения двух средних значений изнормально распределенных генеральных совокупностей в предположении, чтодисперсии σX и σY равны, хотя и неизвестны. Таким образом, проверяемаягипотеза Н0 утверждает, что mX = mY.
Пусть {x1 , x2 ,..., xn1 } , {y1, y2 ,..., yn2 } –независимые случайные выборки из обеих генеральных совокупностей; вобщем случае они могут иметь совершенно разные объемы. В качествекритерия используем величинуx−yn1n2 ( n1 + n2 − 2)T=.(16.10)n1 + n2(n1 − 1) S02 ( x ) + ( n2 − 1) S 02 ( y )При сделанных предпосылках (нормальная распределенность X и Y иравенство дисперсий) и в предположении, что гипотеза Н0 верна, величина Тудовлетворяет распределению Стьюдента с k = n1 + n2 − 2 степенями свободы.Поэтому критическая область может быть установлена следующимобразом.
Для заданного уровня значимости α по таблице распределенияСтьюдента определяем значениеt1−α,n−1 . Если вычисленное (согласно (16.10))значение T удовлетворяет неравенству T > t1−α ,n −1 , то гипотезу Н0 отвергают.По отношению к предпосылке «нормальной распределенности» t-критерийне очень чувствителен. Его можно применять, если статистическиераспределения обеих выборок не имеют нескольких вершин (т.е.унимодальные) и не слишком ассиметричны. Предпосылка σX = σY во многихслучаях может быть обоснована на содержательном уровне; а гипотезу σX = σYможно проверить по F-критерию (см. ниже).F-критерий. Гипотезы о дисперсии имеют в технике большое значение,так как σ X2 есть мера таких характеристик, как точность машин, ошибкиизмерительных приборов, точность технологических процессов и т. п.F-критерий служит для проверки гипотезы о равенстве дисперсий приусловии, что X и Y распределены нормально.
Проверяемая гипотеза Н0утверждает, что σX = σY . Из каждой генеральной совокупности производятсявыборки объема n1 и n2. В качестве критерия используем величинуS 2 ( x)S 2 ( y)F = 02, или F = 02,.(16.11)S0 ( y )S0 ( x)причем, большую дисперсию выбирают в качестве числителя.Величина F удовлетворяет F-распределению с (n1 -1, n2 -1) степенямисвободы. Критическая область выбирается следующим образом.