Раздаточные материалы, страница 5
Описание файла
PDF-файл из архива "Раздаточные материалы", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 6 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 5 страницы из PDF
Таких, что решениепринимается в пользу гипотезы Н0, если выборка принадлежит области О и в пользу гипотезы Н1,если выборка принадлежит подмножеству W. Область W называется критической областьювыборочного пространства. Здесь гипотеза Н0 отвергается, а область О является областьюдопустимых значений. Здесь гипотеза Н0 принимается.Проверка гипотезы о равенстве центров распределения математического ожидания2-х нормальных генеральных совокупностей.Задача имеет большой практический интерес.
Достаточно часто наблюдается такая ситуация,что средний результат в одной серии эксперимента отличается от среднего результата в другойсерии эксперимента.Возникает вопрос: можно ли объяснить отличительное расхождение случайными ошибкамиэксперимента и относительно малыми объёмами выборки или это отклонение вызвано какимилибо неизвестными, незамеченными закономерностями.Имеется две случайных величин Х и Y с нормальным законом распределения.Получим 2-е независимых выборки объёмом n1 и n2 из указанных генеральныхсовокупностей.Необходимо проверить: Н0: М(X) = М(Y)H1: |M(X) – M(Y)| > 0Рассмотрим два случая:1.
– известны дисперсия генеральной совокупности σ X2 ;2. – дисперсия неизвестна σ X2 .1 - σ X2 , σ Y2 M(X) и M(Y) - неизвестны, для их оценки мы используем средние выборочныеX иY.Относительно X и Y известно, что они подчиняются нормальному закону распределения спараметрами:⎛σ2 ⎞X ⎜⎜ m X , x ⎟⎟n1 ⎠⎝⎛σ2 ⎞Y ⎜⎜ m X , y ⎟⎟n2⎝⎠Рассмотрим случайную величину X − Y . В силу независимости выборок эта случайнаявеличина подчиняется нормальному закону распределения.Её дисперсия:D( X − Y ) = D( X ) + D(Y ) =σ x2n1+σ y2n2Если гипотез Н0 верна(справедлива), то тогда: M ( X − Y ) = 0 .Величина:25X −Yz=σ x2σ y2с параметрами (0, 1)+n1 n2Выбирая уровень значимости α или доверительную вероятность Р = 1- α можем записать:⎧⎫⎪⎪Zt2−⎪ X −Y⎪2≤ Z P ⎬ = P = 1 − α = Ф ( Z P ) ; Ф (Z ) =P⎨e 2 dt ;22π 0⎪ σ x2 σ y⎪+⎪ n⎪⎩ 1 n2⎭Выбирая по величине интеграла вероятности значения ZP мы тем самым делим выборочныхданных на область допустимых значений и критическую область.Для области, где выполняется неравенство |Z| ≤ ZP – область допустимых значений(ОДЗ) Н0– принимается.А, если |Z| > ZP – критическая область(КО) Н0 – отвергается, Н1 – принимается.Чем меньше α, тем меньше вероятность отклонить проверяемую гипотезе, если она верна.Но в этом случае увеличивается вероятность совершения ошибки II-го рода.Чем меньше α, тем больше ОДЗ и тем больше вероятность принять проверяемую гипотезу,если она не верна, т.е.
совершить ошибку II-го рода.∫Методы проверки гипотез позволяют только отвергнуть проверяемую гипотезу, но они немогут доказать её справедливость.2 -Дисперсия неизвестна.Есть 2-е случайных величины X и Y, mx , σ x2(σ x2 = σ y2 = σ 2 = ? mx и my) (m , σ ).y2yнеизвестны берутся независимые выборки (n1;n2) ирассматривается гипотеза: Н0: M(X) = M(Y)H1: |M(X) – M(Y)| > 0.Для оценки математического ожидания M(X) и M(Y) используем среднее выборочноеX , Y . Для оценки дисперсий используем:~S X2 =n11(xi − X )2n1 − 1 i =1∑n2- несмещённые, состоятельные оценки дисперсии.1( yi − Y )2n2 − 1 i =1Поскольку генеральные совокупности X и Y имеют одинаковые дисперсии, то для оценкидисперсии σ 2 целесообразно использовать результаты обеих выборок.Наиболее целесообразной оценкой дисперсии является средняя взвешенная этих двухоценок.~~~ 2 S X2 (n1 − 1) + SY2 (n2 − 1)S =n1 + n2 − 2~SY2 =∑Если гипотеза Н0 справедлива, то тогда случайная величина X − Y подчиняется⎛11 ⎞нормальному закону распределения с M ( X − Y ) = 0 и с дисперсией σ 2 ⎜⎜ + ⎟⎟⎝ n1 n2 ⎠⎡1 ⎞⎤2⎛ 1⎢m X −Y = 0; σ ⎜⎜ + ⎟⎟⎥⎝ n1 n2 ⎠⎦⎣26~~ ⎛11 ⎞S X −Y = S 2 ⎜⎜ + ⎟⎟⎝ n1 n2 ⎠⎡ ~ ⎛ 1 1 ⎞⎤⎛1 1⎞M ⎢ S 2 ⎜⎜ + ⎟⎟⎥ = σ 2 ⎜⎜ + ⎟⎟⎝ n1 n2 ⎠⎣ ⎝ n1 n2 ⎠⎦Если построить случайную величину:(X − Y ) − M (X − Y )t=~S X −Y, то она будет подчиняться нормальному закону с параметрами (0; 1).Т.к.
σ 2 неизвестна, то такая величина подчиняется t-распределению Стьюдента(состепенями свободы n1 + n2 – 2).Для α(Р = 1– α) подсчитывается критическое значение t n1 + n 2 − 2,α()P t > t n1 + n 2 − 2,α = αЕсли вычисленные значения t > t n1 + n 2 − 2,α , то гипотеза Н0 отвергается и наоборот:t ≤ t n1 + n 2 − 2,α Н0 принимается.Проверка гипотезы о совпадении 2-х дисперсий.Задача имеет важное практическое значение. Возникает при наладке какого-либооборудования при сравнении точности приборов, инструментов, методов измерений.По 2-м независимым выборкам вычислены оценки дисперсий:S y21 и S y22Н 0 : σ y21 = σ y22Н1 : σ y21 − σ y22 > 0Для проверки гипотезы Н0 используется критерий Фишера(F–критерий, F–распределение).Вычисляется коэффициент:ν2Fн =Число степеней свободыбольшей дисперсии1 - α))Число степенейсвободы меньшейдисперсииν1S y21, S y22 > S y21Вычисляется критическое значение Fкр(α (или Р =ν 2 = n2 − 1ν 1 = n1 − 1,где: ν – числознаменателя.Fн < Fкр, то Н0 принимается.S y22степенейсвободычислителя иЕсли Fн > Fкр, то Н0 отвергается,Анализ однородности дисперсий.Понятие однородности является обобщением понятия равенства дисперсий в случае, есличисло выборок превосходит 2(N > 2).Для проверки гипотезы H0:27Н0: σ y21 = σ y22 = ...
= σ y2NН1: дисперсия неоднородна.Объёмы выборок n1,n2, … ,nN различны.Когда объёмы выборок различны для решения задачи является χ2 с (N-1) степенями свободы.На практике наиболее частым является когда объёмы выборок одинаковы.При равных объёмах выборок используется критерий Кохрана для проверки Н0.Есть соответствующее распределение, но оно громоздко.В начале вычисляется фактическое значение критерия:S y2max;Gн = N2S yi∑i =1Отношение максимальной оценки дисперсии к сумме всех оценок дисперсий вычисленныхпо табличным данным.Для Р = 1 – α вычисляется критическое значение критерия Кохрана Gкр.При Gн ≤ Gкр - H0 принимается;Gн > Gкр - H0 отвергается.Проверка гипотез о законе распределения.Имеется случайная величина Х, требуется проверить гипотезу Н0:Н0: эта случайная величина подчиняется некоторому закону распределения F(x).Для проверки гипотезы делается выборка состоящая из n независимых наблюдений надслучайной величиной Х.
По выборке строится эмпирическая функция распределения F*(x).Сравнивая эти распределения с помощью некоторого критерия(критерий согласия) делается выводо том, что эти два распределения согласуются, т.е. Н0 – принимается.Существует несколько критериев согласия: χ2 Пирсона, критерий Колмогорова и т.д.Критерий согласия χ2 Пирсона.Имеется случайная величина Х, выдвигается гипотеза Н0: F(x), делается выборка.Диапазон Хmin – Хmax разбивается на ℓ интервалов. Размер интервала определяется поправилу Старджесса.
Δ1;Δ2;Δ3;…;Δℓ.…Δ1Δ2Δ3ΔℓИнтервал ΔiЭмпирическая частота mim1m2m3…mℓТеоретическая частота npinp1np2np2…npℓlmi = n;∑i =1mi > 3(в среднем 5 - 7).При mi < 3 укрупнить интервал.Находим частоту попадания случайной величины внутрь каждого интервала.Поскольку теоретическое распределение задано в гипотезе Н0 всегда можно найтивероятность pi попадания случайной величины внутрь каждого интервала.lpi = 1;∑i =1χ2 Пирсона предполагает, что надо построить:2l(mi − npi )2χ =npii =12(имеет распределение χ только при относительно больших n (n > 50)).∑Порядок применения χ2 Пирсона:281. Рассчитывается эмпирическое значение критерия χ2;2.
Выбирается уровень значимости α (при Р = 1 - α);3. По таблице подсчитывается χ к2,α ,где: α – уровень значимости;к – число степеней свободы.В общем случае к = ℓ - r – 1,где: ℓ - количество интервалов разбиения;r – количество параметров распределения подсчитанных по выборке;Здесь к = r – 1.χ 2 > χ к2,α гипотеза Н 0 отвергаетсяЕслиχ 2 < χ к2,α гипотеза Н 0 принимаетсяКритерий Колмогорова.По результатам выборки объёмом n строится эмпирическая функция распределения F(х).Принимается гипотеза Н0: случайная величина Х подчиняется распределению описанномуфункцией F(x).За меру расхождения функций принимается величина:D = max F * ( x ) − F ( x )F(x),F*(x)Существуют таблицы распределения Колмогоровав которых можно найти:F(x)oDn - критическое значение. Оно зависит от уровнязначимости α(Р = 1 - α), величины D и величины выборкиn.DЕсли полученные из опыта значения коэффициента Doоказывается больше критического Dn , то Н0 отвергается.oЕслиD > D n гипотеза Н 0 отвергаетсяoD < D n гипотеза Н 0 принимаетсяoС помощью величины Dn можно построить доверительные границы для неизвестной функцииF(x):ooF * ( x ) − Dn < F ( x ) < F * ( x ) + DnКолмогоров показал, что при n → ∞ величина:λ=D nподчиняется распределению Колмогорова.F (λ ) =+∞(− 1) e −∑= −∞к2 к 2 λ2кКритерий Колмогорова так же может быть использован для статистической проверкипринадлежности двух выборок объёмом n1 и n2 к одной и той же генеральной совокупности.Вычисляется параметр λ:n1n2λ=max F1* ( x ) − F2* ( x )n1 + n229где: F1* и F2* - эмпирические функции распределения соответственно первой и второй выборки.По величине λ судят о согласии.Раздел 6.
Основы дисперсионного анализа.Дисперсионный анализ – это статистический метод анализа результатов наблюденийзависящий от различных одновременно действующих факторов и позволяющий выбрать из рядафакторов наиболее важные, оценивать их влияние.Основными предпосылками дисперсионного анализа является как правило нормальноераспределение результатов наблюдений и отсутствие влияния исследуемых факторов надисперсию результатов наблюдения.Обязательным здесь является возможность управляемого изменения фактора в рамках егоразновидностей называется уровнями фактора.
Эти эксперименты могут быть пассивными, когдасуществование уровней и их смена является естественными для исследуемого объекта иактивными, когда эти изменения искусственно вносятся экспериментатором по заранеесоставленному плану.Идея дисперсионного анализа в разложении общей дисперсии случайной величины нанезависимые случайные слагаемые, каждый из которых характеризует влияние того или иногофактора, или их взаимодействие. Последующие сравнения этих дисперсий позволяют оценитьсущность влияния факторов на исследуемую величину.Пусть Х – это некоторая случайная величина зависящая от 2х действующих на неё факторовА и В.X - среднее значение исследуемой величины.Отклонение: X − X = α + β + γгде: α – отклонение вызванное фактором А;β – отклонение вызванное фактором В;γ - отклонение вызванное другими факторами.α, β, γ – случайные величины независимы.Дисперсию случайной величины Х, α, β, γ обозначим:σ x2 , σ α2 , σ β2 , σ γ2где: величина σ γ2 - остаточная дисперсия учитывающая влияние случайных и прочих неучтённыхфакторов.Для независимых и случайных величин имеет место равенство:σ x2 = σ α2 + σ β2 + σ γ2Сравнивая σ α2 или σ β2 с величиной σ γ2 можно установить степень влияния факторов А и Вна величину Х по сравнению с неучтёнными и случайными факторами.Сравнивая между собой σ α2 и σ β2 мы можем оценить сравнительную степень влиянияфакторов А и В на величину Х.Дисперсионный анализ позволяет на основании выборочных данных найти все значениядисперсии σ x2 , σ α2 , σ β2 , σ γ2 .