Раздаточные материалы, страница 4
Описание файла
PDF-файл из архива "Раздаточные материалы", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 6 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
Тем не менее анализу такой выборки необходимо дать вероятностнуюоценку.В 1908 году английский математик Вильям Госсет дал решение задачи малых выборок(псевдоним Стьюдент). Стьюдент показал, что в условиях малых выборок надо рассматривать нераспределение самих средних, а их нормированных отклонений от средних генеральных.Надо рассматривать:X −mt=σn−n⎛t2 ⎞ 2⎟S (t , n ) = S (− t , n ) = Bn ⎜⎜1 +- это чётное распределение.⎟n1−⎠⎝Оно зависит только от объёма выборки n и не зависит ни от математического ожидания, ни отдисперсии случайной величины Х. При n→∞ t – распределение Стьюдента переходит внормальное распределение.Поскольку в большинстве случаев σ генеральной совокупности неизвестно, то работает стакой величиной:- состоятельная и несмещённая оценка.Существуют t таблицы распределения Стьюдента.Величина доверительной вероятности, её выбор находятся за пределами прикладнойстатистики.
Они задаются самим исследователем. Величина доверительной вероятностиопределяется тяжестью тех последствий, которые могут произойти в случае, если произойдётнежелательное событие.Величина tn,p показывает предельную случайную ошибку расхождения средневыборочного иматематического ожидания.Распределение дисперсии в выборках нормальной совокупности.Распределение χ2 Пирсона.Выборочная дисперсия так же является случайной величиной меняющейся от выборки квыборки.1) М(Х) – известно;2) М(Х) – не известно.1) Имеется случайная величина Х, которая подчиняется нормальному закону с параметрами (m,σ2),где: хi(i = 1, 2, …, n) – независимые наблюдения над случайной величиной.Для дисперсии мы выбираем вот такую оценку:⎞1⎛ nS*2 = ⎜⎜ ( xi − m )2 ⎟⎟ - несмещённая, состоятельная и эффективная оценка дисперсию генеральнойn ⎝ i =1⎠совокупности.∑20xi − mσ= UiВеличина Ui является случайной величиной с параметрами (0;1).nnS 2χ 2 = 2* = U i2∑σi =1Случайная величина представляющая собой сумму квадратов n независимых случайныхвеличин, каждая из которых подчиняется нормальному закону распределения с параметрами (0;1)и независимых случайных величин с распределением χ2 с к = n – степенями свободы.Сама функция плотности вероятности f(χ2) имеет вид:( )n−2−χ 2f χ = Ln χ e 2Эта функция зависит только от объёма выборки и не зависит ни от математическогоожидания, ни от дисперсии, ни от х.Имеются таблицы распределения χ2 позволяющие вычислить вероятностьсобытия χ 2 > χ к2,α2()()P χ 2 , χ к2,α ,где: к – число степеней свободы;α – доверительная вероятность, которая задаётся самим исследователем.2) Математическое ожидание неизвестно.Когда случайная величина Х с параметрами (m, σ2) – неизвестны.Для оценки дисперсии генеральной совокупности используется величина:~1 n(xi − X )2S2 =n + 1 i =1~nS 2Случайная величина 2 имеет распределение χ2 с к = n – 1 степенями свободы.∑σУменьшение степени свободы использована для получения среднего выборочного.Доверительный интервал.Рассмотренные ранее оценки получили название точечных оценок.
На практике широкоиспользуются интервальные оценки, для получения которых используется метод доверительныхинтервалов.В методе доверительных интервалов указывает не одно(точечное) значение интересующегонас параметра, а целый интервал. Он строится на основе неравенства Чебышева:⎛m⎞Д⎜ ⎟⎫⎧mp(1 − p )1nP⎨ − p ≤ ε ⎬ ≥ 1 ⎝ 2 ⎠ = 1 −=1−2εnε4nε 2⎭⎩nЗадаётся некоторое число 0 < α < 1 близкое к нулю, которое называется уровеньзначимости.Параметр ε находится из неравенства:11= 1−α ⇒ ε =, тогда:1−24 nε2 nα21⎧m1 ⎫P⎨ − p ≤⎬ ≥ 1 − α;2 nα ⎭⎩n⎧m1 ⎫P⎨ − p >⎬ < α;2 nα ⎭⎩n11 ⎫m⎧mP⎨ −≤ p≤ +⎬ ≥ 1−αn 2 nα ⎭⎩ n 2 nα()m1 ⎞1⎛m, +Интервал P* , P* = ⎜ −⎟ называется доверительным интервалом с⎝ n 2 nα n 2 nα ⎠уровнем значимости α.Доверяясь расчёту мы утверждаем, что неизвестная вероятность принадлежит указанномуинтервалу, а вероятность возможной ошибки имеющей место тогда, когда этот интервал ненакрывает истинное значение α не превосходит уровня значимости α.n = 1000, m/n = 0,6При α = 0,1 (0,550; 0,650)При α = 0,01 (0,442; 0,758)Истинное значение вероятности Р мы незнаем, но можем утверждать, что первый интервалнакрывает это значение с вероятностью не менее чем 0,9 , а второй – 0,99.Пример.
Имеется некоторое предположение, гипотеза, о том, что неизвестная вероятность Рравна заданному число Р0:Н0: р = р0; (Р0 = 0,5).Эту гипотезу можно принять, а можно и отклонить посчитав её противоречащей известнымстатистическим данным.Для принятия решения(проверки гипотезы) мы проделаем следующую процедуру:Если Р0∈(Р*, Р*) с α, то гипотезу принимаем(возможно здесь и ошибка, мы можем принятьложную гипотезу – такая ошибка первого рода).Если Р0∉ (Р*, Р*) с α, то гипотеза отвергается(здесь тоже можем совершить ошибкуотклонить верную гипотезу – такая ошибка второго рода, вероятность такой ошибки заранеезадаётся нами при построении доверительного интервала).При наших предположениях, когда уровень значимости равен 0,1 в общем мы имеем Р0∉(0,550; 0,650). Эта гипотеза отвергается, при этом мы ошибаемся не более чем в 1 случае из 10.Построение доверительного интервала для математического ожидания.Случайная величина Х распределённая с параметрами (m, σ2).Математическое ожидание неизвестно и требуется построить для него доверительныйинтервал.1.
Известно σ2.2. Неизвестно σ2.1. σ2 известно.Проводится выборка из генеральной совокупности и в качестве несмещённой, состоятельнойи эффективной оценки математического ожидания выбирается X . Оно тоже подчиняетсянормальному закону с параметрами:⎛⎜ m, σ 2 ⎞⎟ , где: n – объём выборки.n⎠⎝Нормированная величина:X −mσn22подчиняется нормальному закону распределения с параметрами (0; 1), тогда вероятность:⎫⎧⎪⎪ X −mP⎨< Z p ⎬ = Ф Z p = P = 1−α⎪⎪σ n⎭⎩Вероятность задаётся уровнем α, величина Р – доверительная вероятность.
По таблиценаходим величину Zp.При известном Zp получим:σσ ⎫⎧< m < X + ZpP⎨ X − Z p⎬ = 1−αnn⎭⎩( )Интервал для математического ожидания (m*; m*) получим:– доверительный интервал для математического ожидания с уровнем значимости α.2. σ2 неизвестно.Точно так же проводится выборка объёмом n, формируется случайная величина tX −mnt= ~SСлучайная величина t имеет распределение Стьюдента.Зная объём выборки n, задаваясь уровнем значимости α или задаваясь доверительнойвероятностью р=1-α.По распределению Стьюдента находим tn,p – максимальное отклонение m и X .⎫⎪⎧⎪ X − mn < t n, p ⎬ = P = 1 − αP⎨ ~⎪⎭⎪⎩ Sгде: Р – доверительная вероятность.Отсюда легко строится доверительный интервал.~~⎧⎪t n, p S ⎫⎪tn, p SP⎨ X −<m< X +⎬ = 1−αn ⎪⎭n⎪⎩~~⎛tn, p S ⎞tn, p S*⎜⎟;X +m* ; m = X −⎜⎟nn⎝⎠()Несмотря на кажущиеся совпадения двух формул они существенно отличаются друг отдруга.Во втором случае величина доверительного интервала зависит не только от доверительнойвероятности, но и от объёма выборки.Это различие наиболее существенно проявляется при малых выборках.Построение доверительного интервала для дисперсии.Случайная величина Х распределена по нормальному закону с параметрами (m, σ2).Требуется построить доверительный интервал для дисперсии по выборочным дисперсия.~2S 2 или S{*A{БПостроение доверительного интервала для дисперсии основывается на том, что случайныевеличины:~nS*2 nS 2, 2– имеют распределение χ2 с2σσк = n, к = n – 1 – степенями свободы.23При заданной доверительной вероятности 1 – α мы записываем:~⎧ 2 nS 2⎫f(χ2)P ⎨ χ1 < 2 < χ 22 ⎬ = 1 − ασ⎩⎭По таблице распределения χ2 мыQдолжны выбрать такие два числа χ12 и χ 22 ,α/2α/2чтобы площадь заштрихованная была равна1-α1-α.χ12χ22χ2Обычно величины χ12 и χ 22 выбираюттаким образом, чтобы выполнялось неравенство:P χ 2 < χ12 = P χ 2 > χ 22 = α() ()2αα6472 48 6472 48⎧ 22⎫P ⎨ χ1 < 2 < χ 2 ⎬ = 1 − P (χ 2 < χ12 ) − P (χ 2 > χ 22 )σ⎩⎭2В таблице распределения χ имеется только вероятность вида:P χ 2 > χ к2,α~nS 2(()()P χ 2 < χ12 = 1 − P χ 2 > χ 22)Тогда:~⎧ 2 nS 2⎫P ⎨ χ1 < 2 < χ 22 ⎬ = P χ 2 > χ12 − P χ 2 > χ 22 = 1 − ασ⎩⎭Преобразуя это неравенство получим:~~2⎧ nS~ 2⎧ 2 nS 21 ⎞nS 2 ⎫σ2⎫ ⎛ 12P ⎨ χ1 < 2 < χ 2 ⎬ = ⎜⎜ 2 < ~ 2 < 2 ⎟⎟ = P ⎨ 2 < σ < 2 ⎬ = 1 − ασχ1 ⎠χ1 ⎭⎩ χ2⎩⎭ ⎝ χ 2 nS⎛ nS~ 2 nS~ 2 ⎞2*2σ * , σ = ⎜⎜ 2 ; 2 ⎟⎟⎝ χ 2 χ1 ⎠- доверительный интервал с уровнем значимости α.⎛ n S~ 2 n S~ 2 ⎞*σ * , σ = ⎜⎜ 2 ; 2 ⎟⎟χ1 ⎠⎝ χ2Проверка статистических гипотез.((() ()))Наряду с оценкой параметров распределения по выборочным данным большой интереспредставляет вид (закон) распределения неизвестный на практике.
Такие задачи решаютсяметодами статических гипотез.Относительно неизвестного теоретического распределения формируется некотороепредположение, которое формируется в виде гипотез.Например, теоретическое распределение подчиняется нормальному, экспоненциальномузакону.При проверки гипотез используется принцип значимости основывающийся на принципепрактической невозможности.Согласно принципу практической невозможности события с очень малыми вероятностями впрактических приложениях считаются невозможными.Максимум таких вероятностей определяет уровень значимости α, который задаётся.В свою очередь согласно принципу значимости отвергается случайность появленияпрактически невозможного события.24Поскольку теоретическое распределение задано гипотезой, то легко рассчитать вероятностьпоявления некоторого события при проведении испытаний или взятии выборки и пусть такаярасчётная вероятность не превышает ε, т.е.
событие является практически невозможным.Если же такое событие происходит, то возникает противоречие между выдвинутой гипотезойи выборкой. Гипотезу следует отвергнуть в этом и заключается содержание принципа значимости.Проверяемая гипотеза называется нулевой или основной Н0.Если гипотеза отвергается, то принимается противопоставляемая ей гипотеза Н1, котораяназывается конкурирующей ил альтернативной.Про проверки гипотезы Н0 возможны ошибки.Можно отвергнуть гипотезу Н0 в условиях когда она верна и совершить ошибку I-го рода иможно принять гипотезу, когда она не верна и совершить ошибку II-го рода.Решение поставленной задачи по сути дела состоит в разделении всего множествавыборочных данных на 2-а не пересекающихся подмножества О и W.