Проверка статистических гипотез - 2 (543704), страница 4
Текст из файла (страница 4)
Если факторная дисперсия окажется меньше остаточной, то гипотеза оравенстве математических ожиданий генеральных совокупностей верна. При этом нетнеобходимости использовать критерий F.Если число испытаний на разных уровнях различно (q1 испытаний на уровне F 1, q 2 – науровне F 2 , …, qр - на уровне F р ), тоS общ = ( Р1 + Р2 + ... + Р р ) − ( R1 + R2 + ... + R p ) ,qjгде Pj = ∑ xij2 − сумма квадратов наблюдавшихся значений признака на уровне Fj,i =1qjR j = ∑ xij − сумма наблюдавшихся значений признака на уровне Fj . При этом объемi =1выборки, или общее число испытаний, равен n = q1 + q 2 + ... + q p .Факторная сумма квадратов отклонений вычисляется по формуле R12 R22R p2 ( R1 + R2 + ...
+ R p ) 2−S факт =++ ... +. q1 q 2qnp Остальные вычисления проводятся так же, как в случае одинакового числа испытаний:S фактS22S ост = S общ − S факт , s факт=, s ост= ост .р −1п− рЛекция 24.Моделирование случайных величин методом Монте-Карло (статистическихиспытаний).Задачу, для решения которой применяется метод Монте-Карло, можно сформулироватьтак: требуется найти значение а изучаемой случайной величины. Для его определениявыбирается случайная величина Х, математическое ожидание которой равно а, и длявыборки из п значений Х, полученных в п испытаниях, вычисляется выборочное среднее:80PDF created with FinePrint pdfFactory trial version http://www.fineprint.comх=∑хi,nкоторое принимается в качестве оценки искомого числа а:a ≈ a * = x.Этот метод требует проведения большого числа испытаний, поэтому его иначе называютметодом статистических испытаний.
Теория метода Монте-Карло исследует, какнаиболее целесообразно выбрать случайную величину Х, как найти ее возможныезначения, как уменьшить дисперсию используемых случайных величин, чтобыпогрешность при замене а на а* была возможно меньшей.Поиск возможных значений Х называют разыгрыванием случайной величины.Рассмотрим некоторые способы разыгрывания случайных величин и выясним, какоценить допускаемую при этом ошибку.Оценка погрешности метода Монте-Карло.Если поставить задачу определения верхней границы допускаемой ошибки с заданнойдоверительной вероятностью γ, то есть поиска числа δ, для которогоp (| X − a |≤ δ ) = γ ,то получим известную задачу определения доверительного интервала для математического ожидания генеральной совокупности (см.
лекцию 18). Воспользуемся результатамирешения этой задачи для следующих случаев:1) случайная величины Х распределена нормально и известно ее среднееtδквадратическое отклонение. Тогда из формулы (18.1) получаем: δ =, где п –nчисло испытаний, σ - известное среднее квадратическое отклонение, а t – аргументфункции Лапласа, при котором Ф(t) = γ/2.2) Случайная величина Х распределена нормально с неизвестным σ. Воспользуемсяtγ s, где s – исправленноеформулой (18.3), из которой следует, что δ =nвыборочное среднее квадратическое отклонение, а t γ определяется посоответствующей таблице.3) Если случайная величина распределена по иному закону, то при достаточнобольшом количестве испытаний (n > 30) можно использовать для оценки δпредыдущие формулы, так как при п→∞ распределение Стьюдента стремится кнормальному, и границы интервалов, полученные по формулам (18.1) и (18.3),различаются незначительно.Разыгрывание случайных величин.Определение 24.1.
Случайными числами называют возможные значения r непрерывнойслучайной величины R, распределенной равномерно в интервале (0; 1).1. Разыгрывание дискретной случайной величины.Пусть требуется разыграть дискретную случайную величину Х, то есть получитьпоследовательность ее возможных значений, зная закон распределения Х:Х х1 х2 … хпр р1 р2 … рп .Рассмотрим равномерно распределенную в (0, 1) случайную величину R и разобьеминтервал (0, 1) точками с координатами р1, р1 + р2, …, р1 + р2 +… +рп-1 на п частичныхинтервалов ∆ 1 , ∆ 2 ,..., ∆ п , длины которых равны вероятностям с теми же индексами.81PDF created with FinePrint pdfFactory trial version http://www.fineprint.comТеорема 24.1.
Если каждому случайному числу r j (0 ≤ r j < 1) , которое попало в интервал∆ i , ставить в соответствие возможное значение xi , то разыгрываемая величина будетиметь заданный закон распределения:Х х1 х2 … хпр р1 р2 … рп .Доказательство.Возможные значения полученной случайной величины совпадают с множествомх1 , х2 ,… хп, так как число интервалов равно п, а при попадании rj в интервал ∆ iслучайная величина может принимать только одно из значений х1 , х2 ,… хп.Так как R распределена равномерно, то вероятность ее попадания в каждый интервалравна его длине, откуда следует, что каждому значению xi соответствует вероятность pi.Таким образом, разыгрыываемая случайная величина имеет заданный законраспределения.Пример. Разыграть 10 значений дискретной случайной величины Х, закон распределениякоторой имеет вид: Х 2368р 0,1 0,3 0,5 0,1Решение.
Разобьем интервал (0, 1) на частичные интервалы: ∆1- (0; 0,1), ∆2 – (0,1; 0,4), ∆3 (0,4; 0,9), ∆4 – (0,9; 1). Выпишем из таблицы случайных чисел 10 чисел: 0,09; 0,73; 0,25;0,33; 0,76; 0,52; 0,01; 0,35; 0,86; 0,34. Первое и седьмое числа лежат на интервале ∆1,следовательно, в этих случаях разыгрываемая случайная величина приняла значение х1 =2; третье, четвертое, восьмое и десятое числа попали в интервал ∆2, что соответствует х2 =3; второе, пятое, шестое и девятое числа оказались в интервале ∆3 – при этом Х = х3 = 6; напоследний интервал не попало ни одного числа. Итак, разыгранные возможные значенияХ таковы: 2, 6, 3, 3, 6, 6, 2, 3, 6, 3.2.
Разыгрывание противоположных событий.Пусть требуется разыграть испытания, в каждом из которых событие А появляется сизвестной вероятностью р. Рассмотрим дискретную случайную величину Х,принимающую значения 1 (в случае, если событие А произошло) с вероятностью р и 0(если А не произошло) с вероятностью q = 1 – p. Затем разыграем эту случайную величинутак, как было предложено в предыдущем пункте.Пример. Разыграть 10 испытаний, в каждом из которых событие А появляется свероятностью 0,3.Решение. Для случайной величины Х с законом распределения Х 1 0р 0,3 0,7получим интервалы ∆1 – (0; 0,3) и ∆2 – (0,3; 1). Используем ту же выборку случайныхчисел, что и в предыдущем примере, для которой в интервал ∆1 попадают числа №№1,3 и7, а остальные – в интервал ∆2. Следовательно, можно считать, что событие А произошло впервом, третьем и седьмом испытаниях, а в остальных – не произошло.3.
Разыгрывание полной группы событий.Если события А1, А2, …, Ап, вероятности которых равны р1 , р2 ,… рп, образуют полнуюгруппу, то для из разыгрывания (то есть моделирования последовательности их появленийв серии испытаний) можно разыграть дискретную случайную величину Х с закономраспределения Х 1 2 … п, сделав это так же, как в пункте 1. При этом считаем, чтор р1 р2 … рпесли Х принимает значение хi = i, то в данном испытании произошло событие Аi.82PDF created with FinePrint pdfFactory trial version http://www.fineprint.com4.
Разыгрывание непрерывной случайной величины.а) Метод обратных функций.Пусть требуется разыграть непрерывную случайную величину Х, то есть получитьпоследовательность ее возможных значений xi (i = 1, 2, …, n), зная функциюраспределения F(x).Теорема 24.2. Если ri – случайное число, то возможное значение xi разыгрываемойнепрерывной случайной величины Х с заданной функцией распределения F(x),соответствующее ri , является корнем уравненияF(xi) = ri.(24.1)Доказательство.Так как F(x) монотонно возрастает в интервале от 0 до 1, то найдется (причемединственное) значение аргумента xi , при котором функция распределения приметзначение ri .
Значит, уравнение (24.1) имеет единственное решение: хi = F-1(ri ), где F-1функция, обратная к F. Докажем, что корень уравнения (24.1) является возможнымзначением рассматриваемой случайной величины Х. Предположим вначале, что xi –возможное значение некоторой случайной величины ξ, и докажем, что вероятностьпопадания ξ в интервал (с, d) равна F(d) – F(c). Действительно,c < xi < d ⇔ F (c) < ri < F (d ) в силу монотонности F(x) и того, что F(xi) = ri.
Тогдас < ξ < d ⇔ F (c) < R < F (d ) , следовательно,p (с < ξ < d ) = p ( F (c) < R < F (d )) = F (d ) − F (c). Значит, вероятность попадания ξ винтервал (c, d) равна приращению функции распределения F(x) на этом интервале,следовательно, ξ = Х.Пример.Разыграть 3 возможных значения непрерывной случайной величины Х, распределеннойравномерно в интервале (5; 8).Решение.х −5х−5F(x) =, то есть требуется решить уравнение i= ri , xi = 3ri + 5. Выберем 333случайных числа: 0,23; 0,09 и 0,56 и подставим их в это уравнение.
Получимсоответствующие возможные значения Х: х1 = 5,69; х 2 = 5,27; х3 = 6,68.б) Метод суперпозиции.Если функция распределения разыгрываемой случайной величины может бытьпредставлена в виде линейной комбинации двух функций распределения:F ( x) = C1 F1 ( x) + C 2 F2 ( x) (C1, 2 > 0) ,(24.2)то C1 + C 2 = 1 , так как при х→∞ F(x) → 1.Введем вспомогательную дискретную случайную величину Z с законом распределенияZ12 . Выберем 2 независимых случайных числа r1 и r2 и разыграем возможноеpC1 C2значение Z по числу r1 (см. пункт 1). Если Z = 1, то ищем искомое возможное значение Хиз уравнения F1 ( x) = r2 , а если Z = 2, то решаем уравнение F2 ( x) = r2 .Можно доказать, что при этом функция распределения разыгрываемой случайнойвеличины равна заданной функции распределения.в) Приближенное разыгрывание нормальной случайной величины.11Так как для R, равномерно распределенной в (0, 1), M ( R ) = , D( R) =, то для суммы п212независимых, равномерно распределенных в интервале (0,1) случайных величинn n n n nnR j M ∑ R j = , D ∑ R j = , σ =.
Тогда в силу центральной предельной∑12j =1 j =1 2 j =1 1283PDF created with FinePrint pdfFactory trial version http://www.fineprint.comn∑Rj =1j−n2при п → ∞ будет иметьn12распределение, близкое к нормальному, с параметрами а = 0 и σ =1. В частности,теоремы нормированная случайная величина12достаточно хорошее приближение получается при п = 12:∑Rj =1j− 6.Итак, чтобы разыграть возможное значение нормированной нормальной случайнойвеличины х, надо сложить 12 независимых случайных чисел и из суммы вычесть 6.84PDF created with FinePrint pdfFactory trial version http://www.fineprint.com.