Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 17
Текст из файла (страница 17)
Получен-ное значение функции ТТЕСТ говорит о том, что вероятность наличия1013. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХсистематической погрешности у Рh-метра может быть оценена величиной 1 –0,089 = 0,91 (меньшей, чем 0,95, значения которого мы закладывали, выбираяуровень значимости α = 0,05).В заключение этого раздела еще раз подчеркнем, что все перечисленныевыше критерии могут быть использованы только для случайных величин, непротиворечащих нормальному закону распределения (закону распределенияГаусса). Так, например, применительно к t-критерию для зависимых выборокэто означает, что попарные разности должны быть нормально распределены.Если это предположение не выполняется (о том, как его можно проверить,смотри следующий раздел), то необходимо воспользоваться одним изальтернативных непараметрических критериев (см.
например, [10]).3.6. Критерии согласия.Проверка гипотез о виде функции распределенияРассмотренные ранее методы оценивания параметров распределенияслучайной величины и критерии для проверки статистических гипотезпредполагали, что известна функция распределения (нормальный закон –распределениеГаусса).Однаковбольшинствеслучаеввидзаконараспределения является гипотетическим и сам по себе требует статистическогоподтверждения.Наиболее простым, но весьма приближенным методом проверкисогласия результатов эксперимента с тем или иным законом распределенияявляется графический метод. Он заключается в оценке эмпирической функциираспределенияисопоставленииеесфункциейпредполагаемоготеоретического закона.
Если построенные экспериментальные точки лежатвблизи теоретического графика, то можно считать, что полученные в опытахданные не противоречат выбранному теоретическому закону распределения.Графическийметодявляетсявзначительноймересубъективнымииспользуется на практике в качестве первого приближения при решенииподобных задач.1023. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХБолееобъективныеметодыустановлениявидараспределенияслучайной величины строятся на аппарате проверки статистических гипотез критериях согласия.Нулевая гипотеза в данном случае заключается в том, что Н0:исследуемая генеральная совокупность не противоречит предполагаемомутеоретическому закону распределения. При этом альтернативная гипотезаобычно формулируется как Н1: случайная величина имеет любое другоераспределение, отличное от предполагаемого.Разработано достаточно много критериев согласия, отличающихся каксвоей мощностью, так и объемом опытных данных, необходимых для ихиспользования.
Рассмотрим некоторые из них, и в первую очередь остановимсяна критериях согласия, которые могут быть использованы при относительнобольших объемах выборки.Когдаэкспериментаторрасполагаетдостаточнопредставительнымколичеством экспериментальных данных (n > 100), то их предварительнаяобработка начинается с группировки, которая проводится в следующейпоследовательности:1. Находят наибольшее (xmax) и наименьшее (xmin) выборочные значенияслучайной величины и вычисляют ее размах R= xmax-xmin.2. Размах случайной величины разбивают на k равных интервалов.Количество интервалов k выбирают в зависимости от объема выборки.Например, при n >100 его значение рекомендуется принимать равным k=9÷15(при n <100 k=7).
Число интервалов k можно определить и по формулеШтюргеса k=1+3,32lg(n) с округлением полученного значения до ближайшейцелой величины.3. Определяют ширину интервала h=R/k, для упрощения расчетовполученные значения округляют в любую сторону, несколько увеличивая илиуменьшая при этом размах варьирования R.4. Устанавливают границы интервалов и подсчитывают число попаданийслучайной величины в каждый из выбранных интервалов m i , 1≤i≤k.1033. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ5. Определяют частоту попаданий для каждого интервала как Pi= m i /n.Результаты подобных вычислений могут быть сведены в таблицу (подобную,например, табл. 3.5).Таблица 3.5Построение распределения экспериментальных данныхИнтервалx1 ÷ x2x2 ÷ x3...xi ÷ xi+1...xk ÷ xk+1ПроверкаЧисло замеровв каждоминтервале m im1m2...mi...mkЧастота попаданияв интервалPi= m i/nm 1/nk∑ mi = ni =1m 2/n...m i/n...m k/nk∑P =1i =1iГрафической формой представления непрерывной случайной величиныявляется гистограмма (рис.3.8).
Последовательность построения гистограммследующая:1. Определяется величина ординаты f i = Pi h , где Pi – вероятностьпоявления случайной величины в i-м интервале.2. В системе координат fi=f(x) на ширине интервала h откладываютвеличины fi как высоты и строятся прямоугольники.Очевидно, что площадь элементарного прямоугольникаmPS i = h ⋅ f i = h ⋅ i = Pi = inh(3.53)равна отношению числа опытов mi, при которых случайная величина оказаласьвнутри этого интервала, к общему числу опытов n.1043. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХkkПлощадь всей гистограммы S = ∑ Si = ∑ Pi = 1 .
Следовательно, площадь,i =1i =1ограниченная гистограммой, равна единице.3. Построение гистограммы интегральной функции распределенияkосуществляется суммированием вероятностей: F( x ) = ∑ Pi .i =1f(x)F(x)1,0P1+P2P1hxxРис.3.8. К построению гистограммы случайной величиныВдальнейшемполученногоосуществляетсяраспределенияслучайнойсравнениевеличинысэкспериментальнонекоторымвидомтеоретического распределения. Для этой цели используются различныекритерии согласия: χ2 (хи-квадрат) Пирсона, Колмогорова–Смирнова и др.Критерий ПирсонаРассмотрим методику проверки гипотезы нормального распределения покритерию χ2 Пирсона.
Этот критерий кроме определения доверительногоинтервала для дисперсии нередко используется для проверки согласованностираспределений, полученных по данным выборки с некоторой теоретическойплотностью распределения.В данном случае применение критерия χ2 предполагает использованиесвойствнормированного(стандартного)нормальногоНапомним, что уравнение кривой плотностираспределения имеет вид105распределения.стандартного нормального3.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ1f ( z) =2πe −z2/2≈ 0,4 ⋅ e − z2/2; z=x - Mxσx.Тогда теоретическая вероятность попадания случайной величины винтервал ∆z=zi+1 – zi в случае нормального распределения можно определитьпо формулеz1 i+1 −u2 / 2Pi * = F(zi+1 ) − F(zi ) =e du.2π ∫zi(3.54)Отличие оценки закона распределения P от теоретического законараспределения P* можно охарактеризовать величинойkχ 2 = ∑ Ci (Pi − Pi *)2 ,i =1(3.55)где Pi и Pi* – оценка и теоретическая вероятность случайной величины для i-гоинтервала; Ci – весовые коэффициенты, которые с большим весом учитываютотклонения для меньших Pi.Пирсон выбрал весовые коэффициенты следующим образом:Ci =nPi * .(3.56)Пирсон показал, что при таком выборе Ci закон распределения χ2 слабозависит от n и P(x), а определяется в основном числом разрядов k.Следовательно,kχ = n∑2i =1(Pi − Pi *)2Pi *k= n∑i =1(m)2i()2kn − Pi *m − n ⋅ Pi *.=∑ iPi *n ⋅ Pi *i =1(3.57)Очевидно, что при идеальном соответствии экспериментальных данныхнормальному закону распределения экспериментальное значение критерияПирсона будет равно нулю, т.к.
Pi= Pi*.В выражении (3.55) стоит сумма квадратов k случайных величин, однакоони не являются независимыми, так как на них накладывается некоторое числосвязей. Одной из таких связей является требование, чтобы площадь под кривой1063. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХkоценки закона распределения равнялась единице: ∑ Pi = 1.
Иногда требуют,i =1чтобы среднее значение x совпадало с математическим ожиданием Mx, авыборочная дисперсия Sx2 – с дисперсией σx2. Поэтому число степенейсвободы чаще всего определяется какm = k - 2.(3.58)Теоретическое значение критерия Пирсона χ2α;m определяется посправочным данным (см. табл.П.3) или с использованием пакетов прикладныхпрограмм при заданном уровне значимости α и числе степеней свободы m (см.функцию ХИ2ОБР(α;m) из электронных таблиц Microsoft Excel).Алгоритм использования критерия Пирсона заключается в следующем.1. Выдвигаются нуль-гипотеза Н0: "Отличие экспериментальных данныхот нормального закона распределения не существенно" и альтернативная ейгипотеза Н1: "Отличие экспериментальных данных от нормального законараспределения существенно, т.е.
экспериментальные данные не подчиняютсязакону нормального распределения".2. По результатам экспериментальных измерений и предположениюнормального закона их распределения определяется расчетное значениекритерия Пирсона χ2.3.Определяютчислостепенейсвободыm,задаютсяуровнемзначимости α и определяют теоретическое значение критерия Пирсона χ2∝;m.4. Если χ2<χ2∝;m, то нуль-гипотеза Н0 о нормальном законе распределенияэкспериментальных данных принимается с доверительной вероятностью P=1-α.В противном случае нуль-гипотеза отвергается и принимается альтернативнаягипотеза Н1.Отметим важные рекомендации по использованию критерия χ2.Если при некотором числе измерений критерий χ2 >χ2∝;m, но сомнения внормальностираспределенияотсутствуют,тоследует,еслиимеетсявозможность, увеличить число измерений в несколько раз и повторить анализпо этому же критерию.1073.