А.С. Новиков, С.А. Титов - Лабораторный практикум (1088544), страница 3
Текст из файла (страница 3)
Уравнение и коэффициент линейной регрессии. Коэффициент корреляции.
__________________
Всеобщее управление качеством: Учебник для вузов / О.П. Глудкин, Н.М. Горбунов и др., под общ. ред. О.П. Глудкина; М.: Горячая линия – Телеком, 2001. с. 93-133.
Лабораторная работа № 2
Проверка статистических гипотез
Цель работы
Изучение основных методов проверки статистических гипотез.
Содержание работы
Изучить основные статистические методы проверки параметрических и непараметрических гипотез.
Выполнить статистическую проверку непараметрической гипотезы о виде функции распределения экспериментальной, случайной величины.
Выполнить статистическую проверку параметрических гипотез о равенстве выборочного среднего некоторому значению (критерий Стьюдента) и о равенстве дисперсий независимых выборок (критерий Фишера).
Краткие теоретические сведения
Задача статистической проверки гипотез возникает при сравнительной оценке различных технологических процессов производства РЭС, определении величины возможного брака, установление связи между характеристиками и в других случаях.
При проверке гипотезы статистическими методами есть риск принять ложное решение. Теория статистической оценки гипотез позволяет вычислить вероятность принятия ложного решения. Если эта вероятность окажется незначительной, то можно признать, что применяемый критерий обеспечивает малый риск ошибки.
Приведем ряд определений, используемых в теории статистической оценки гипотез. Статистическая гипотеза есть некоторое предположение относительно свойств генеральной совокупности, из которой извлекается выборка. Критерий статистической гипотезы – это правило, позволяющее принять или отвергнуть данную гипотезу на основании выборки. При построении такого правила используются определенные функции g(x1,x2,…xn) результатов наблюдений x1,x2,…xn, называемые статистиками для проверки гипотез. Все возможные значения подобных статистик делятся на две части: область принятия гипотезы и критическую область. Проверка гипотезы сводится к выяснению того, попадает или нет конкретное значение статистики, вычисленное по выборке, в критическую область: если нет – гипотеза принимается, как не противоречащая результатам наблюдения, если да – гипотеза отвергается.
Нулевой называется выдвинутая гипотеза H0. Конкурирующей (альтернативной) называют гипотезу (H1), которая противоположна нулевой. Ошибка первого рода имеет место, когда отвергается правильная гипотеза H0. Вероятность этой ошибки определяется уровнем значимости – q, выбор его определяется тяжестью последствий ошибки I рода.
Пусть имеются причины считать, что истинное значение оцениваемого параметра, например, математического ожидания, равно m0. Это проверяемое предположение является нулевой гипотезой H0: mx = m0. Вид критической области, при попадании в которую выборочной статистики отвергается правильная гипотеза H0, определяется характером альтернативной гипотезы H1. Если нулевой гипотезе H0: mx = m0 противопоставляется альтернативная гипотеза H1: mx m0, то критерий для проверки Н0 носит название двустороннего, а его критическая область состоит из двух частей. Если же альтернативная гипотеза формулируется в виде H1: mx > m0 или H1: mx < m0, то соответствующие критерии называются односторонними и их критические области содержат одну часть.
Предположения о виде функции распределения случайной величины называются непараметрическими гипотезами. Для проверки гипотезы о соответствии экспериментального закона распределения случайной величины теоретическому наиболее часто применяют критерий Пирсона, называемый также критерием 2 («хи – квадрат»).
Пусть генеральная совокупность имеет функции распределения F(x). Из этой совокупности извлечена выборка объемом n (n50). Разобьем весь диапазон полученных результатов на k частичных интервалов равной длины, и пусть в каждом интервале оказалось mi измерений (частот), причем:
Требуется на основе имеющейся информации проверить нулевую гипотезу, что гипотетическая функция распределения F(x) значимо представляет данную выборку.
При проверке нулевой гипотезы с помощью критерия согласия придерживаются следующей последовательности:
1) вычисляют вероятности попадания случайной величины X в частичные интервалы [xi-1,xi]:
где i=1…k.
В случае рассмотрения нормального закона распределения:
где m0 и – математическое ожидание и среднее квадратическое отклонение рассматриваемой случайной величины, соответственно. Вычисление значений функции распределения можно проводить, пользуясь нормированной функцией Лапласа:
где нормированная переменная z равна:
Значения функции Лапласа представлены в табл. 1.
2) Умножая полученные вероятности на объем выборки n, получают теоретические частоты npi частичных интервалов, т.е. частоты, которые следует ожидать, если нулевая гипотеза справедлива.
3) Вычисляют выборочную статистику (критерий 2):
Если нулевая гипотеза верна, то при n закон распределения выборочной статистики независимо от вида функции F(x) стремится к распределению 2 c = k – f – 1 степенями свободы. Здесь f – число параметров гипотетической функции F(x), оцениваемых по данным выборки (для нормального распределения f=2).
Критерий 2 сконструирован таким образом, что чем ближе к нулю наблюдаемое значение критерия 2, тем вероятнее, что нулевая гипотеза справедлива. Для проверки гипотезы по таблицам 2 распределения по заданному уровню значимости q и числу степеней свободы находится критическое значение 2кр, удовлетворяющее условию P(22кр) = q.
Если 2набл < 2кр, то считается, что нет оснований для отклонений нулевой гипотезы, таким образом гипотетическая функция F(x) согласуется с опытными данными.
Рассмотрим теперь статистические процедуры проверки параметрических гипотез. Пусть задана некоторая случайная величина, имеющую гауссовский закон распределения, дисперсия которой неизвестна. Для проверки гипотезы о равенстве выборочного среднего случайной величины значению m0 (H0: mx = m0) используется критерий Стьюдента (t – распределение). Пусть имеется экспериментальная выборка объемом n со средним арифметическим и выборочным средним квадртическим отклонением sx. Статистика для проверки гипотезы, подчиняющаяся t – распределению с = n–1 степенями свободы, вычисляется по формуле:
Пусть критерий является двусторонним, и альтернативная гипотеза сформулирована следующим образом H1: mx m0. Тогда проверяемая гипотеза Н0 принимается при уровне значимости q, если выполняется неравенство .
Если есть основания сформулировать альтернативную гипотезу в виде H1: mx < m0 или mx > m0, то гипотеза принимается при выполнении условий или
, соответственно.
Рассмотрим теперь критерий Фишера (F–критерий). Для гауссовского закона распределения случайной величины сформулируем гипотезу о равенстве выборочных дисперсий: H0: x12=x22 ; H1: x12x22 . В этом случае в качестве критерия значимости используется параметр, равный отношению двух независимых оценок дисперсий генеральной совокупности s12 > s22, имеющих соответственно степени свободы 1=n1 –1, 2=n2 –1:
Если полученное значение критерия меньше табличного значения F – распределения при заданном уровне значимости F<F1,2,q/2 , то гипотезу следует принять.
Порядок выполнения работы
1. Измерить отклонения от номинальной толщины для набора пьезокерамических резонаторов (n > 50). Измерения проводятся с помощью измерительной стойки, снабженной индикатором часового типа с ценой деления 1 мкм. Сначала на основание измерительной стойки устанавливается калибровочная пластина толщиной 1 мм (плитка Иогансона) и микрометрическим винтом вертикальной подачи показание индикатора устанавливается на нулевую отметку. После калибровки проводят измерение отклонения от номинального размера для представленного набора резонаторов, устанавливая при измерениях шток индикатора на поверхность их металлизированных электродов.
2. Рассчитать выборочные оценки математического ожидания и среднего квадратического отклонения полученной выборки. Для расчетов можно пользоваться формулами (5), (6) из лабораторной работы №1 или функциями СРЗНАЧ, СТАНДОТКЛОН, входящими в состав MS EXCEL. Построить гистограмму для данной выборки.
3. Провести проверку непараметрической гипотезы о нормальном законе распределения экспериментальной выборки. Процедура проверки по критерию Пирсона подробно описана выше в теоретическом введении к работе. Необходимые для расчета значения функции Лапласа представлены в табл. 1, а значения 2 распределения брать из табл. 2 лабораторной работы №1.
4. Сформировать новую выборку меньшего объема, отобрав первые 15 измерений. Для новой выборки (n = 15) проверить по критерию Стьюдента гипотезу о равенстве нулю выборочного среднего (H0: mx = m0= 0). Для этого рассчитать выборочные среднее и среднее квадратическое отклонение новой выборки и определить статистику по формуле (7), пользуясь табл. 1 лабораторной работы №1 для значения t,q – распределения (Стьюдента). Проверку гипотезы проводить при следующих трех вариантах альтернативной гипотезы: H1: mx m0, H1: mx < m0 и H1: mx > m0.
Таблица 1. Значения функции Лапласа Ф(z).
Z | Ф(Z) | Z | Ф(Z) | Z | Ф(z) |
0 | 0 | 1,28 | 0,39973 | 2,56 | 0,494765 |
0,04 | 0,015955 | 1,32 | 0,40658 | 2,60 | 0,495340 |
0,08 | 0,03188 | 1,36 | 0,41309 | 2,64 | 0,495855 |
0,12 | 0,04776 | 1,40 | 0,41925 | 2,68 | 0,496315 |
0,16 | 0,06356 | 1,44 | 0,42507 | 2,72 | 0,496735 |
0,2 | 0,07926 | 1,48 | 0,43057 | 2,76 | 0,497110 |
0,24 | 0,094835 | 1,52 | 0,43575 | 2,80 | 0,497445 |
0,28 | 0,11026 | 1,56 | 0,44062 | 2,84 | 0,497745 |
0,32 | 0,12552 | 1,60 | 0,4452 | 2,88 | 0,498010 |
0,36 | 0,14058 | 1,64 | 0,4495 | 2,92 | 0,498250 |
0,4 | 0,15173 | 1,68 | 0,45352 | 2,96 | 0,498460 |
0,44 | 0,17003 | 1,72 | 0,45729 | 3,00 | 0,499650 |
0,48 | 0,1844 | 1,76 | 0,4608 | 3,04 | 0,498815 |
0,52 | 0,1985 | 1,80 | 0,46407 | 3,08 | 0,498965 |
0,56 | 0,21226 | 1,84 | 0,46712 | 3,12 | 0,499095 |
0,60 | 0,22575 | 1,88 | 0,46995 | 3,16 | 0,499210 |
0,64 | 0,23892 | 1,92 | 0,47257 | 3,20 | 0,499315 |
0,68 | 0,25175 | 1,96 | 0,4750 | 3,24 | 0,499400 |
0,72 | 0,26422 | 2,00 | 0,4773 | 3,28 | 0,499480 |
0,76 | 0,27638 | 2,04 | 0,47932 | 3,32 | 0,499550 |
0,80 | 0,28815 | 2,08 | 0,481235 | 3,36 | 0,499610 |
0,84 | 0,29955 | 2,12 | 0,482995 | 3,40 | 0,499665 |
0,88 | 0,31057 | 2,16 | 0,484615 | 3,44 | 0,499710 |
0,92 | 0,32122 | 2,20 | 0,486095 | 3,48 | 0,499750 |
0,96 | 0,33147 | 2,24 | 0,487455 | 3,52 | 0,499758 |
1,00 | 0,34135 | 2,28 | 0,488695 | 3,56 | 0,499815 |
1,04 | 0,35083 | 2,32 | 0,489825 | 3,60 | 0,499840 |
1,08 | 0,35993 | 2,36 | 0,49086 | 3,64 | 0,499865 |
1,12 | 0,36865 | 2,40 | 0,491575 | 3,68 | 0,499885 |
1,16 | 0,37698 | 2,44 | 0,492655 | 3,72 | 0,499900 |
1,20 | 0,38493 | 2,48 | 0,493430 | 3,76 | 0,499915 |
1,24 | 0,39251 | 2,52 | 0,494130 | 3,80 | 0,499930 |
5. Сформировать две новые, непересекающиеся выборки объемом по 9 измерений каждая. Рассчитать выборочные дисперсии s12 и s22. Проверить по критерию Фишера гипотезу о равенстве выборочных дисперсий: H0: x12=x22; при альтернативной гипотезе H1: x12x22, как это описано выше. Значения F – распределения приведены в табл. 2.