Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента, страница 12
Описание файла
PDF-файл из архива "Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента", который расположен в категории "". Всё это находится в предмете "техника эксперимента в электронике и наноэлектронике" из 6 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "техника эксперимента в электронике и наноэлектронике" в общих файлах.
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
Вероятность этого события по определению равнауровню значимости α. Уровень значимости α – вероятность ошибки первого рода. Так как уровень значимости69задается произвольно, можно3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХснизить вероятность ошибки первого рода до сколь угодно низкого уровня.3.
Гипотеза Н0 неверна, и она отвергается. Опять принятое решение отражает истинное положение и отвергается неверная гипотеза.4. Гипотеза Н0 неверна, но она не отвергается. В этом случае допущенаошибка второго рода. Ошибка второго рода – ошибка, заключающаяся втом, что принимают нулевую гипотезу, в то время как в действительностиэта гипотеза неверна. Если вероятность ошибки второго рода обозначитькак β, то величина 1 – β носит название мощность критерия. Мощностькритерия – вероятность того, что если верна альтернативная гипотеза, тонулевая гипотеза будет отвергнута.Таблица 3.2Возможные исходы при проверке статистических гипотезФактическаяситуацияН0 - вернаН0 - принимаетсяН0 - отвергаетсяПравильное решениеОшибка первого рода (α)Н0 – не вернаОшибка второго рода (β)Правильное решениеЗначения применяемой для данного критерия статистики, при которыхдля выбранного уровня значимости отвергается нулевая гипотеза, образуют такназываемую критическую область.Критическая область ω – область со следующими свойствами: если значения применяемой статистики принадлежат данной области, то отвергают нулевую гипотезу; в противном случае ее принимают.Приведенные определения намечают самую простую форму проверкистатистических гипотез.
Для того чтобы пояснить сущность этого метода, предположим, что выборочная величина Θ, представляющая собой несмещеннуюоценку параметра Θ0, имеет плотность распределения f(Θ). Если гипотеза, состоящая в том, что Θ=Θ0 , верна, то функция f(Θ) должна попадать в среднююобласть, как показано на рис.3.4. Вероятность того, что параметр Θ не будетпревышать нижнего уровня Θ1-α/2,составит703.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХP(Θ ≤ Θ1−α / 2 ) =Θ1− α / 2∫ f (Θ)dΘ = α / 2.−∞Вероятность того, что параметр Θ превысит верхний уровень Θα/2, равнаP(Θ > Θ1−α / 2 ) =∞∫ f (Θ)dΘ = α / 2.Θα / 2Следовательно, вероятность того, что параметр Θ выйдет за пределыинтервала [Θ1-α/2; Θα/2 ], составляет α. Теперь примем величину α малой, чтобыпопадание параметра Θ за пределы интервала [Θ1-α/2; Θα/2 ] было маловероятно.
Если после извлечения выборки и определения величины Θ окажется, чтоона выходит за пределы интервала [Θ1-α/2; Θα/2 ] и попадает в критическую область, то в этом случае есть серьезные основания подвергнуть сомнению справедливость проверяемой гипотезы Θ = Θ0. С другой стороны, если параметр Θпопадает в интервал [Θ1-α/2; Θα/2 ], то в этом случае нет серьезных основанийподвергать сомнению справедливость проверяемой гипотезы, и гипотезу равенства Θ = Θ0 можно принять. Как видно из рис.3.4, ошибка первого рода допускается, если гипотеза верна, а параметр Θ попадает в область отклонениягипотезы.
Отсюда следует, что вероятность допустить ошибку первого родаравна α, т.е. уровню значимости критерия.f(Θ)ОбластьотклоненияОбласть принятияПлощадь = α/2ОбластьотклоненияПлощадь = α/2Площадь = 1-αΘ1-α/2Θ0Θα/2Рис. 3.4. Области принятия и отклонения гипотезыпри проверке гипотез713. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХДля того чтобы найти, какова вероятность допустить ошибку второго рода, необходимо задать определенную величину отклонения истинного значенияот гипотетического значения параметра, которое требуется определить. Предположим, например, что истинное значение параметра в действительностиравно Θ0+d или Θ0-d, как показано на рис.3.5.
Если, согласно гипотезе, Θ=Θ0, ав действительности Θ=Θ0 ±d, то вероятность того, что Θ попадает в областьпринятия гипотезы, т.е. в интервал [Θ1-α/2; Θα/2 ], составляет β. Это означает, чтовероятность допустить ошибку второго рода при выявлении отклонения ±d отгипотетического значения Θ равна β.f(Θ)Площадь =βПлощадь =βПлощадь =1-βΘ0-dПлощадь =1-βΘ1-α/2Θ0Θα/2Θ0+dРис.
3.5. Области принятия и отклонения гипотезы, соответствующие ошибке второго рода при проверке гипотезыОчевидно, что при любом заданном объеме выборки вероятность допустить ошибку первого рода можно сократить, уменьшив уровень значимости α.Однако при этом увеличивается вероятность допущения ошибки второго рода(снижается мощность критерия). Таким образом, в большинстве случаев нельзядобиться минимального значения вероятностей α и β одновременно. Поступают обычно следующим образом: фиксируют вероятность α ошибки первогорода, а затем добиваются минимума вероятности β ошибки второго рода. Засчет чего можно уменьшить β при фиксированном значении α? За счет правильного выбора критической области: при заданной альтернативе Н1 критическую область выбирают таким образом, чтобы значение β (вероятность принять неверную гипотезу) было наименьшим из возможных.
Таким образом, за723. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХдача состоит в построении наиболее мощного критерия (1- β) при заданномуровне значимости α.Различают односторонние и двусторонние критические области. Различные варианты областей представлены на рис. 3.6.Если хотят убедиться, что одна случайная величина строго больше илистрого меньше другой, то используют одностороннюю критическую область(рис.3.6.а,б).Таким образом, для данного случаяН0: Θ = Θ0 ;Н1(1) : Θ < Θ0;Н1(2) Θ > Θ0 .Если проверяют как положительные, так и отрицательные расхождениямежду изучаемыми величинами, то используют двусторонние критические области (рис.3.6,в)Н0 : Θ = Θ0 ;Н1(3): Θ ≠ Θ0 .Подводя итог всему вышесказанному, алгоритм проверки любой статистической гипотезы в самом общем случае заключается в следующем:1) формулирование нулевой гипотезы Н0;2) выбор одной из альтернативных гипотез Н1(1) , Н1(2) , Н1(3) ;3) поиск критерия, по которому может быть проверена сформулированная нулевая гипотеза Н0;4) расчет значения статистики, применяемой для данного критерия;5) выбор уровня значимости α;6) построение критической области ω при выбранном уровне значимости α;7) принятие решения: если значение статистики попало в критическую область– нулевая гипотеза отвергается, при этом вероятность ошибки (первого рода) не превышает выбранный уровень значимости; в противном случае –нулевая гипотеза принимается.733.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХбвf(Θ)f(Θ)f(Θ)Областьотклонения ОбластьпринятияОбластьотклоненияОбластьпринятия ОбластьотклоненияαΘ крпр,ααα/2Θ крлев,αОбластьотклоненияОбластьпринятияаα/2крΘ крлев,α / 2 Θ пр,α / 2Рис. 3.6. Критические области плотности распределения:а – правосторонняя, б – левосторонняя, в – двусторонняяПри использовании механизма статистических гипотез следует помнить,что даже в случае принятия нулевой гипотезы в 100α% вывод будет ошибочным в связи со всегда имеющейся вероятностью совершить ошибку первогорода. Причем если значение статистики не попадает в критическую область, топрежде, чем принять нулевую гипотезу, необходимо оценить вероятностьошибки второго рода, т.е.
рассчитать мощности критерия. Если же его величинаоказывается недостаточной для решения поставленной задачи, требуется увеличение объема опытных данных (однако поскольку при обработке эксперимента исследователи зачастую уже не имеют возможности увеличить объем выборки, то они обычно пропускают данный пункт).3.4.
Отсев грубых погрешностейЧасто даже тщательно поставленные эксперименты могут давать неоднородные данные, поскольку в процессе эксперимента могут измениться условия проведения опытов. Если экспериментатор по каким-либо причинам неуловил этих изменений, наблюдения, соответствующие разным уровням факторов, будут принадлежать к разным генеральным совокупностям. Данные, соответствующие изменившимся условиям, называют грубыми погрешностями(ошибками) или резко выделяющимися (аномальными) значениями. Грубые погрешности появляются также при неправильной записи показаний приборов.743. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХВ литературе приводятся сведения о том, что экспериментальные данные могут содержать ~ 10% аномальных значений.
Однако эти 10% могут датьсильное смещение при оценке параметров распределения, особенно для дисперсии, так как ошибки заметно отклоняются от основной группы значений, а надисперсию особенно сильно влияют крайние члены вариационного ряда (вариационный ряд – результаты наблюдений, расположенные в возрастающейпоследовательности x1≤ x2≤ x3 ... ≤ xi …≤xn).В случае отсева грубых погрешностей (ошибок) нулевая гипотеза формулируется следующим образом:Н0 :"Среди результатов наблюдений (выборочных, опытных данных) нетрезко выделяющихся (аномальных) значений ".Альтернативной гипотезой может бытьлибо Н1(1): "Среди результатов наблюдений есть только одна грубая ошибка",либо Н1(2): "Среди результатов наблюдений есть две или более грубых ошибки".В литературе можно встретить большое количество различных критериевдля отсева грубых погрешностей наблюдений.
Обычно экспериментаторы имеют дело с выборками небольшого объема (т.е. когда генеральная дисперсия σx2неизвестна и оценивается по опытным данным через выборочную дисперсиюSx2), причем именно в этом случае аномальные данные имеют большой вес.Наиболее распространенными и теоретически обоснованными в этом случаеявляются критерий Н.В.
Смирнова (используется при Н1(1) ) и критерий Диксона(применим как при Н1(1) , так и при Н1(2) ).3.4.1. Критерий Н.В. СмирноваЕсли известно, что есть только одно аномальное значение (альтернативная гипотеза Н1(1) ), то оно будет крайним членом вариационного ряда. Поэтомупроверять выборку на наличие одной грубой ошибки естественно при помощистатистики_u1 =x− x1,sx(3.39)753. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХесли сомнение вызывает первый член вариационного ряда x 1 = min x i ,iили_x −x,un = nsx(3.40)если сомнителен максимальный член вариационного рядаxn = max xi .iЭтот критерий впервые был предложен Н.В. Смирновым.
Он исследовалраспределение статистик [(3.39), (3.40)] и составил таблицы процентных точекuα,n (квантили порядка р = 1 – α) для α = 0,1; 0,05; 0,01 при 3 ≤ n ≤ 20 [11].При выбранном уровне значимости α критическая область для критерияН.В. Смирнова строится следующим образом:u1 > uα,n или un > uα,n ,(3.41)где uα,n – это табличные значения (см. [6] или табл. П.7).В случае если выполняется последнее условие (статистика попадает вкритическую область), то нулевая гипотеза отклоняется, т.е. выброс x1 или xn неслучаен и не характерен для рассматриваемой совокупности данных, а определяется изменившимися условиями или грубыми ошибками при проведенииопытов.