Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента, страница 9
Описание файла
PDF-файл из архива "Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента", который расположен в категории "". Всё это находится в предмете "техника эксперимента в электронике и наноэлектронике" из 6 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "техника эксперимента в электронике и наноэлектронике" в общих файлах.
Просмотр PDF-файла онлайн
Текст 9 страницы из PDF
Если, к примеру, α = 0,05, то строится доверительный интервал с доверительной вероятностью 0,95 (или 95-процентный доверительный интервал).Часто доверительный интервал находится как интервал, симметричныйотносительно точечной оценки параметра. Для симметричного доверительногоинтервала его ширина 2δ определяется условием{}P Θ − Θ * ≤ δ = 1 − α,(3.18)где Θ * – точечная оценка параметра Θ.513.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХПри фиксированном значении α (вероятности того, что доверительныйинтервал не накроет действительного значения параметра) чем меньше δ, темточнее оценивается Θ.Вероятностное утверждение P{Θ1*≤Θ≤Θ2*} не следует понимать такимобразом, что параметр Θ есть случайная величина, которая с вероятностью Pпопадет в интервал между Θ1* и Θ2*.Любой параметр распределения Θ (в отличие от его оценок) – это детерминированная величина, неизвестная нам, но имеющая строго определенное,фиксированное значение (которое, по крайней мере, теоретически, может бытьнайдено при исследовании всей генеральной совокупности). Границы Θ1* и Θ2*(как некоторые функции от результатов наблюдений) есть случайные величины.
Поэтому утверждение P{Θ1*≤Θ≤Θ2*} = P означает, что для данного доверительного интервала (Θ1*;Θ2*) вероятность содержать значение Θ равна P.Рассмотрение способов получения интервальных оценок для основныхпараметров распределения начнем с построения доверительного интерваладля математического ожидания, так как именно такие задачи наиболее частовстречаются в инженерной практике.3.2.1. Построение доверительного интервала для математического ожиданияКак уже было отмечено, наилучшей (состоятельной, несмещенной и эффективной) точечной оценкой математического ожидания случайной величиныХ с нормальным законом распределения является ее выборочное среднееарифметическое x .
Поэтому за основу построения доверительного интерваладля математического ожидания обычно выбирается именно эта точечная оценка данного параметра. Задача получения интервальной оценки в этом случаезаключается в поиске границ(x − δ ; x + δ ) такого интервала, который с заданнойдоверительной вероятностью PMx накроет действительное значение математического ожидания Mx (рис.3.1).523.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХδδMxxxРис.3.1. Построение доверительного интерваладля математического ожиданияПри построении любой интервальной оценки, в том числе и для математического ожидания, необходимо знать распределение той точечной оценки(случайной величины), которая берется за основу для построения доверительного интервала.В математической статистике доказано, что выборочное среднее арифметическое x из n независимых результатов наблюдений случайной величины,распределенной нормально с параметрами Mx и σx2, также подчиняется нормальному закону распределения с параметрами:M( x ) = Mx ,(3.19)σ2( x ) = σx2 /n.(3.20)Подтвердить справедливость равенства (3.19) можно хотя бы тем, чтовыборочное среднее арифметическое - это несмещенная оценка математического ожидания, следовательно, по определению (см.
(3.2)), математическоеожидание этой оценки (выборочного среднего арифметического) равно значению оцениваемого параметра (математическому ожиданию).Соотношение (3.20) не должно, интуитивно, вызывать ни каких серьезныхвозражений: ведь если подсчитать выборочное среднее арифметическое понескольким выборкам одного и того же объема, а затем найти дисперсию полученных значений, то вероятнее всего предположить, что разброс (дисперсия)выборочных средних арифметических будет меньше, чем разброс (дисперсия)самих опытных данных.Прокомментируем это положение следующим иллюстративным числовым материалом (в продолжение примера 3.1). На каждом двадцатом по ходутехнологического процесса рельсе Р65 (по ГОСТ 18267-82) получены следующие значения твердости на поверхности катания головки:533.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХпервый рельс2= 97 );– 351, 370, 365 ( x HB = 362 , S HBдвадцать первый рельс2= 252 );– 375, 369, 345 ( x HB = 363 , S HBсорок первый рельс2– 348, 363, 369 ( x HB = 360 , S HB= 117 ).Если теперь по (3.8) оценить дисперсию такой случайной величины, какHB , то получимS 2__ =HB()1 ⎡12⎤3622 + 3632 + 3602 − (362 + 363 + 360) ⎥ = 2,33 .⎢3 −1 ⎣3⎦Как видно из этого числового примера, выборочная дисперсия среднихарифметических - 2,33 по трем выборкам (объемом 3) почти на порядок меньше тех выборочных дисперсий (97, 252 и 117), которые имеют сами опытныеданные.Для более строгого обоснования соотношения (3.20) напомним, что еслислучайная величина Y = X1 ± X2 - является суммой или разностью двух независимых случайных величин X1 и X2, то справедливо равенствоσ y2 =σ x2 +σ x2 .1(3.21)2Кроме того, дисперсия произведения случайной переменной X и постоянной величины (константы) C равнаσ 2(C ⋅ x) = C2 ⋅σx2.(3.22)Закон сложения дисперсий справедлив при любом числе слагаемых.Учитывая, что x =1 nx i и σ x2 – дисперсия случайной величины X, а также со∑n i =1отношения (3.21) и (3.22), получаем:2n ⋅ σ x2 σ x21 n⎛1⎞ 2 nσ ( x) = σ ( ∑ xi ) = ⎜ ⎟ σ (∑ xi ) = 2 = ,n i =1nn⎝n⎠i =12_2_что и требовалось доказать, причем σ ( x ) = σ x ⋅541.n3.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХЕсли заранее известна дисперсия σx2, то доверительный интервал дляматематического ожидания Mx рассчитывается достаточно просто. Его границыможно найти, например, следующим образом.Поскольку случайная величина X подчиняется нормальному закону распределения с параметрами M( x ) = Mx и σ2( x ) = σx2/n , то соответствующая ейприведенная случайная величина_Z=−_X − M ( x)_=σ ( x)X−Mxσx / n,(3.23)имеет нормированный стандартный нормальный закон распределения[см.(2.27)].Квантиль x p порядка P такой случайной величины, как X , определяетсяаналогично (2.32а) и с учетом соотношений (3.19) и (3.20) равна:___x p = M (x) + z pσ (x) = M x + z pσxn.Далее, в соответствии с (2.20)___σ _σ ⎞⎛P (x P1 < x < x P2 ) = P ⎜⎜ M x + zP1 x < x < M x + zP2 x ⎟⎟ = P2 − P1.nn⎠⎝Если в последнем соотношении неравенство, стоящее под знаком вероятности, разрешить относительно Mx, то получим_σσ ⎞⎛_P ⎜⎜ x− zP2 x < M x < x− zP1 x ⎟⎟ = P2 − P1.nn⎠⎝_Еслиx < M x + z P2σxn,x > M x + z P1и, следовательно,M_σ_xM x > x− z P 2то − Mx < − x+ zP2 n и, следовательно,_и, аналогично, если(3.24)σx_n то_x,< x − z P1− M x > − x + z P1σσxn,xn .Таким образом, вероятность того, что выполняется неравенство55σxn,3.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ_x− z P 2σxn_< M x < x− z P1σxn ,(3.25)будет P = P2 – P1 = 1- α.Если для примера принять P1= 0,025 и P2 = 0,975 (P=0,975–0,025 =0,95;α=0,05), то, поскольку (см. (2.32)) z0,025 = z1-0,975 = - z0,975 ,а z0,975 = 1,96 (по таблицам [11], табл. П.2 или используя НОРМСТОБР(0,975) = 1,959961), получим_P( x− 1,96σxn_< M x < x+ 1,96σxn) = 0,95,(3.26)т.е.
при многократном извлечении выборок (объемом n каждая) из нормально распределенной генеральной совокупности (с параметрами Mx и σx2)можно построить последовательность соответствующих данным выборкам интервалов (3.26), причем примерно 95% этих интервалов будут включать в себя(накрывать) истинное значение математического ожидания Mx.При построении доверительного интервала для математического ожидания обычно принимают P1= α/2 и P2 = 1 – α/2, т.е. рассматривают симметричныеграницы относительно выборочного среднего арифметического.
В инженерныхприложениях для значений α обычно выбирают α = 0,1 или α = 0,05, реже α =0,01, т.е. строят такие доверительные интервалы, которые в 90 или 95% (реже99%) случаев накрывают математическое ожидание.С учетом соотношения (2.32) zα/2=- z1- α/2, по (3.25) получаем, что вероят-ность выполнения неравенства_x − z1−α / 2σxn_< M x < x + z1−α / 2σx(3.27)nравна P = 1 – α/2 - α/2 = 1- α.Следовательно, интервал (3.27) является доверительным интерваломдля математического ожидания Mx случайной величины с нормальным закономраспределения, построенным с доверительной вероятностью P = 1- α. Границы563. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ_этого интервала равны(см. рис.3.1)δ = z1−α / 2x− z1−α / 2σx_n иx+ z1−α / 2σxn , а половина его шириныσxn.Пример 3.2.
При проектированиисистемы управления базой данныхбыло проведено исследование характеристик файлов ряда действующих и разрабатываемых информационных систем. В процессе исследования рассмотрены n = 49 файлов и получены следующие данные: средняя величина файла_x = 55 кбайт, σ(x) =11. Необходимо определить доверительный интервал M ;xобъем выборки n, который необходимо выполнить, чтобы точность статистических выводов δ ≤ 2, и величину записи R на физическом уровне хранения данных, обеспечивающую размещение файлов с надежностью Р=0,95.Воспользовавшись соотношением (3.26), рассчитаем доверительный интервал:55 − 1,961149< M х < 55 + 1,961149,51,9≤ Mx≤ 58,1.Длина записи R = 55 + 1,96 *11 ≈ 77 кбайт.Необходимый объем выборки для δ = 2 составит211⎞⎛n = ⎜1,96 ⎟ ≈ 116.2⎠⎝На практике, как правило, число измерений (например, отбора проб шихты, чугуна, стали и других материалов) конечно и не превышает 10…30.