Н.Н. Калиткин - Численные методы (1133437), страница 103
Текст из файла (страница 103)
Для выявления систематических ошибок всех видов обычно заранее отлаживают аппаратуру на эталонных объектах с хорошо известными свойствами. Сл учай ные ошибки вызываются большим числом факторов, которые при повторении одного и того же эксперимента могут действовать по-разному, причем учесть их влияние практически невозможно. Например, прп измерении длины предмета линейка может быть неточно приложена, взгляд наблюдателя может падать не перпендикулярно шкале и т. д. Прн многократном повторении эксперимента результат вследствие случайной ошибки будет, различным. Однако такое повторение и соответствующая статистическая обработка позволяют, во-первых, определить величину случайной ошибки и, во-вторых, уменьшить ее. Повторяя измерение достаточное число раз, можно уменьшить случайную ошибку до требуемой величины (целесообразно уменьшать ее до величины 50 — 100О4 от систематической ошибки).
Гр убые ошибки — это результат невнимательности наблюдателя, который может записать одну цифру вместо другой. При 482 СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЭКСПЕРИМЕНТА ггл. Кч есть также случайная величина, причем Мт)„= М1, От!„= -„- 0$„ (1) а закон распределения величины Ч„со!реми!ноя к нормальному (еауссову) при и — ь со. Поэтому среднеарифметическое нескольких независимых измерений х= — ~ х; — М$ ! и !' =- 1 (2) является приближенным значением измеряемой величины, причем с тем большей надежностью, чем больше число измерений и. Однако равенство х М$ не является точным, и нельзя даже строго указать предел его ошибки; в принципе х может сколь угодно сильно отличаться от Мс, хотя вероятность такого собы- единичном измерении грубую ошибку не всегда можно опознать.
Ио если измерение повторено несколько раз, то при статистической обработке выясняют вероятные пределы случайной ошибки. Измерение, существенно выходящее за полученньге пределы, считается грубо ошибочным и не учитывается прн окончательной обработке результатов. Таким образом, если измерение повторено достаточно много раз, то можно практически исключить грубые и случайные ошибки, так что точность ответа будет определяться только систематической ошибкой.
Однако во многих приложениях это требуемое число раз оказывается неприемлемо большим, а при реально осуществимом числе повторений случайная ошибка может быть определяющей. 2. Величина и доверительный интервал. Пусть измерение проводят несколько раз, причем условия эксперимента поддерживают, насколько возможно, неизменными. Поскольку строго соблюдать неизменность условий невозможно, результаты отдельных измерений х; будут несколько различаться. Их можно рассматривать как значения случайной величины $, распределенной по некоторому закону, заранее нам неизвестному.
Очевидно, математическое ожидание М$ равно точному значению измеряемой величины х (строго говоря, точному значению плюс систематическая ошибка). Обработка измерений основана на центральной предельной теореме теории вероятностей: если Е еспгь случайная величина, распределенная по любому закону, то гл. хч) СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЭКСПЕРИМЕНТА 483 тия ничтожно мала. Ошибка приближенного равенства (2) носит вероятностный характер и описывается доверительным инпггрвалом т. е. границей, которую с доверительной вероятностью р, не превышает разность пе — М$ ~.
Символически это записывают следующим образом: р (~ х — М$( =Щ =р,. (3) Доверительный интервал зависит от закона распределения й (а тем самым — от постановки эксперимента), от числа измерений п, а также от выбранной доверительной вероятности р,. Из (3) видно, что чем ближе р, к единице, тем шире оказывается доверительный интервал. Доверительную вероятность р, выбирают, исходя из практических соображений, связанных с применениями полученных результатов. Например, если мы делаем игрушечный воздушный змей, то вероятность благополучного полета да=0,8 нас устроит, а если конструируем самолет, то даже вероятность р, = 0,999 недостаточна. Во многих физических измерениях р,=0,95 —:0,99 считается достаточной.
Замечание 1. Пусть требуется найти величину г, но измерять удобнее величину х, связанную с ней известным соотношением г=у(х); например, нас интересует джоулево тепло, а измерять легче ток. При этом следует помнить, что Мь = ~ ) (х) р (х) г(х чь 1(МЦ =1 (~ хо (х) г(х); так, среднее значение переменного тока равно нулю, а средний джоулев нагрев отличен от нуля. Поэтому, если мы вычислим сначала х, а затем положим 3=1(х), это будет грубая ошибка. Следует по каждому измерению х, вычислять г;=1(хг) и далее обрабатывать полученные значения г,. Шир ина доверительного интервала.
Если известна плотность распределения р„(у) величины т)„то доверительный интервал можно определить нз (3), разрешая уравнение мч -~- а р, = ~ р„(у) ду, МВ„= МВ, (4) мч — а относительно й. Выше отмечалось, что при и-ь оо распределение Ч„стремится к нормальному *): р„(у) = ехр) — -гн мчпр ~, о„=)г глг)„; (5) *) В самом худшем случае, когда $ есть равномерно распределенная случайная величина, распределение Ч„ близко к нормальному при и 30, а интеграл в (3) близок к интегралу от йормального распределения при существенно меньших и. 484 стлтистичвскля онплноткл экспкиимантл )гл.
хо здесь 0т)„— дисперсия распределения, а величину ол называют стандартным отклонением или просто сгиандарсиам "). Подставляя (5) в (4) и полагая р =!а„, т. е. измеряя доверительный интервал в долях стандарта, получим соотношение с ре — — )/ — ~ е "!таст. о (6) и Л и ! ът 0с=-- ун (хс — М1)а- — у„(х,— х)', У=- — 7 ха (7) л - и и а с =. ! Точность этого выражения невелика по двум причинам: во-первых, число членов суммы обычно мало; во-вторых, использование замены Мс-х вносит ошибку 0(1/и), значительную при малых и.. Более хорошее приближение дает так называемая неслсещенн я ос(енка дисперсии: 0$ — за =- — хта (х; — х)', л — ! с=! (8) *) для произвольного закона распределения т')ЗЧ называют среднеквад. ратичаым отклонением.
"") Однако при л= ! считать распределение р, (у) =р (х) нормальным и пользоваться форлсулой (6), вообще говоря, нельзя. Этот вопрос будет рассмотрен ниже, Интеграл ошибок, стоящий в правой части (6), табулирован, так что из этого соотношения можно определить доверительный интервал (()те). Зависимость г(ро) дается в таблице 23 строкой, соответствую!пей и = оо. Из таблицы 23 видно, что доверительный интервал 1) =За„ соответствует доверительной вероятности р, = 0,997, так что отклонение х от М$ более чем на За„маловероятно. Но отклонение более чем на а„ довольно вероятно, поскольку ширине р = а„ соответствует ро = 0,7.
Таким образом, если известна дисперсия 0$, то нетрудно определить стандарт а„=)с от! и, тем самым, абсолютную ширину доверительного интервала )). В этом случае даже при выполнении одного измерения можно оценить случайную ошибку **), а увеличение числа измерений позволяет уменьшать доверительный интервал, поскольку а„и — !сз . Критерий Стьюдента. Чаще всего дисперсия 0$ неизвестна, поэтому выполнить оценку ошибки указанным выше способом обычно не удается. При этом точность однократного измерения неизвестна.
Однако, если измерение повторено несколько раз, можно приближенно найти дисперсию: гл. К91 СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЗКСПЕРИМЕНТА 485 где величину 8 называют сгпандарпгоаг выборки. Далее будем пользоваться только оценкой (8). Оценка (8) также является приближенной, поэтому нельзя пользоваться формулой (6), заменяя в ней о„на 8!'Ргп. Надо вносить в нее поправку, тем большую, чем меньше и. Если распределение 91„считать нормальным при любых и, то связь доверительного интервала со стандартом выборки устанавливается критерием Стьюдента: 8 Р=((Р0 П)5 5 == (9) где коэффициенты а) Стьюдента ! (р„п) представлены в таблице 23.
Таблица 23 Коэффициеигы Стьюдеита ! (р„и) 0,5 0,7 0,8 0,9 0,95 0,98 0,99 0,995 0,998 0,999 11 14 18 22 1,1 1,3 1,8 2,1 1,1 1,3 1,7 2,1 11 13 17 20 1,0 1,3 1,7 2,0 10 13 16 20 0,7 0,7 0,7 0,7 0,7 0,7 10 !5 20 30 60 2,8 3,2 2,6 2,9 2,5 2,8 2,5 2,8 2,4 2,7 '-',3 2.6 Критерий Чебышева ~ 1.4 1,8 2 2 3 2 4,5 7,1 10 ! 4 22 32 Очевидно, при больших и с хорошей точностью выполняется он=за. Поэтому при гг-и со критерий Стьюдента переходит в формулу (6); выше отмечалось, что этой формуле соответствует строка п == ОО таблицы 23.
Однако при малых и доверительный интервал (8) оказывается много шире, чем по критерию (6). П р и м е р !. Выбрано ри = 0,99 н выполнено 3 измерения; по табтице 23 доверительный ингервал равен р =9,95гр' 3= 6,78. ") Их называют также кеанягаяяии Сшьюденша. 1,0 2,0 3,1 6,3 13 0,8 1,3 1,9 2,9 4,3 0,8 1,3 1,6 2.4 3,2 0,7 1,2 1,5 2,1 2,8 07 12 15 э0 26 07 1! 14 19 24 0,7 1,1 1,4 1,9 2,4 0,7 1,! 1,4 1,9 2,3 0,7 1,1 1,4 1,8 2,3 32 64 70 99 4,5 5,8 3,7 4,6 3,4 4,0 3,! 3,7 З,О 3,5 2,9 3,4 2,8 3,3 127 318 637 14 22 32 7,5 10 13 5,6 702 8,6 4,8 5,9 6,9 4,8 5,2 6,0 4,0 4,8 5,4 3,8 4,5 5,0 3,7 4,3 4,8 3,6 4,1 4,6 3 3 3 7 4 ! 3,2 3,5 3,8 3,0 3,4 3,7 2,9 3,2 3,5 2,8 3,1 3,3 СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЗКСПЕРИМЕИТА )гл, ху К сожалеаию, не все физики и инженеры знакомы с понятием довери. тельного интервала и критерием Стьюдента. Нередко встречаются экспериментальные работы, в ноторык при малом числе измерений пользуются критерием (6) или даже считают, что значение з„является погрешностью величины В, и вдобавок опеаивают дисперсию по формуле (7).
Для приведеаного выше примера при первой ошибке был бы дан ответ ()=1,йз, при второй — р=о,бз, а при третьей — ))=0,7з, что сильно отличается от правильного значения. Замечание 2. Зачастую одна н та же величина х измерена в разных лабораториях на разном оборудовании. Тогда следует найти среднее и стандарт по формулам (2) и (8), где суммирование проводится по всем измерениям во всех лабораториях, и определить доверительный интервал по критерию Стьюдента. Нередко при этом суммарный стандарт а оказывается больше, чем стандарты зг, опРеделенные по Данным отдельных лабораторий. Это естественно.