В.Г. Дубровский - Механика и термодинамика - Лабораторный практикум по физике (1264486), страница 2
Текст из файла (страница 2)
Поэтому величину b можноуменьшать, всѐ равно точки в каждый интервал попадут. Огибающаятакой преобразованной гистограммы при Nи b 0 (обозначимb dx 0 ) перейдет в плавную кривую p x :NmlimNbNbp xp x dxdx.0Отсюда видно, что относительная частота или эмпирическая вероятность Pm Nm N переходит в p( x)dx – вероятность попадания результата в интервал x, x dx . Графически это площадь бесконечноузкого прямоугольника со сторонами p ( x) и dx (заштрихован нарис. 3). Термин «площадь» в теории функций понимается шире, чем вгеометрии: стороны прямоугольника не обязательно измеряются вметрах.
Так, в нашем случае величина x , а также dx , и b измеряют1 x , поэтому площадь p x dxся в секундах, а размерность p xбезразмерна.Вероятность P( x1, x2 ) попадания результата в конечный интервал[ x1, x2 ] находят интегрированием плотности распределения:x2p( x)dx .P x1 , x2x1Она численно равна площади под кривой p ( x) на соответствующеминтервале [ x1, x2 ] . Полная площадь под кривой p ( x) равна единицекак вероятность достоверного события: в какой-то из интервалов результат измерения обязательно попадѐт.В реальных физических экспериментах результат измерений частоопределяется суммой не зависящих друг от друга факторов, каждый изкоторых вносит в сумму незначительный вклад.
В пределе сумма бесконечно большого числа бесконечно малых слагаемых принимает зна9чения, распределѐнные по так называемому нормальному закону (распределению Гаусса):p x12(xe2)22.(2)Это замечательное распределение обладает следующими свойствами (рис. 3):1) существует наиболее вероятное значение x – мода распределения:x ppmax;2) отклонения x от в обе стороны встречаются одинаково часто:гауссово распределение симметрично относительно , поэтому среднее значение x равно ;3) чем больше отклонение x от , тем реже оно встречается;4) мерой случайной погрешности, т. е.
мерой отклонения x от центра распределения , является «сигма»– стандартное или среднеквадратичное отклонение (СКО), которое примерно равно полуширине на полувысоте (ПШПВ) гауссова распределения: ПШПВ 1,18 .(Англоязычный аналог этого термина – HWHH – half width on halfheight);p(x)dxpmax0,5pmaxxПШПВРис. 310p(x)31>2>p(x)3Площадь = 0,6821xxРис. 4Рис. 50 всѐ распределение «стягивается» к одному значению5) при(рис. 4), которое в отсутствие систематической погрешности иxпринимается за истинное значение xист . Следовательно, с точки зрения математической статистики целью измерений является определение координаты центра распределенияxист ;6) в интервалвокруг попадает примерно 68 % всех результатов измерений (рис.
5), т. е. расстояние между неизвестным центромраспределенияи любым результатом измерений xk (k 1...N ) непревышает с вероятностью P 0,68:xk,P0,68 .(3)В интервал 2 вокруг центра попадает примерно 95 % всех результатов измерений, а в интервале 3 (его также называют шестисигмовым интервалом) заключено 99,73 % всех результатов.Анализ гистограммы. На рис. 6 показана последовательность получения общего результата измерений. Этапы «Построение гистограммы» и «Расчѐт среднего и СКО» независимы, могут выполнятьсяпараллельно. Их результаты используются при проверке нормальностираспределения.Возможно удаление грубых погрешностей из выборки с повторением первых этапов.11Построение гистограммыРасчѐт среднего и СКОУдалениегрубых ошибокПроверканормальности распределенияОбщий результат измерений:доверительный интервал для xистРис.
6Расчѐт среднего и СКО. Расчѐтной оценкой центра функцииплотности вероятностиявляется выборочное среднее x (т. е. среднее арифметическое значение выборки):1NxNxi .Оценкой случайной погрешностиратичное отклонение s (СКО):s1(4)iявляется выборочное среднеквадNN 1ixix2.(5)1Многие из инженерных калькуляторов имеют режим статистическихвычислений STAT (другие обозначения – SD или ), существенно упрощающий вычисления по формулам (4), (5). Обозначения используемых функций в этом режиме: DATA («ДАННЫЕ») – ввод данных одного за другим; после введения всех данных достаточно нажать кнопку x – вывод на индикатор искомого среднего и кнопку (другие обозначения – n 1 , s или sn 1 ) – вывод на индикатор искомого СКО.Проверка нормальности распределения – важный этап статистического анализа данных.
Формулы (4), (5) применимы только к нормальному распределению. Если выборка не принадлежит нормальной12генеральной совокупности, то, вообще говоря, использовать (4), (5)некорректно.Мы проведѐм простейшую оценку нормальности распределения подвум критериям:форме гистограммы;отношению ПШПВ гистограммы к выборочной СКО.Форма гистограммы: если огибающая гистограммы симметрична иколоколообразна, пусть даже приближѐнно, как на рис. 2, – это один изпризнаков нормального распределения результатов измерений.Определим ПШПВ гистограммы (штриховые линии на рис.
2). Разделим пополам максимальную высоту гистограммы и обозначим наэтом уровне еѐ ширину. Половина этого отрезка и есть полуширина наполувысоте ПШПВ.Отношение ПШПВ/ : если отношение близко к единице, а именнолежит в пределах 0,7…1,5, это тоже признак нормального распределения.Если выполняются оба признака, то результаты измерений подчиняются нормальному закону. Как говорят, нормальное распределениене отвергается. Можно переходить к расчѐту общего результата измерений – доверительного интервала.Если один из признаков отсутствует – нормальное распределениесомнительно. Если не выполняются оба признака – нормальное распределение, как говорят, отвергается. Следует искать причину анормальности результатов.Например, если гистограмма имеет два максимума (рис. 7), то наиболеевероятная причина – однократное постоянное по величине изменение условий измерения, например, сдвинулиограничитель для шара («один разуронили микроскоп и продолжилиизмерения, не проверив его настройку»).
В подобной ситуации, вообщеРис. 7говоря, следует повторить серию измерений.Наши критерии просты, но приближѐнны. Математически болеесложный, но и более достоверный анализ (например, по критерию 2 –«хи-квадрат») в случаях, признанных нами сомнительными, может какподтвердить нормальность, так и отвергнуть [4, 5].13Грубая погрешность. Иногда на гистограмме есть крайний изолированный прямоугольник, содержащий всего одно значение, обязательно минимальное или максимальное (рис.
8).N1 = 1N7 = 1minабmaxРис. 8Возможно, аномально отклоняющееся значение является грубойошибкой. Проверить это можно с помощью правила трѐх сигм. Посвойствам нормального распределения в шестисигмовый интервал попадает 99,73 % всех нормально распределѐнных результатов. На долюотклонений от центра распределения, превышающих 3 , приходитсявсего 0,27 % 1 300 от общего числа измерений. Поэтому достоверные сильно отклоняющиеся значения могут появиться приN 300…1000, а при N = 50 они крайне маловероятны.
Зато великавероятность ошибочной записи одного из 50 многозначных чисел илисбоя микросекундомера.На горизонтальной оси гистограммыотмечаем среднее значениеиПШПВоткладываемотнегоинтервал3 ПШПВ3 ПШПВ (рис. 9). Если аномальноезначение отклоняется от больше чемна 3 ПШПВ, как на рис. 9, его следуетсчитать грубой ошибкой, удалить извыборки в табл. 1 (зачеркнуть, а незамазать!) и, найдя новое крайнеезначение, повторить построениегистограммы. Такая операция называется цензурированием выборки и можетmaxвыполняться в цикле несколько раз,Рис. 9пока не останутся значения, лежащие впределах 3 ПШПВ.143. Общий результат измерений –доверительный интервалРасчѐт общего результата измерений зависит от вида измерений,которые подразделяют на прямые и косвенные, однократные и многократные (табл.
3).Таблица 3ИзмеренияпрямыеоднократныекосвенныемногократныеПрямое измерение — это измерение, при котором искомое значениевеличины находят непосредственно из опытных данных, как, например, при измерении массы на циферблатных весах, температуры термометром, электрического напряжения стрелочным или цифровымвольтметром. С помощью цифрового микросекундомера в данной работе осуществляется прямое измерение интервала времени.Прямое однократное измерение.
Сведения, изложенные вэтом разделе, необходимы для записи результатов всех последующих лабораторных работ.Возможна оценка истинного значения xист по результату однократного измерения x1 , если предварительно на данной измерительнойустановке в одинаковых условиях проведены многократные измерения( N 30), в результате чего СКО определено с высокой точностью.Используем шестое свойство нормального распределения (см.рис.
5): чем шире интервал вокруг центра распределения , тем больше результатов измерений в этом интервале. Формулу (3) можно обратить относительно неизвестного центра : с вероятностью P 0,68центр распределения удалѐн от любого единичного результата измерений x1 на расстояние, не превышающее . Это условие записывают ввиде доверительного интервала для истинного значения измеряемойвеличины:!xистАналогично можно записать доверительные интервалыxист(6); P 0,68.x1x1 2 , P 0,95;152и 3 :(7)xист(8)x1 3 , P 0,9973.Все три варианта доверительного интервала показаны на рис.
10, причѐм отрезкии кратные ему изображены в масштабе числовой осиизмеряемой величины x.P = 0,9937P = 0,95P = 0,68xx1Рис. 10Вероятность P, с какой истинное значение измеряемой величиныможет находиться в выбранном доверительном интервале, называетсядоверительной вероятностью. Запись доверительного интервала безуказания доверительной вероятности неполна.Доверительные интервалы (6)–(8) можно объединить в общуюформулу с коэффициентом t ( P) при :xистx1 t (P) ,P 0,68, tP 0,95, tP 0,9973, tP1,2,3(9)Чем больше доверительная вероятность, тем шире должен быть доверительный интервал вокруг измеренного значения, тем больше коэффициент t ( P) .