Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения (2-е изд., 2000) (1186207), страница 66
Текст из файла (страница 66)
в. Х, рассмотренной в предыдущем п. (табл. 11.2 1, 11.2.2, 11.2.3). Выберем границы разрядов «круглымн»: (70 —: 80); (80 —: 90); (90 —: 100); (100 —: 110); (110 —: —: 120); (120 е» 130) . Подсчитывая количество значений с.в., попавших в каждый разрлд (считая половинки от попавших в границу между разрядами) и деля на число опытов и = 100, получим группированпый статистический ряд: 80 —:90 90 —: 100 70лт80 Разряды 0,34 0,14 0,02 Частоты 110 —:120 120 —: 130 100лт 110 Разряды 0,15 0,06 Частоты (11.3.1) 80лт90 ~ 90лт100 Разряды 70лт80 0,034 0,014 0,002 Плотность частоты 110лт120 120«3 130 100 —: 110 Разряды 0,006 0,029 0,015 Плотность частоты Деля каждую частоту р, на длину соответствующего разряда Л,=хьм — х,= 10, получим таблицу плотностей частоты 11,3, ГРуппиРОВАнный стАтистический Ряд 439 Откладывая по оси абсцисс разряды и строя па каясдом разряде как па основании прямоугольник площади р;, получим еистозромжу — статистический аналог кривой распределения (рис.
11.3.1)*). г Сх) п,о а, и, пр тп ап аа гао ггп гга ыо х Рис. 11.33 Имея в своем распоряясеиии группироваппый статистический ряд, мы можем приблиисенпо построить статистическую функцию распределения г'е(х). В качестве тех значений х, для которых «) вычисляется г" (х), есте- го стпенпо взять границы разрядов. Так, например, цля с. в. Х, рассмотренной в предыдущем пункте, пользуясь группировапным статистическим рядом (11.3 1), находим: ап аа 1гп Р«(70) = 0; )г«(80) = Ре (Х 80) = 0,031 Рис. 11.3.2 Г (00) Р (Х<0О)=0 18; Г (100) = Р«(Х ~ 100) =0 30' ыо х «) В рассмотренном вьппе примере число опытов было сравнительно веволико (и = 100) и, соответственно ему, мы веяли очень небольшое число разрядов (гс 6).
Вообще говори, для построевин (хоти бы ориентировочного) аакопа распределении непрерывной с. в. Х по опытоым данным и число опытов и, и число раарндов а долгины быть существенно больше. Ориептгсровочпо можно назвать число опытов и, необходимое длн того, чтобы с удовлетворительной точностью представить себе распределение интересующей пас с.
в. Х: опо должпо быть порядка нескольких сотен. Соответственно число а разрвдов, на которое делитсн интервал наблюдавшихся значений с. е., должон быть больше, чем в рассмотрсшюм пзмп примере; обычно его выбирагот порздна 12 20. 44о ГЛ 11 ЭЛЕМЕПТЫ МАТЕМАТИЧЕСКОЕ СТАТИСТИКИ Р'в(110) = Р* (Х < 110) = 0,79; Р* (120) = Р" (Х (120) = = 0,91; Рсв (130)=1. График статистической функции распределения показан на рпс.
11.3.2 (точки соединены отрезками прямых), 11.4. Выравнивание статистических распределений Во всяком статистическом распределении неизбежно присутствуют элементы с л у ч а й п о с т и, связанные с тем, что число опытов ограничено, что произведены именно те, а пе другие опыты, давшие именно те, а пе другие результаты. Только при очень большом число опытов зги случайности сглаживаются, и явление обпаруя1ивает в полной мере присущие ему закономерности. На практике мы почти никогда пе располагаем таким большим числом опытов (наблюдений) и вынуждены считаться с тем, что любому статистическому распределенн1о присущи в той или иной мере черты случайности.
Случаен ступенчатый вид статистической функции распределения непрерывной с. в.; случайна форма гистограммы, ограниченной тол1е ступенчатой линией. Неудобно пользоваться такими негладкими функциями при дальнейшем их преобразовании. 11озтому на практике часто приходится решать вопрос о том, как подобрать для данного статистического распределения а н а л и т и ч е с к у ю ф о р м у л у, выражающуго лишь существенные черты статистического материала, по пе случайности, связанные с недостаточным объемом опытных данных.
Такан задача называется задачей выравнивания статистических распределений. Обычно выравниванн1о подвергаются гистограммы. Задача сводится к тому, чтобы заменить гистограмму плавной криРис. 1 1.4.1 вой, имеющей достаточно простое аналитическое выра1кепие, и в дальнейшем пользоваться ею в качестве плотности распределения 1(х) (рнс.
11.4 1) . Как подобрать наилучшим образом плавную кривую, выравнивающую 'гистограмму? Вто задача в значительной мере неопределенная, как и либаи задача об акали. |!.!. вь|глвпизлпиг Рлспгкдкчгпни 441 тическом представлении эмпирических функций. Например, если несколько полученных в опыте точек на плоскости хОу расположены приблизительно по прямой (рис. 11.4.2), естественно возникает идея заменить зту зависимость линейной функцией. Ксли зависимость явно нелннейна (рис. 11.4.3), в качестве аппроксимирующей Рзс.
||.4.3 Рве. | 1.4.2 кривой выбирают параболу, и т. д. При сглаживании эмпирических зависимостей очень часто исходят нз «п р и н ц и п а п а п и е и ь |и и х к з а д р а т о в», считая, что наилучшим прпблпв|сппем в даппол| классе фупкци|! является то, для которого сумма квадратов отклонений обращается в минимум. Вопрос о том, в к а к о м н м е ни о классе функций следует искать наилучшее приближение, решается уже пе математически, а исходя нз соображений, связанных с физикой решаемой задачи, с учетом характера эмпирической кривой н степени точности наблюдений.
Иногда принципиальный вид функции, выражающей исследуемую аависнмость, известен заранее из теоретических сообран|еннй; из опыта же требуется получить лишь некоторые чнслепные паралетры, входящие в выраже- Рвс. 114.4 ние функции. Аналогично обстоит дело и с задачей выравнивания статистических распределений.
Принципиальный внд выравнивающей плавной кривой 1(х) выбирается заранее, исходя из условий возникновения с. в. Х, а иногда просто из сообра»пений, связанных с внешним видом гистограммы, Например, гистограмма, изображенная па рис. 11.4.1, явно наводит на мысль о нормальном распределении, а на рис. 11.4,4 — о показательном.
442 Гл. ы. злкмннты МАткмлтнчкскон статистики и подбирать, исходя из опытных данных, только параметры т и о в выражении (11.4.1). Если жо, непризер, с.в. Х есть расстояние мея<ду соседякмн событпямп потока, то в качестве выравнивающего закона моягпо взять показательный (см. п. 6.2) илн какой-нибудь из законов Эрлапга (см. п. 6.4). Прп этом необходимо иметь в виду, что любая аналитическая функция /(х), с помощью которой выравпявается гпстограмма, должна обладать осповпымп свойствами плотности: /(х) ) 0; ) /(х) Ых = 1.
00 (11 4.2) Что касается параметров, входящих в выражение функции /(х), то их подбирают так, чтобы наилучшим образом согласовать выравнивающее аналитическое распределение со статистическим. При этом пользуются различными методамп; чаще всего — и е т одом м ом е пт о в, состоящим в том, чтобы важнейшие моменты — м. о., дисперсия, иногда высшие моменты: п„п, у выравнпваемого и выравнивающего распределений совпадали «). Пример.
Угол ~р, определяющий высоту наблюдаемого объекта кад горизонтом, иамеряется с помощью специального прибора. Случайная величина Х вЂ” ошибка измерения угла ~. С целью исследования точности прибора произведено и = 500 измерений этой ошибки (в тысячных долях радиана). Результаты измерений сведены в группированный статистический ряд: «) Момеатами выше четвертого порядка пользоваться яерацяовальао, так как точпость вычпсленая мокептов резко падает С узелвчевием ах порядка, Условия возникновения случайной величины также долл'пы учитываться при выборе тяпа выравппзающей кривой. Если, как зто нередко бывает на практике, с.
з. Х складывается пз многих независимых илн слабо завпспмых слагаемых, сравнимых по порядку своего влияния на рассеивание суммы, естественно в качестве зыразппвающеп взять нормальную плотность: /(л) = (1/(аУ2н)) ехр ( — (х — и)'/(2а'-') ) (11А.1)' 1Ь«. ВЫРАВНИВАНИЕ РАСПРЕДЕЛЕНИИ 443 Разряды ( — )ар( — 3) ( — 3) «Р( — 2) ( — 2) —: ар( — '1) Х: Частоты р» 0,144 0,012 0,050 0,266 Частоты р 0,176 0,092 0,020 0,240 88 10 Ч поло попада- ппй в Ьй рааряд я 46 120 (11.4.3) *)'. Построить гистограмму распределения.
Выровнять статистическое распределение с помощью нормального закона: 1(Х) = [1/(аУ2П) ) ЕХр (- (Л вЂ” И) »7'(20») ), а) я=р«л, подобрав параметры и и о так, чтобы сохранить неизменными первые два момента статистического распределения: математическое ожидание и дисперсию. Р е ш е и и е. Для этого нуя«но знать статистическое среднее та и статистическую дисперсию Р» с.в. Х. Мы знаем (и. 10.1), что при большом числе опытов п среднее арифметическое наблюденных аначений с, в. сходится по вероятности к ее м.о., а среднее арифметическое их квадратов — ко второму начальному моменту аа (Х). В данном случае мы не располагаем всеми наблюденными п = 500 значениями с. в. Х, да если бы и располагали, вычисление моментов (без помощи ЭВМ) было бы слишком трудоемким.