Гмурман - Теория вероятностей и математическая статистика (969547), страница 43
Текст из файла (страница 43)
Найдем шаг: й=10,4 — !0,2=0,2. Вычислим искомые выборочные среднюю и дксперсию: ля= Мтд+С = 0,57 О 2+ 11,0= 11,1", Вв=(Мз — (М1) 18е=(3 83 — (0,57)').0,2е=О,!4. ф 6. Сведение первоначальных вариант к равиоотстоящнм Выше иэложена методика расчета выборочных характеристик для равноотстоящих вариант. На практике, как правило, данные наблюдений не являются рав- 16» 243 ноотстоящими числами. Естественно, возникает вопрос: нельзя ли соответствующей обработкой наблюдаемых значений признака свести вычисления к случаю равноотстоящих вариант? Оказывается, можно.
С втой целью интервал, в котором заключены все наблюдаемые значения признака (первоначальные варианты), делят на несколько равных частичных интервалов. (Практически в каждь1й частичный интервал должно попасть не менее 8 — !О первоначальных вариант.) Затем находят середины частичных интервалов, которые и образуют последовательность равноотстоящих вариант. В качестве частоты каждой «новой» варианты (середины частичного интервала) принимают общее число первоначальных вариант, попавших в соответствующий частичный интервал. Ясно, что замена первоначальных вариант серединами частичных интервалов сопровождается ошибками (первоначальные варианты левой половины частичного интервала будут увеличены, а варианты правой половины уменьшены), однако эти ошибки будут в основном погашаться, поскольку они имеют разные знаки.
Пример. Выборочная совокупность объема и= 100 »адана табл. 3. Составить распределение равноотстоящих вариант. Р е ш е н и е. Разобьем интервал 1,00 — 1,50, например, на след1пощне 5 частичных интервалов. 1,00 — 1,10; 1,10 — 1,20; 1,Ю вЂ” 1,30; 1,30 — 1,40; 1,40 — 1,50. Таблица 8 Припав середины частичных нитервалоа в качестве новых вариант уь получим равноотстоящие варианты: уд — — 1,05; у»=1,15; уа — — 1,25; у«! 351 уь' ! 45 Найдем частоту варианты уз лт =! + 3+ 8+ 4+ 2+ 4/2 = 18 (Поскольку первоначальная варианта 1,10 одновременно является концом первого частичного интервала и началом второго, частота 4 этой варианты поровну распределена между обонии частичными китервалаин ) Найдем частоту варианты уз лз = 4/2+ 3+ 8+ 5+ 2+ 4/2 = 20. Аналогично вычислни частоты остальных вариант: па=25; па=221 па=15.
В итоге получки следующее распределение равноотстоящих вариант: Гн 1,05 1,15 1,25 1,35 1,45 и! 18 20 25 22 15 Рекомендуем читателю убедиться, что выборочные средние и дисперсии, вычисленные па первоначальным и равноотстояшик вариантаи, окажутся соответственно равными. лв=1 250 ив=! 216" Рх 0*018' Ри=О О!7 Как видим, замена первоначальных вариант равноотстоящиыи не привела к существенным ошкбкам; при втоы объем вычислительной работы значительно уменьшается. й 6. Эмпирические и выравнивающие (теоретические) частоты А.
Дискретное распределение. Рассмотрим дискретную случайную величину Х, закон распределения которой неизвестен. Пусть 1троизведено л испытаний, в которых величина Х приняла и, раз значение х, и, раз значение х„ ..., и, раз значейие х„ причем ~~~~и, = и. Эмпирическими частотами называют фактически наблюдаемые частоты и,. Пусть имеются основания предположить, что изучаемая величина Х распределена по некоторому определенному закону.
Чтобы ироверить, согласуется ли это пред.- положение с данными наблюдений, вычисляют частоты наблюдаемых значений, т.е. находят теоретически частоту и,' каждого из наблюдаемых значений в предположении, что величина Х распределена по предполагаемому закону. Выравнивающими (теоретическими) в отличие от фактически наблюдаемых эмпирических частот называют частоты и;, найденные теоретически (вычислением).
Вы- равннвающне частоты находят с помощью равенства л! = пР„ где и — чнсло испытаний; Р,— вероятность наблюдаемого значения хп вычисленная прн допущении, что Х имеет предполагаемое распределение. Итак, выравниваюи(ая частота наблюдаемого значения х! дискретного распределения равна произведению числа испытаний на вероятность много наблюдаемого значения. Прнмер. В результате эксперимента, состоящего яз л 520 испытаний, в каждом нз которых регнсгряровалось число л! появлений некоторого событня, получеыо следувяцее эмпирическое распределение: ыабл. значення ..
х! 0 1 2 3 4 5 6 7 эмп. частота . . я! 120 167 !30 69 27 5 1 1 Найтн выравнивающие частоты п' в предположенян, по случайная велнчнна Х (генеральная совокупность) распределена по закону Пуассона. Решение. Известно, чго параметр з, которым определяется распределенне Пуассона, равен математическому ожиданию этого распределеыыя. Поскольку в качестве оценки математяческого ожндания прнннмают выборочную среднюю (см.
гл. ХЧ1, 5 5), то и в качестве оценки з можно прннять выборочную среднюю х . Легко найти по условию, чго выборочная средыяя равна 1,5, сзедовательыо, можно прннять а=1,5. Таким образом, формула Пуассона Рз (В) (ХаЕ Мй) прнннмзет внд Рз (й) (1,5з.е-з з)/й! Пользуясь этой формулой, найдем вероятности Рю,(й) прн Й=О, 1, 2, 3, 4, 5, 6, 7 (для простоты эапнся нндекс 520 далее опущен): Р (0) = 0,22313, Р (1) 0.33469, Р (2) = 0,251021, Р (3) = 0,12551 1, Р (4) = 0.047066, Р (5) 0,014120, Р (6) 0.003530, Р (7) = 0,000755.
Найдем выравннвающйе частоты (результаты умножения округлекы до еднннцы): яз=пР(0)=520 0,22313 116, лз пР (1) 520. 0,33469 ! 74. Анзлогячно находят я остальные выравннвакицне частоты. В итоге получим: змп. частота .. 123 167 130 69 27 5 1 1 выр. частота .. 116 174 131 65 25 7 2 0 Сравннтельно неболыпое расхожденяе эмпнрнческкх я выравнивающих частот подтверждает предположение. что рассматрнваемое распределение подчиыено закону Пуассона. Заметны, что если подсчитать выборочную дысперсыю по данному распределеиюо, то окажется, что она равна выборочной средней, т.
е, 1,5. Это служит еще одйнм подтверждеянем сделанного предположення, поскольку для распределеыня Пуассона к= М (Х) =с) (Х). Сравнения вмпирнческкх н теоретнческнк частот «на глав», ко. печно, недостаточно. Чтобы сделать ато более обоснованно, надо испольэовать, например, критерий Пирсона (см. гл. Х1Х, й 23), Проверка гипотезы о распределении случайной величины по закону Пуассона изложена в книге: Гну р м а н В. Е. Руководство к решению аадач по теории вероятностей и математической статистике. М., «Высшая школа», 1972 (см. гл. ХП1, $171.
Б. Непрерывное распределение. В случае непрерывного распределения, вероятности отдельных возможных значений равны нулю (см. гл, Х, $ 2, следствие 2). Позтому весь интервал возможных значений делят на А непересекающихся интервалов и вычисляют вероятности Р; попадания Х в (-й частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на зти вероятности. Итак, выравнивающие частоты непрерыв» ного распределения находят по равенству лг =пР„ где и — число испытаний; Р,— вероятность попадания Х в 1-й частичный интервал, вычисленная прн допущении, что Х имеет предполагаемое распределение. В частности, если имеются основания предположить, что случайная величина Х (генеральная совокупность) распределена н о р м а л ь н о, то выравнивающие частоты могут быть найдены по формуле лл пг = — <р (ис)» о, (н) гр (и) = — е- «ч«.
1 г' 2п. Пример иа применение формулы (е) приведен в $ 7. П о я с н е н и е. Поясним происхождение формулы (е). Напишем плотность общего нормального распределения; 7'(Х) = — Е-< - «1'Д«о'1. о $'2л где и — число испытаний (объем выборки), Ь вЂ” длина частичного интервала, о, — выборочное среднее квадрати- ЧЕСКОЕ ОТКЛОНЕНИЕ, и1= (Хг — Ха)~О, (Хг — СЕрЕдИНа 1-ГО частичного интервала), При а=О и о=1 получим плотность нормированного распределения: «р(х)==е- ч* 1 или, изменив обозначение аргумента, «р(и) ==е-»па 1 У2я Положив и=(х — а)/о, имеем ф (и) Е- «»-а«П«мн« ! У 2«« Сравнивая (»») н (»»»), заключаем, что 1(х) = — ф (и). Если математическое ожидание а и среднее квадратическое отклонение о неизвестны„то в качестве оценок этих параметров принимают соответственно выборочную среднюю х, и выборочное среднее квадратическое отклонение а, (см.
гл. ХЧ1, 2 5,9). Тогда 1(х) = — «р (и), где и=(х — х,)/о,. Пусть х« — середина «-го интервала (на которые разбита совокупность всех наблюдаемых значений нормально распределенной случайной величины Х) длиной Ь. Тогда вероятность попадания Х в этот интервал приближенно равна произведению длины интервала на значение плотности распределения 1(х) в любой точке интервала и, в частности, при х=х, (см. гл. Х1, 2 5): 1 Р«=««1(х«) =)«а Ф(и«). Следовательно, выравнивакхцая частота ««1« и« = и Р« — ф (и«). аа где и«=(х; — х»)(а,. Мы получили формулу (»). 248 й 7. Построение нормальной кривой по опытным данным Один из способов построения нормальной кривой по данным наблюдений состоит в следующем: 1) находят х, и ою например, по методу произведений; 2) находят ординаты у; (выравнивающие частоты) теоретической кривой по формуле у, = — ° ф (и1), где и— лв пв сумма наблюдаемых частот, й — разность между двумя СОСЕДНИМИ ВаРИактаМИ: и1=(Х,— Хв)/О, И ф(и) = (1/у'2п) е-в Чз.
3) строят точки (хо у~) в прямоугольной системе координат и соединяют их плавной кривой, Близость выравнивающих частот к наблюдаемым подтверждает правильность допущения о том, что обследуемый признак распределен нормально. Пример. Построить нормальную кривую по данному распределению: варианты... к1 15 20 25 30 35 40 45 50 55 частоты ...
л1 б 13 38 74 105 85 30 Ю 4 Решение. Пользуясь методом произведений (см. 4 4), найдем а,= 34,7, ов — — 7,38. Вычислим выравнивающие частоты (табл. 9). Таблица 9 На рис. 22 построены нормальная (теоретическая) кривая по выравнивающим частотам (они отмечены кружками) и полигон наблюдаемых частот (они отмечены крестиками).
Сравнение У2 графиков наглядно показывает, что построен- ~60 ная теоретическая кривая удовлетворительно отражает данные наблюдений. Для того чтобы бо- »0 лее уверенно считать, что данные наблюдений свидетельствуют о нормальном распределении ~0 20 20 00 00 00 ~1 признака, пользуются Ряс. эз специальными правилами (их называют критериями согласия), понятие о которых можно найти далее (см. гл, Х1Х, $ 23). 20 й В. Оценка отклонения эмпирического распределения от нормального. Асимметрия и эксцесс Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, к числу которых относятся асимметрия и эксцесс. Смысл этих характеристик аналогичен смыслу асимметрии н эксцесса теоретического распределения (см. гл. Х11, 39).