Теория вероятностей и математичкеская статистика (1118815), страница 8
Текст из файла (страница 8)
1. Найдём объём выборки: n = 25. Составим таблицуХ12345678910nx12313533226789102. Статистическое распределение имеет видХWКонтроль:123451/25 2/25 3/25 1/25 3/25 5/25 3/25 3/25 2/25 2/251231353322 1.25 25 25 25 25 25 25 25 25 25Последнюю таблицу можно переписать в видеХW123450,04 0,08 0,12 0,04 0,125560,2789100,12 0,12 0,08 0,083. Возьмём на плоскости xOw точки (1; 0,04), (2; 0,08), (3; 0,12) и т.д.
Последовательно соединив эти точки прямолинейными отрезками, получим полигонраспределения случайной величины Х.W0,240,20,160,120,080,04X00123456789 10Пример. В результате испытания случайная величина Х приняла следующиезначения х1 = 16, х2 = 17, х3 = 9, х4 = 13, х5 = 21, х6 = 11, х7 = 7, х8 = 7, х9 = 19,х10 = 5, х11 = 17, х12 = 5, х13 = 20, х14 = 18, х15 = 11, х16 = 4, х17 = 6, х18 = 22,х19 = 21, х20 = 15, х21 = 15, х22 = 23, х23 = 19, х24 = 25, х25 = 1.Требуется: составить таблицу статистического распределения, разбив промежуток (0, 25) на пять участков, имеющих одинаковые длины; построитьгистограмму одинаковых частот.Решение.
Предварительно составим таблицуХ0–55 – 1010 – 1515 – 2020 – 25nx35485Статистическое распределение имеет видХ0–55 – 1010 – 1515 – 2020 – 25W0,120,20,160,320,2Гистограмма относительных частот изображена на рисунке560,36 Y0,320,280,240,20,160,120,080,040X§31. Точечные оценки параметров генеральной совокупностиТочечной называют оценку, которая определяется одним числом.Оценка параметра называется несмещённой, если её математическоеnожидание равно оцениваемому параметру, т.е. M ( n ) . В противном случае оценка называется смещённой.Оценка параметра называется состоятельной, если она удовлетворяетnзакону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:lim P ( ) 1.n nВ случае использования состоятельных оценок оправдывается увеличениеобъёма выборки, так как при этом становятся маловероятными значительныеошибки при оценивании.
Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельна, то практически достоверно,что при достаточно большом n .nНесмещённая оценка n параметра называется эффективной, если онаимеет наименьшую дисперсию среди всех возможных несмещённых оценокпараметра , вычисленных по выборкам одного и того же объёма n.Параметры генеральной совокупности xГ – генеральная средняя и DГ – генеральная дисперсия оцениваются по соответствующим параметрам выборки:57x Г xВ , DГ DB (n 30), Г DГ .DГ S 2 (n 30),Пример.хi245689n 8 9 10 3 30 – объём выборки.103nik xi nixB DB i 1n2 8 4 9 5 10 6 3 120 4.3030 ( xi xB )2 nin(2 4)2 8 (4 4) 2 9 (5 4) 2 10 (6 4) 2 3 1,830илиDB xB2 xB2 .xB2 xi2 nin22 8 42 9 52 10 6 2 3 17,8;30DB 17,8 42 1,8; B DB 1,8 1, 3;S2 n30DB 1,8 1,86.n 129Таким образом, точечные оценки характеристик генеральной совокупности:x Г 4; DГ DB 1,8; Г 1, 3.Для интервального распределения сначала находят середины интервалов xi.Пример.х2–55–8ni910Переходим к дискретному распределению588 – 1111 – 14256хi3,56,59,512,5ni910256Дальнейшие вычисления проводим, как в предыдущем примере.
Получаем:xB 3,91; xB2 74,53; DB 59, 24; S 2 60, 45.Таким образом: x Г 3,91; DГ S 2 60, 45; Г DГ 7, 77.§32. Интервальная оценка (доверительный интервал)для генеральной среднейИнтервальной называют оценку, которая определяется двумя числами –концами интервала.Доверительным интервалом для параметра называется интервал (1, 2),содержащий истинное значение с заданной вероятностью γ = 1 – , т.е.P(1 < < 2) = 1 – .Число γ = 1 – называется доверительной вероятностью (надежностью), азначение – уровнем значимости.Интервальной оценкой (с надежностью γ) математического ожидания aнормально распределенного количественного признака X по выборочнойсредней x при известном среднем квадратическом отклонении служитдоверительный интервалxtnaxtn,где n – объем выборки; t – значение аргумента функции Лапласа (t) (см.приложение, табл.
2), при котором (t) =.2xГ – генеральная средняя (оцениваемый параметр);xB – средняя выборочная, точечная оценка генеральной средней;δ – точность оценки.γ – надёжность оценки.( xB ; xB ) – доверительный интервал для xГ a.xГ ( xB ; xB ) с вероятностью (надёжностью) γ.59Для нормального распределения признака tn,где Г ; n – объём выборки; t – находят из соотношения 2Ф(t ) с помощью табл.
2 (см. приложение). Таким образом, для нормально распределённой величины Х:t P xГ xB 2 Ф(t ) .nЧем больше n, тем меньше δ, то есть точность оценки увеличивается приувеличении объёма выборки.Чем выше γ – надёжность оценки, тем меньше её точность (δ увеличивается).Если σ неизвестно, то t Sn, где S 2 nDВ – исправленная выбоn 1рочная дисперсия, t находится из табл.
4 (приложение) по заданным значениям γ и n.Интервальной оценкой (с надежностью γ) среднего квадратического отклонения нормально распределенного качественного признака X по «исправленному» выборочному среднему квадратическому отклонению S служитдоверительный интервалS (1 – q) < < S (1 + q), при q < 1;0 < < S (1 + q), при q > 1,где S nD * – «исправленное» выборочное среднее квадратическое отn 1клонение; q находят по табл. 5 приложения по заданным n и γ.Пример. Найти доверительный интервал для оценки неизвестного математического ожидания «а» нормально распределённого признака, если известны: 2; xB 5, 4; n 10; 0, 95.Решение.
2Ф(t ) 0, 95 Ф(t ) Из таблицы t 1, 960, t n0,95 0, 475.21,96 21060 1, 24.Доверительный интервал ( xB ; xB ) (5, 4 1, 24; 5, 4 1, 24) (4,16; 6, 64).Пример. Найти минимальный объём выборки, при котором с надёжностью0,95 точность оценки математического ожидания нормально распределённогопризнака по выборочной средней будет равна 0,2, если среднее квадратическое отклонение равно 2.Решение. Дано: 0, 95; 0, 2; 0, 2; найти n.Из формулы t nнаходим n 1,96 2 2 2t 1, 96. Тогда n 0, 2 2t 2 22. Из условия 2Ф(t ) 0,95 находим 384,16 385.Пример. По заданным значениям характеристик нормально распределённогопризнака найти доверительный интервал для оценки неизвестного математического ожидания: 0, 95; n 12; S 1, 5; xB 16,8.Решение.
t 2, 20 1,512Sn. Из табл. 4 по данным γ и n находим t 2, 20. Тогда 0,95.Доверительный интервал (16,8 0,95; 16,8 0,95) (15,85; 17, 75).§33. Понятие о критериях согласияСтатистической называется гипотеза о неизвестном законе распределения случайной величины или о параметрах закона распределения, видкоторого известен.Нулевой (основной) гипотезой называется выдвинутая гипотеза Н0.Конкурирующей (альтернативной) гипотезой называется гипотезаН1, которая противоречит нулевой гипотезе Н0.Пусть имеется статистическое распределение выборки для случайнойвеличины Х:kхiх1х2х3…хkni nnin1n2n3…nki 161По виду полигона или гистограммы, сравнивая их с графиками дифференциальных функций распределения, делаем предположение о виде закона распределения случайной величины.Сделанное предположение (гипотеза) подтверждается расчётами критериясогласия.
Имеются различные критерии согласия: Хинчина, Колмогорова,Пирсона. Например, критерий Пирсона (хи-квадрат)(ni ni )2nii 1k2 позволяет сравнивать близость частот ni – данного статистического распределения с теоретическими частотами ni , найденными с помощью функциираспределения предполагаемого закона: x xi 1 ni npi nP ( xi X xi 1 ) n[ F ( xi 1 ) F ( xi )] nf i ( xi 1 xi ),2i 0, 1, 2, , k 1, где f ( x ) – дифференциальная, F ( x) – интегральнаяфункции предполагаемого распределения.Если вычисленное значение критерия 2 не превосходит некоторого критического значения 2кр , взятого по таблице, то выдвинутая гипотеза принимается с заданным уровнем надёжности (вероятности) 1 . В противномслучае гипотеза отвергается.В табл.
6 приложения:α – уровень значимости, это вероятность отвергнуть гипотезу;s – число степеней свободы, s k 1 r , гдеr – число параметров предполагаемого распределения:r 2 для нормального распределения (а и σ),r 1 для показательного распределения (λ).При проверке гипотезы Н0 возможны следующие ошибки:ошибка первого рода – отвергнуть гипотезу Н0 при её правильности;ошибка второго рода – принятие гипотезы Н0 при правильности альтернативной гипотезы Н1.62§34. Виды зависимостей между случайными величинами Х и YX, Y – количественные признаки, связанные между собой.xi, yi – их возможные значения.Функциональная зависимость – каждому значению признака Х соответствует единственное значение признака Y: x y f ( x).Статистическая зависимость – каждому значению признака Х соответствуетстатистическое распределение признака Y:x yi | y1 y2 yk.ni | n1 n2 nkКорреляционная зависимость – каждому значению признака Х соответствует среднее значение признака Y (условная средняя y x ):x y x f ( x).Аналогично: y x y ( x ).x y x f ( x ) – уравнение регрессии у по х.y x y ( x) – уравнение регрессии х по у.Примеры.