Гмурман - Теория вероятностей и математическая статистика (969547), страница 34
Текст из файла (страница 34)
Пример. Задано распределение частот выборки обьема в=20: хг 2 6 12 и; 3 1О 7 Написать распределение относктельных частот. Ре ш е н не. Найдем относительные частоты, длв чего разделим частоты на объем выборки: йтт 3/20 0.15 йтз = 10/20 = 6.50 Нга = 7/20= 0.35. Напишем распределение относительных частот: кг 2 6 12 йгг 0,15 0,50 0„35 К о н т р о л гс 0„15+ 0,50+ 0,35 = 1. ф 7. Эмпирнчебкая Функция распределения Пусть известно статистическое распределение частот количественного признака Х.
Введем обозначения: и„— число наблюдений, прн которых наблюдалось значение признака, меньшее х; и — общее число наблюдений (объем выборки). Ясно, что относительная частота события Х < х равна п„1п. Если х изменяется, то, вообще говоря, изменяется и относительная частота, т. е. относительная 192 частота и„/и есть функция от х, Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической. Эмпирической функцией распределения (функцией распределения выборки) называют функцию Р'(х), определяющую для каждого значения х относительную частоту события Х < х. Итак, по определению, Р' (х) = и,/и, где и„— число вариант, меньших х; и — объем выборки. Таким образом, для того чтобы найти, например, Р'(х,), надо число вариант, меньших х„разделить на объем выборки: Р' (х,) = и„,/и.
В отличие от эмпирической функции распределения выборки функцию распределения Р (х) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция Р(х) определяет вероятность события Х < х, а эмпирическая функция Р'(х) определяет относительную частоту этого же события. Из теоремы Бернулли следует, что относительная частота события Х < х, т.
е. Р'(х) стремится по вероятности к вероятности Р(х) этого события, Другими словами, при больших и числа Р'(х) и Р (х) мало отличаются одно от другого в том смысле, что 1пп Р[~Р(х)— и Ф вЂ” Р'(х) ~ < е]= 1(е > О). Уже отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической (интегральной) функции распределения генеральной совокупности. Такое заключение подтверждается н тем, что Р'(х) обладает всеми свойствами Р(х). Действительно, из определения функции Р'(х) вытекают следующие ее свойства: 1) значения эмпирической функции принадлежат отрезку [О, Ц; 2) Р'(х) — неубывающая функция; 3) если х,— наименьшая варианта, то Р'(х)=0 при х<х,; если х„— наибольшая варианта, то Р'(х) =1 при х > х„. 13 — 2730 193 2 6 10 12 18 30 Ре ш е н не.
Найдем объем выборкн: 12 + 18 + 30 = 60. Нанменьшая варнанта равна 2, следовательно, Р'(х) =О прн х е 2. Значение Х < 6, а нменно хд — — 2, наблюдалось 12 раз, следовательно, р (х) =12(60=0,2 прк 2 < х~б. варианты х! частоты л; Рнс. 19 Значення Х < 1О, а нменно х =2 н ха ° 6, наблюдались 12+ + 18=30 раэ, следовательно, Рь (х) = 30160 = 0,5 и рн Б < х ч„-, 10.
Так как х 10 — нанбольшая варианта, то сь(х) 1 прн х > 10. Искомая вмпкрнческая функцня 0 Р" (х) = 0,5 1 прн хе,2, прн 2 < х~6, прн 6 < х а !О, прн х > 1О. на ркс. !9. График втой функцнн каображен $ В. Полигон н гистограмма Для наглядности строят различные графики статистического распределения и, в частности, полигон н гистограмму.
Полигоном частот называют ломаную, отрезки которой соединяют точки (х,; л,), (х,; ла), ..., (ха; аа). Для построения полигона частот на осн абсцисс откладывают варианты х1, а на оси ординат — соответствукццие им частоты а,. Точки (х,; л,) соединяют отрезками прямых и получают полигон частот. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (х,; Ф',), (х,; %',), ...
Итак, эмпирическая функция распределения вь.борки служит для оценки теоретической функции распределения генеральной совокупности. Прнмер. Постронть вмпнрнческую функепо по данному распределенню выборки: .. „(хз', Ж'з). Для построения полигона относительных частот на оси абсцисс откладывают варианты х;, а на оси ординат — соответствующие им относительнйе частоты Ф';. Точки (х;; В';) соединяют отрезками прямых и получают полигон огносительных частот. И~1 На рис.
20 изображен полигон относительных частот следующего распределения: Х 1,5 3,5 Ж 0 1 0 2 5,5 7,5 а ~ 2 э л з в 2 э 0,4 0,3 Ряс. 20 !95 В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной Ь и находят для каждого частичного интервала 2 н; — сумму частот вариайт, попавших в ю'-й интервал. з Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольни- 2 ков, основаниями кото- 1 рых служат частичные интервалы длиною Ь, а э з ~з и эз эз за эз лз высоты равны отношеРвс. 2! нню п,/Ь (плотность ча- стоты).
Лля построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии п,Я. Площадь 1-го частичного прямоугольника равна Ьп~(Ь=п,— сумме частот вариант 1-го интервала; следовательно, плон(рдь гистограммы частот равна сумме всех частот, т. е. объему выборки. На рис. 21 изображена гистограмма частот распределения объема а=100, приведенного в табл. б. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною Ь, а высоты равны отношению йр;/ут (плотность относительной частоты).
Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над таблица 6 ними проводят отрезки, параллельные оси абсцисс на расстоянии Яу,/71. Площадь 1-го частичного прямоугольника равна ут'йу,!71= %',— относительной частоте вариант, попавших в 1-й интервал. Следовательно, ллои4адь гистограммы относительных частот равна сумме всех относительных частот, т. е, единице. Задачи 1.
Построкть графкк эмпирической фуикцик распрелелеккя хг 5 7 !О 15 л! 2 3 8 7 2. Построять полигоны частот и отиосительиых частот распределеккя х! 1 3 5 7 9 л! 10 15 30 33 12 3. Построить гкстограммы частот к отиосктелькых частот распредеяеикя (в первом столбце укаэак часткчиый китервал, во втором-сумма частот вариант часткчиого иктервала) 2 — 5 9 5 — 8 10 8 — !! 25 1! — 14 6 Глава шестнадцатая СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 5 1. Статистические оценки параметров распределения Пусть требуется изучить количественный признак генеральной совокупности.
Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение; если же есть основания считать, что признак имеет, например, распределение Пуассона, то необходимо оценить параметр Х, которым это распределение определяется.
Обычно в распоряжении исследователя имеются лишь данные выборки, например значения количественного признака х„ х„ ..., х„, полученные в результате и наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр. Рассматривая х„х„..., х„как независимые случайные величины Х„Х„..., Х„, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения — это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра.
Например, как будет показано далее, для оценки математического ожидания нормального распределения служит функция (среднее арифметическое наблюдаемых значений признака) Х = (Х, + Х, +... + Х„)/л. Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. 197 $2. Несмещенные, эффективные и состоятельные оценки Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Ниже указаны эти требования. Пусть 6' — статистическая оценка неизвестного параметра 6 теоретического распределения.
Допустим, что по выборке объема и найдена оценка 6;. Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку 6;. Повторяя опыт многократно, получим числа 6;, 6;,..., 6», которые, вообще говоря, различны между собой. Таким образом, оценку 6' можно рассматривать как случайную величину, а числа 6;, 6;, ..., 6» †к ее возможные значения. Представим себе, что оценка 6' дает приближенное значение 6 с избытком; тогда каждое найденное по данным выборок число 6; (с=1, 2, ..., й) больше истинного значения 6.