Число пассажиров компании «Донские авиалинии» одного из рейсов на рейсах между Ростовом и Москвой за 30 дней между апрелем и маем текущего составило: 128, 121, 134, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127, 119, 114, 124, 110, 126,
Описание
Число пассажиров компании «Донские авиалинии» одного из рейсов на рейсах между Ростовом и Москвой за 30 дней между апрелем и маем текущего составило: 128, 121, 134, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132, 136, 134, 129.
Задание:
1. По данным выборки построить точечный вариационный ряд, распределив значения по частотам (ряд 1).
2. От ряда 1 перейти к интервальному ряду (ряд 2).
3. От ряда 2 перейти к точечному ряду, распределив значения по частотам (ряд 3) и относительным частотам в виде доли и в виде процента (ряд 4).
4. Построить: а) гистограмму относительных частот для ряда 2; б) полигон частот для ряда 3; в) кумулятивную кривую для ряда 3.
5. Найти эмпирическую функцию распределения случайной величины Х, используя ряд 3, и построить ее график.
6.Определить выборочное среднее , выборочную дисперсию DВ, выборочное среднее квадратическое отклонение , коэффициент вариации V, моду и медиану по точечному ряду 1 и интервальному ряду 2.
7. Указать несмещенные оценки неизвестного математического ожидания и неизвестной дисперсии случайной величины Х – производительности труда.
8. В предположении, что выборка извлечена из нормальной генеральной совокупности, построить доверительные интервалы для неизвестных математического ожидания и дисперсии (принять ).
Решение.
1. Для того чтобы построить точечный вариационный ряд, необходимо расположить наблюдаемые значения в порядке их возрастания и относительно каждого указать частоту , т.е. количество повторений в выборке; при этом сумма всех частот равна объему выборки n.
Ряд 1:
| 109
| 110 | 114 | 116 | 118 | 119 | 120 | 121 | 123 | 124 | 125 | 126 |
| 1 | 1 | 1 | 1 | 1 | 1 | 1 | 2 | 2 | 1 | 2 | 1 |
| 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 136 |
| 1 | 4 | 2 | 1 | 1 | 1 | 1 | 3 | 1 |
Здесь объем выборки , а число различных значений r =21.
2. Так как объем выборки велик и число различных значений исследуемого случайного признака также велико, то целесообразно перейти от точечного ряда 1 к интервальному. Такой переход осуществляется следующим образом:
а) отмечаются наименьшее и наибольшее значения в выборке;
б) весь обследованный диапазон [109;136] разбивается на число интервалов k, где . В нашем примере п =30 и k=4,91=5;
в) определяется величина шага или ширина интервала группирования h:
г) отмечаются крайние точки каждого из интервалов в порядке возрастания, а также подсчитываются числа выборочных данных, попавших в каждый из интервалов (очевидно, здесь ):
Ряд 2:
| 109-114,5 | 114,5-120 | 120-125,5 | 125,5-131 | 131-136,5 |
| 3 | 3 | 8 | 9 | 7 |
3. Для того чтобы от интервального ряда 2 перейти вновь к точечному, необходимо отметить середины интервалов и сопоставить им частоты или относительные частоты . Распределение производительности труда по частотам запишется в виде ряда 3, а распределение по относительным частотам в виде ряда 4:
Ряд 3:
| 111,75 | 117,25 | 122,75 | 128,25 | 133,75 |
|
| 3 | 3 | 8 | 9 | 7 |
Ряд 4:
| 111,75 | 117,25 | 122,75 | 128,25 | 133,75 |
|
| 0,1 | 0,1 | 0,27 | 0,3 | 0,23 | , |
| 10 | 10 | 27 | 30 | 23 | |
4. Гистограмма относительных частот для ряда 2 изображена на рис. 4.
|
Полигон частот показан на рис.5.
Рис. 5
Для построения кумуляты представим ряд 3 по накопленным частотам :
| 111,75 | 117,25 | 122,75 | 128,25 | 133,75 |
| 10 | 20 | 47 | 77 | 100 |
Тогда кумулятой будет плавная кривая, изображенная на рис.6.
5. Эмпирическая функция распределения для ряда 3 запишется так:
График изображен на рис. 7
| |
| |
6. Для упрощения вычислений расчет характеристик выборки произведем по ряду 3.
Найдем выборочное среднее
Выборочную дисперсию можно определить по одной из двух формул
либо .
В нашем случае .
Выборочное среднее квадратическое отклонение =6,770935;
Коэффициент вариации .
Определим моду и медиану. Мода исследуемой случайной величины Х есть такое ее возможное значение, которое наиболее часто встречается в ряду наблюдений. В случае точечного ряда 1 модальное значение так как частота этого значения наибольшая и равна 9. В случае интервального ряда 2 вначале определяют интервал, содержащий моду, также по наибольшей частоте или относительной частоте. Затем моду определяют по формуле:
Для данной выборки интервал, содержащий моду – [14,9-15,5] (ему соответствует наибольшая частота , равная 26).
Здесь = 128,25; h =5,5; = 9, = 8, = 7, тогда
Медиана определяется как средний (серединный) член в упорядоченной последовательности значений случайной величины. В нашем примере п = 30, поэтому в качестве медианы следует взять любое значение между 15-м и 16-м членами ряда 1: = 126.
В случае интервального ряда вначале определяют интервал, содержащий медиану, по накопленным частотам: медианному интервалу соответствует первая из накопленных частот, превышающая половину объема выборки. Затем медиану определяют по формуле
.
Медианному интервалу заданного эмпирического распределения в виде ряда 2 соответствует накопленная частота 77, отсюда =128,25; h=5,5; = 14; =9. Используя формулу, получим
=
Таким образом, среднее число пассажиров , абсолютный разброс значений показателя Х равен =6,77 чел, относительный разброс . Наибольшее число пассажиров 130,08, а половина – более 128,86 чел.
Построенные вариационные ряды 1-3, их графические изображения (рис. 4-7) представляют данные в компактном виде. Кроме этого имеется возможность получить сведения о законе распределения вероятностей исследуемой случайной величины. Здесь внешний контур гистограммы (рис. 4), графики кумулятивной кривой (рис. 6) и эмпирической функции распределения (рис. 7) свидетельствуют о близости эмпирического распределения к нормальному закону. К этому же выводу можно прийти, сравнивая значения выборочного среднего, моды, медианы. Так как , и незначительно отличаются друг от друга ( » » » 129), есть основание предполагать, что теоретическое распределение симметрично относительно своего среднего значения, что является еще одним доводом в пользу выбора модели нормального закона.
7. Если считать, что случайная величина Х –число пассажиров– нормально распределена с математическим ожиданием и дисперсией , то несмещенными оценками этих параметров, найденными по выборке объема , будут и . В нашем примере (тыс. руб.), , человек.
- Интервальные оценки для неизвестных параметров или доверительные
интервалы, покрывающие истинные (неизвестные) значения параметров с заданной доверительной вероятностью (надежностью) , найдем по формулам
где находится из таблицы квантилей распределения Стьюдента при числе степеней свободы, равном , и уровне (см. приложение 2); – квантили распределения (см. приложение 3).
Для и имеем и Следовательно,
,
То есть мы на 95% уверены в том, что среднее число пассажиров будет от 125,86 до 131.86 человек.
Для неизвестной дисперсии можно записать
,
Характеристики решённой задачи
Список файлов
- Задача.docx 160,87 Kb