85450 (612489)
Текст из файла
Модель распределения
Курсовая работа по статистике
Работу выполнил ст. гр. ЭР-6-4 Шалыгин Д.А.
Московский государственный технологический университет «Станкин»
Кафедра «Производственный менеджмент»
Москва 2001
Раздел 1. Исследование модели распределения
1. Формирование выборочной совокупности
Обычно бывает затруднительно исследовать генеральную совокупность. Тогда проводят исследование выборочной совокупности, и его результаты распространяют на генеральную совокупность.
Наиболее часто для формирования выборочной совокупности применяют бесповторную случайную выборку. Случайный отбор организуют с помощью жребия, таблицы случайных чисел или программы, генерирующей квазислучайную последовательность чисел. Для этого единицы генеральной совокупности нумеруют. Данные, соответствующие выпавшим, номерам попадают в выборку. При этом повторяющиеся номера пропускаем.
Покажем применение таблицы случайных чисел. В табл. 1 приложения приведено пятьсот четырехзначных случайных чисел.
Рассмотрим пример получения выборки. Генеральная совокупность содержит значения восьми количественных экономических показателей для 100 предприятий. Она представлена в табл.2 приложения.
Наиболее проработанной в статистике является парная корреляция. Положим, нужно установить корреляционную связь между двумя показателями. В нашем случае мы изучаем связь между годовой балансовой прибылью (показатель 5) и электровооруженностью на одного работающего (показатель №7), выбираем в табл.1 приложения четырёхзначное число из 7-го столбца, 5-ой строки; т.к. сумма номеров показателей чётна, то из него берём правую половину; далее выбираем 30 неповторяющихся чисел. Затем из табл.2 приложения выбираем в соответствующих номерах строк 30 пар значений изучаемых показателей, в соответствии с этими данными получаем табл.1.1
Таблица 1.1
| № строки | 5 | 7 |
| 5 | 40,2 | 35,6 |
| 12 | 35,4 | 32,9 |
| 13 | 31,4 | 30,5 |
| 18 | 42,8 | 37,7 |
| 22 | 36,6 | 33,7 |
| 26 | 37,8 | 34,3 |
| 27 | 44,5 | 38,4 |
| 30 | 42,7 | 37,2 |
| 31 | 32,8 | 31,3 |
| 32 | 32,5 | 30,7 |
| 36 | 32,7 | 31,4 |
| 38 | 38,9 | 35,3 |
| 40 | 33,2 | 31,6 |
| 41 | 36,2 | 33,7 |
| 43 | 33,3 | 31,4 |
| 45 | 36,2 | 33,5 |
| 46 | 38,4 | 34,6 |
| 49 | 38,8 | 35,1 |
| 52 | 35,7 | 33,2 |
| 54 | 33,7 | 32 |
| 57 | 36,3 | 33,6 |
| 60 | 40,3 | 36,1 |
| 65 | 35,8 | 32,8 |
| 68 | 33,7 | 31,9 |
| 69 | 41,6 | 36,3 |
| 71 | 38,8 | 35 |
| 76 | 34,9 | 32,6 |
| 80 | 39,4 | 35,8 |
| 86 | 37,1 | 33,5 |
| 91 | 35,9 | 32,6 |
| 99 | 4 | 42,2 |
2. Построение интервального ряда распределения
Этот и последующие этапы работы в этом разделе выполняем для каждого изучаемого признака в отдельности.
П
ринимая во внимание, что выборочная совокупность содержит n значений, величину равных интервалов выбираем по формуле Г.А. Стерджесса:
где К = 1+3,322gn- число интервалов; при n=30 К=5. xmax и xmin - минимальное и максимальное значения признака.
Определяем границы интервалов. Для первого интервала левая граница равна xmin, а правая – xmin +i и, для второго, соответственно - xmin +i и xmin +2i и т.д.
Строим таблицу частоты распределения значений признака по интервалам и гистограмму. Для определенности считаем, что значение признака, лежащее на границе двух интервалов, попадает в правый интервал.
Для показателя x:
Определяем границы интервалов и строим таблицу частоты распределения значений признака по интервалам:
| Границы интервалов | Число предприятий | |
| 31,4 | 34,02 | 8 |
| 34,02 | 36,64 | 9 |
| 36,64 | 39,26 | 6 |
| 39,26 | 41,88 | 4 |
| 41,88 | 44,5 | 3 |
Строим гистограмму:
Для показателя y:
Определяем границы интервалов и строим таблицу частоты распределения значений признака по интервалам:
| Границы интервалов | Число предприятий | |
| 30,5 | 32,08 | 8 |
| 32,08 | 33,66 | 8 |
| 33,66 | 35,24 | 6 |
| 35,24 | 36,82 | 5 |
| 36,82 | 38,4 | 3 |
Строим гистограмму:
3. Проверка соответствия эмпирического распределения нормальному закону распределения
Для проверки соответствия эмпирического распределения случайной величины нормальному закону распределения в нашем случае (при n<30) можно использовать критерии Шапиро-Уилкса (W) и Колмогорова (D). В нашем случае мы используем критерий Колмогорова.
С
начала определим среднюю величину
и среднее квадратическое отключение от нее, считая выборку малой:
Д
ля признака x:
Д
ля признака y:
Вычисляем ошибку определения средней по выборочной совокупности (ошибку выборки):
г
де n - численность выборки; N= 100 - численность генеральной совокупности; t - коэффициент доверия; при доверительной вероятности 95,45% t=2.
Для признака x:
Для признака y:
Генеральная средняя располагается в следующих границах:
Определяем эти границы:
Ранжируем значения величин x и y по возрастанию (табл.1.2.):
x1 x2 … xn-1 xn
Таблица 1.2.
| X | Y |
| 1 | 2 |
| 31,4 | 30,5 |
| 32,5 | 30,7 |
| 32,7 | 31,4 |
| 32,8 | 31,3 |
| 33,2 | 31,6 |
| 33,3 | 31,4 |
| 33,7 | 32 |
| 33,7 | 31,9 |
| 34,9 | 32,6 |
| 35,4 | 32,9 |
| 35,7 | 33,2 |
| 35,8 | 32,8 |
| 35,9 | 32,6 |
| 36,2 | 33,7 |
| 36,2 | 33,5 |
| 36,3 | 33,6 |
| 36,6 | 33,7 |
| 37,1 | 33,5 |
| 37,8 | 34,3 |
| 38,4 | 34,6 |
| 38,8 | 35,1 |
| 38,8 | 35 |
| 38,9 | 35,3 |
| 39,4 | 35,8 |
| 40,2 | 35,6 |
| 40,3 | 36,1 |
| 41,6 | 36,3 |
| 42,7 | 37,2 |
| 42,8 | 37,7 |
| 44,5 | 38,4 |
П
ерейдем к нормированным значениям аргумента (табл.1.3):
Таблица 1.3.
| t(x) | F(tx) | t(y) | F(ty) | |
| 1 | 2 | 3 | 4 | 5 |
| t1 | -1,6 | 0,0548 | -1,6 | 0,0548 |
| t2 | -1,3 | 0,0968 | -1,5 | 0,0668 |
| t3 | -1,2 | 0,1151 | -1,2 | 0,1151 |
| t4 | -1,2 | 0,1151 | -1,1 | 0,1357 |
| t5 | -1,1 | 0,1357 | -1,1 | 0,1357 |
| t6 | -1,1 | 0,1357 | -1,1 | 0,1357 |
| t7 | -0,9 | 0,1841 | -0,9 | 0,1841 |
| t8 | -0,9 | 0,1841 | -0,9 | 0,1841 |
| t9 | -0,6 | 0,2743 | -0,6 | 0,2743 |
| t10 | -0,4 | 0,3446 | -0,6 | 0,2743 |
| t11 | -0,4 | 0,3446 | -0,5 | 0,3085 |
| t12 | -0,3 | 0,3821 | -0,4 | 0,3446 |
| t13 | -0,3 | 0,3821 | -0,3 | 0,3821 |
| t14 | -0,2 | 0,4207 | -0,1 | 0,4602 |
| t15 | -0,2 | 0,4207 | -0,1 | 0,4602 |
| t16 | -0,2 | 0,4207 | -0,1 | 0,4602 |
| t17 | -0,1 | 0,4602 | -0,1 | 0,4602 |
| t18 | 0,1 | 0,5398 | -0,1 | 0,4602 |
| t19 | 0,3 | 0,6179 | 0,2 | 0,5793 |
| t20 | 0,4 | 0,6554 | 0,4 | 0,6554 |
| t21 | 0,6 | 0,7257 | 0,6 | 0,7257 |
| t22 | 0,6 | 0,7257 | 0,6 | 0,7257 |
| t23 | 0,6 | 0,7257 | 0,7 | 0,7580 |
| t24 | 0,7 | 0,7580 | 0,9 | 0,8159 |
| t25 | 1,0 | 0,8413 | 0,9 | 0,8159 |
| t26 | 1,0 | 0,8413 | 1,1 | 0,8643 |
| t27 | 1,4 | 0,9192 | 1,2 | 0,8846 |
| t28 | 1,7 | 0,9554 | 1,6 | 0,9452 |
| t29 | 1,7 | 0,9554 | 1,8 | 0,9641 |
| t30 | 2,2 | 0,9861 | 2,2 | 0,9861 |
Принимаем значения эмпирической функции распределения в точке t равным следующему значению (табл.1.4):
где i= 1, 2,...,n. При t< t1 F*(t)=0, а при t>tn F*(t)=l.
Таблица 1.4.
| F*(ti) | |
| 1 | 2 |
| 1 | 0,016667 |
| 2 | 0,05 |
| 3 | 0,083333 |
| 4 | 0,116667 |
| 5 | 0,15 |
| 6 | 0,183333 |
| 7 | 0,216667 |
| 8 | 0,25 |
| 9 | 0,283333 |
| 10 | 0,316667 |
| 11 | 0,35 |
| 12 | 0,383333 |
| 13 | 0,416667 |
| 14 | 0,45 |
| 15 | 0,483333 |
| 16 | 0,516667 |
| 17 | 0,55 |
| 18 | 0,583333 |
| 19 | 0,616667 |
| 20 | 0,65 |
| 21 | 0,683333 |
| 22 | 0,716667 |
| 23 | 0,75 |
| 24 | 0,783333 |
| 25 | 0,816667 |
| 26 | 0,85 |
| 27 | 0,883333 |
| 28 | 0,916667 |
| 29 | 0,95 |
| 30 | 0,983333 |
Определим максимальное значение модуля разности между эмпирической функцией распределения F*(t) и теоретической функцией для нормального закона распределения F(t) (значения F(t) представлены в табл.3.2):
и определяем величину:
Д
ля признака x:
Д
ля признака y:
Затем по таблице определяем в зависимости от вероятность Р(), того что за счёт чисто случайных причин расхождение между *() и () будет не больше, чем фактически наблюдаемое.
При сравнительно больших Р() теоретический закон распределения можно считать совместимым с опытными данными.
Раздел 2. Исследование взаимосвязи двух количественных признаков
1. Оценка тесноты корреляционной связи
Из логических соображений выдвинем предположение, что признак (названный нами y) зависит от второго исследуемого признака x.
Используя проведенное в первом разделе разбиение значений x на интервалы, построим аналитическую таблицу:
30>Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.














