man2ver2 (542561)
Текст из файла
47
Работа № 2. Выборки и их представление
1. Основные понятия
Напомним, что такое выборка, вариационный ряд, эмпирическое распределение, группирование, гистограмма, выборочные характеристики и др.
Выборкой х1, ..., хn объема n из совокупности, распределенной по F(х), называется n независимых наблюдений над случайной величиной с функцией распределения F(x).
Вариационным рядом х(1) х(2) ... х(n) называется выборка, записанная в порядке возрастания ее элементов.
Каждому наблюдению из выборки присвоим вероятность, равную 1/n; получим распределение, которое называют эмпирическим; ему соответствует функция эмпирического распределения
где n(х) - число членов выборки, меньших х. Значение этой функции для статистики определяется тем, что при n
(теорема Гливенко).
Выборки больших объемов труднообозримы; разобъем диапазон значений выборки на равные интервалы и подсчитаем для каждого интервала частоту- количество наблюдений, попавших в него; частоты, отнесенные к общему числу наблюдений n, называют относительными частотами; графическое представление распределения частот по интервалам гистограммой; накопленной частотой для данного интервала называют сумму частот данного интервала и всех тех, что левее его.
Числовые характеристики эмпирического распределения называются выборочными характеристиками: выборочные среднее (математическое ожидание), дисперсия:
выборочный момент порядка к:
выборочные квантили p порядка р - корни уравнения
F(p)=p,
которыми являются члены вариационного ряда
(p)=([np]+1),
где [nр] означает целую часть nр; частным случаем (p = 0.5) является выборочная медиана - центральный член вариационного ряда. Значение выборочных характеристик состоит в том, что при n они стремятся к истинным значениям распределения F(х).
Приведем с помощью пакетов примеры. Исходные данные находятся в табл.1 ( E(a) в таблице означает показательное (экспоненциальное) распределение с математическим ожиданием, равным a).
таблица1
¹ | Закон | n | | ¹ | Закон | n | |
1 | R [0, 2] | 50 | 0.03 | 14 | N (1,4) | 60 | 0.01 |
2 | N(2, 0.25) | 60 | 0.02 | 15 | E (5) | 70 | 0.03 |
3 | E (3) | 70 | 0.01 | 16 | R [0.3] | 80 | 0.1 |
4 | R [1, 3] | 80 | 0.02 | 17 | N (1,4) | 50 | 0.3 |
5 | N (1, 1) | 50 | 0.01 | 18 | E (1) | 60 | 0.2 |
6 | E (2) | 60 | 0.03 | 19 | R [1,3] | 70 | 0.03 |
7 | R [2, 3] | 70 | 0.01 | 20 | N (1,1) | 80 | 0.02 |
8 | N (0, 4) | 80 | 0.03 | 21 | E (2) | 50 | 0.01 |
9 | E (3) | 50 | 0.02 | 22 | R [2,3] | 60 | 0.02 |
10 | R [0, 2] | 60 | 0.03 | 23 | N (2,1) | 70 | 0.01 |
11 | N [2, 1] | 70 | 0.02 | 24 | E (3) | 80 | 0.03 |
12 | E (4) | 80 | 0.01 | 25 | R [1,2] | 50 | 0.01 |
13 | R [1, 2] | 50 | 0.02 |
Описание двумерных выборок
Пример. В табл.2 приведены результаты химического анализа 32 образцов сланцевых пород на содержание двуокиси кремния (SiO2 – x) и двуокиси алюминия (Al2O3 – y).
Построим диаграмму рассеяния для этой выборки, определим выборочные характеристики: среднее, дисперсии, коэффициент корреляции и построим диаграмму рассеяния и двумерную гистограмму.
Таблица 2
¹ | X | Y | ¹ | X | Y | ¹ | X | Y | ¹ | X | Y |
1 | 57.8 | 17.2 | 9 | 53.9 | 16.1 | 17 | 53.8 | 16.3 | 25 | 50.9 | 14.7 |
2 | 54.6 | 17.9 | 10 | 60 | 14.8 | 18 | 53.1 | 17.2 | 26 | 49.6 | 16.1 |
3 | 54.8 | 18.8 | 11 | 56.2 | 17 | 19 | 51.5 | 15.8 | 27 | 52.2 | 19.5 |
4 | 51.7 | 19.9 | 12 | 55.2 | 17.8 | 20 | 54 | 15 | 28 | 50.5 | 15.6 |
5 | 61.1 | 16 | 13 | 53.3 | 19.9 | 21 | 50.4 | 14.4 | 29 | 51.1 | 18.1 |
6 | 62.3 | 17.8 | 14 | 57.9 | 17.1 | 22 | 53 | 15.3 | 30 | 52.2 | 19,5 |
7 | 52.2 | 18.8 | 15 | 54 | 15.5 | 23 | 53.3 | 16.6 | 31 | 49.2 | 15.7 |
8 | 49.2 | 19.3 | 16 | 52.6 | 17.6 | 24 | 51.6 | 14.9 | 32 | 49.3 | 13.2 |
2.Выполнение в пакете STATISTICA
Генерация выборки
Сгенерируем, например, выборку объема n =50 с показательным распределением со средним значением 5.
Создадим новый файл:
File - New Data - укажем имя файла в окне File Name : descript (например) - OK. На экране сетка-таблица; в ее заголовке указаны название и размеры : 10v * 10c - ( 10 переменных ( variables ) - столбцов по 10 наблюдений ( cases ) - строк.
Преобразуем таблицу к размерам 150:
кнопка Vars (на экране) - Delete; окно Delete Variables: укажем какие переменные- столбцы убрать : From variable : var 2, To variable : var 10 - OK - Кнопка Cases - Add ( добавление ) - окно Add Cases: укажем, сколько строк добавить и куда : Number of Cases to Add : 40, Insert after Case : 1 ( например ) - OK.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.