Lektsia_2_2013 (Лекции)
Описание файла
Документ из архива "Лекции", который расположен в категории "". Всё это находится в предмете "прикладная статистика" из 4 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Онлайн просмотр документа "Lektsia_2_2013"
Текст из документа "Lektsia_2_2013"
Признаки, их классификация
Признак – функция, определенная для единиц совокупности,
значение признака
Признак – функция, определенная для единиц совокупности;
= такие свойства единиц совокупности, которые могут установлены или замерены в ходе их изучения.
Значение признака – значение этой функции.
Каждая Единица совокупности может быть охарактеризована разного рода признаками – и количественными (вариационными), и качественными (атрибутивными, +альтернативными, бинарными).
Количественный признак – признак наблюдаемой единицы, который можно непосредственно выразить числом и единицей измерения. Таковы результаты измерений, наблюдений, испытаний, опытов, анализов.
Качественный - признак наблюдаемой единицы, определяемый отнесением к одной из двух или более условных категорий (если имеется ровно две категории, то признак называется альтернативным). Статистический анализ качественных признаков – часть статистики объектов нечисловой природы.
Количественные признаки делятся на признаки, измеренные в шкалах:
-
интервалов,
-
отношений,
-
разностей,
-
абсолютной.
А качественные – на признаки, измеренные в шкале:
-
наименований
-
порядковой шкале (ШКАЛЫ ИЗМЕРЕНИЙ – лекция 8).
Методы обработки данных должны быть согласованы со шкалами, в которых измерены рассматриваемые признаки (см. раздел 2.1 о теории измерений).
Описание вида данных и, при необходимости, механизма их порождения – начало любого статистического исследования.
В простейшем случае статистические данные – это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке. Используют и более сложные признаки, перечень которых будет расширяться по мере развертывания и
зложения в учебнике.
http://www.aup.ru/books/m163/1_2_6.htm Книга Прикл статистика 1-2-6.
Например,
каждое фермерское хозяйство можно охарактеризовать такими признаками, как:
- площадь используемого земельного участка, поголовье скота (птицы), производство продукции (в натуральном и стоимостном выражении), рентабельность продукции и т п.,
а каждого человека при переписи населения — такими признаками, как:
- пол, возраст, национальность, семейное положение, место работы (или источник доходов), размер заработной платы (или дохода) и т.п.
Таблицы
Исходные статистические данные могут быть достаточно обширными.
Описание данных - это первичное сжатие информации с целью сделать ее более обозримой, легкой для восприятия. Самый древний способ – это составление различных таблиц, вторичных по отношению к таблицам исходных данных.
(см. таблицы – оценки экспертов – и сгруппированные оценки)
Таблица является наиболее рациональной, наглядной и компактной формой представления статистического материала. Однако не всякая таблица является статистической. Таблица умножения, опросный лист социологического обследования и т.д. могут носить табличную форму, но не являться статистическими таблицами.
Таблица объект-признак
Будем представлять, согласно традициям и соображениям удобства, что каждой
строке таблицы соответствует определенный объект или явление изучаемой системы, а
в столбцах таблицы размещаются значения или категории признаков. В результате получается таблица типа «объект-признак »:
Таблица 1
| Признак 1 | Признак 2 | Признак 3 | Признак 4 |
… | Признак m-1 | Признак m |
Объект 1 |
|
|
|
| … |
|
|
Объект 2 |
|
|
|
| … |
|
|
Объект 3 |
|
|
|
|
|
|
|
… | … | … | … | … | … | … | … |
Объект N |
|
|
|
| ... |
|
|
http://pca.narod.ru/ch11.htm
Таблица 2
Фамилия И.О. / Номер задачи | 1 | 2 |
| 5 | 0 |
| 5 | 10 |
| 8 | 10 |
| 5 | 8 |
| 5 | 0 |
| 0 | 3 |
| 5 | 10 |
| 5 | 10 |
| 0 | 1 |
| 5 | 3 |
Подлежащее (объект) – ФИО ученика;
Сказуемое (признак) – оценки по задачам.
Признак 1 (задача 1) = 5,8,0
Признак 2 (задача 2) = 0,10,8,3,1
Для сводной характеристики данных по двум или более признакам можно использовать Таблицы Сопряженности.
Таблицы сопряженности получили наибольшее распространение при изучении социальных явлений и процессов: общественного мнения, уровня и образа жизни, общественно-политического строя и т.д.
Сколько вариантов комбинаций будет для данного массива данных? Если учитывать число строк и столбцов?
Составляем комбинационную таблицу (сопряженности) по признакам «пол-оценка»
Таблица 3
Более компактное представление:
Первый признак – xi, второй – yi
Xi | 0 | 5 | 8 |
fi | 2 | 7 | 1 |
Yi | 0 | 1 | 3 | 8 | 10 |
fi | 2 | 1 | 2 | 1 | 4 |
Матрицы
В анализе данных наряду со статистическими таблицами применяются и другие виды таблиц, одним из которых является матрица.
Матрицей называется прямоугольная таблица числовой информации, состоящая из m строк и n столбцов. Таким образом матрица имеет размерность m х n:
г де а ij - элемент матрицы, стоящий на пересечении i-й строки и j-го столбца.
Различают два вида матриц:
-
прямоугольную (размерность от m х п);
-
квадратную.
Если число строк строго равно числу столбцов (m = n), то матрица называется квадратной порядка n
Квадратная матрица порядка n называется диагональной (D), если все элементы, стоящие вне главной диагонали (d1, d2, …, dn), равны нулю.
Графическое представление данных
Графический метод есть метод условных изображений статистических данных при помощи геометрических фигур, линий, точек и разнообразных символических образов.
Главное достоинство статистических графиков - наглядность.
Элементы Статистического графика:
Графический образ - это символические знаки, с помощью которых изображаются статистические данные: линии, точки, плоские геометрические фигуры (прямоугольники, квадраты, круги и т.д.
Полем графика является место, на котором он выполняется. Это листы бумаги, географические карты, план местности и т.п.
Пространственные ориентиры графика задаются в виде системы координатных сеток. Система координат необходима для размещения геометрических знаков в поле графика. Наиболее распространенной является система прямоугольных координат. Для построения статистических графиков используется обычно только 1-й и изредка 1-й и 4-й квадраты.
Виды графиков
http://comp5.ru/Raznoe/Statistica/Stat5-2.php
Рисунок 1
Диаграммы - наиболее распространенный способ графических изображений. Это графики количественных отношений. Виды и способы их построения разнообразны. Применяются диаграммы для наглядного сопоставления в различных аспектах (пространственном, временном и др.) независимых друг от друга совокупностей. При этом сравнение исследуемых совокупностей производится по какому-либо существенному варьирующему признаку.
Основной принцип построения всех плоскостных диаграмм сводится к тому, что статистические величины изображаются в виде геометрических фигур и, в свою очередь, подразделяются на:
-
Диаграммы сравнения - столбиковые, полосовые, круговые, квадратные, фигурные.
-
Структурные диаграммы – линейчатая, круговая.
-
Диаграммы динамики – графики.
Столбиковая диаграмма