Шушерина О.А. - Математическая статистика для психологов (1092915), страница 2
Текст из файла (страница 2)
2. Первичная обработка Вариационный ряд
результатов наблюдений
Эмпирическое распределение
Полигон частот Гистограмма частот
3. Математическая обработка
статистических данных Оценка параметров
распределения
Методы корреляционного Методы факторного Методы регрессионного
анализа анализа анализа
Этапы статистического исследования
Контрольные вопросы
-
Каковы основные задачи математической статистики?
-
Что называется генеральной и выборочной совокупностями для исследуемой случайной величины?
-
В чем сущность выборочного метода?
-
Какая выборка называется репрезентативной, однородной?
Тема 2. вариационный и статистический ряды
1. Таблицы сгруппированных данных
Обработка экспериментального материала начинается с систематизации и группировки результатов по некоторому признаку.
Таблицы. Основное содержание таблицы должно быть отражено в названии.
Простая таблица – это перечень, список отдельных единиц испытания с количественной или качественной характеристикой. Используется группировка по одному признаку (например, по полу).
Сложная таблица применяется для выяснения причинно-следственных связей между признаками и позволяет выявить тенденцию, обнаружить разные аспекты между признаками.
№ испытуемых | Баллы, полученные за задание | Всего | ||
№1 | №2 | №3 | ||
1 | 2 | 5 | 4 | 11 |
… | … | … | … | … |
4 | 13 | 8 | 25 | |
Сумма | 15 | 21 | 16 | 52 |
2. Дискретный статистический ряд
Последовательность данных, расположенная в порядке их получения в эксперименте, называется статистическим рядом.
Результаты наблюдений, в общем случае ряд чисел, расположенных в беспорядке, необходимо упорядочить (проранжировать). Ранжировать можно как по возрастанию, так и по убыванию признака. После операции ранжирования опытные данные можно сгруппировать так, чтобы в каждой группе признак принимал одно и то же значение, которое называется варианта (обозначено ).
Число элементов в каждой группе называется частотой варианты ( ). Частота показывает, сколько раз встречается данное значение
в исходной совокупности. Общая сумма частот равна объему выборки:
.
Упорядоченный ряд распределения, в котором указана повторяемость вариант, принадлежащих к данной совокупности, называется вариационным рядом.
Ряд вида
называется дискретным вариационным рядом.
Сумма всех частот значений признака равна объему выборки:
.
Пример. Школьники получили следующие баллы по тесту: 11, 8, 9, 10, 8, 6, 7, 7, 9, 11, 10, 6, 5, 11, 10 – это статистический ряд.
Расположим данные в порядке возрастания:
5, 6, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 11, 11 – это вариационный ряд.
Представим данный ряд в виде таблицы (с учетом повторений) и в порядке возрастания значений признака, получим ранжированный дискретный вариационный ряд.
Здесь - значение признака (варианта),
- его частота («вес» значения признака). Сумма всех частот значений признака равна объему выборки:
.
Частота может быть выражена и в относительных значениях варьирующего признака:
-
в долях единицы
. Тогда
называется относительной частотой значения
. Сумма всех относительных частот, выраженная в долях единицы, равняется 1:
;
-
или в процентах по отношению к объему выборки. Принимая объем выборки за 100%, получим
. Сумма относительных частот, выраженная в процентах, равна 100%, т.е.
.
Процентное представление частот полезно в тех случаях, когда сравниваемые выборки различаются по объему.
3. Интервальный вариационный ряд
При большом объеме выборки работа с вариационными рядами представляет определенные неудобства, и тогда наблюдаемые данные группируют.
Группировка должна наиболее полно выявлять существенные свойства распределения. Существуют формулы для определения оптимального количества интервалов, но в психологии считается, что следует брать от 5 до 15 интервалов.
Первый способ построения интервального ряда.
Если у исследователя нет предварительной информации о характере распределения признака, то лучше задавать равные интервалы, при этом длина интервала определяется по формуле
, где
- количество выбранных интервалов (число
округляется до целого значения).
Начало первого интервала равно , а конец
(это будет одновременно и началом второго интервала). Условимся все интервалы считать с открытым правым концом:
. Построение интервалов заканчивается, если в интервал попало наибольшее значение признака
.
Далее подсчитывают число значений признака, попавших в каждый интервал (с учетом открытого правого конца). Получается таблица, называемая интервальным вариационным рядом.
Второй способ построения интервального ряда.
Весь диапазон значений признака от до
разбивается на равные интервалы, называемые также классами. Затем все варианты совокупности распределяются по этим интервалам. Порядок действий:
-
Начальные и конечные значения всех последующих интервалов можно вычислить путем последовательного прибавления величины интервала к значениям конца предыдущего интервала:
,
и так далее.
Пример построения интервального вариационного ряда.
Пусть измерен некоторый показатель для 30 испытуемых:
23, 29, 35, 7, 11, 18, 23, 30, 36, 18, 11, 8, 13, 20, 25,
27, 14, 30, 20, 20, 24, 19, 21, 26, 22, 16, 26, 25, 33, 27.
Это статистический ряд.
Расставим экспериментальные данные в возрастающем порядке, то есть построим вариационный ряд:
7, 8, 11, 11, 13, 14, 16, 18, 18, 19, 20, 20, 20, 21, 22,
23, 23, 24, 25, 25, 26, 26, 27, 27, 29, 30, 30, 33, 35, 36.
Число классов (интервалов) для :
Минимальное и максимальное значения: ,
.
Находим границы интервалов:
Построим интервальный вариационный ряд.
Номера интервалов | Интервалы | Серединные значения интервалов | Частоты |
1 | 4 – 10 | 7 | 2 |
2 | 10 – 16 | 13 | 4 |
3 | 16 – 22 | 19 | 8 |
4 | 22 – 28 | 25 | 10 |
5 | 28 – 34 | 31 | 4 |
6 | 34 – 40 | 37 | 2 |
5. Гистограмма
Вариационные ряды изображают графически с помощью полигона и гистограммы.