14 Основные понятия математической статистики

2021-03-09 СтудИзба

Методы МатематическОЙ статистиКИ

в психолого-педагогическИХ исследованиЯХ

1. Основные понятия математической статистики.

2. Статистическая обработка результатов психолого-педагогических исследований.

Применение математики к другим наукам имеет смысл только в единении с глубокой теорией конкретного явления. Об этом важно помнить, чтобы не сбиваться на простую игру в формулы, за которой не стоит никакого реального содержания.

Академик Ю.А. Митропольский

Рекомендуемые файлы

Теоретические методы исследования в педагогике дают возможность раскрыть качественные характеристики изучаемых явлений. Эти характеристики будут полнее и глубже, если накопленный эмпирический материал подвергнуть количественной обработке. Однако, проблема количественных измерений в рамках психолого-педагогических исследований очень сложна. Эта сложность заключается прежде всего в субъективно-причинном многообразии педагогической деятельности и ее результатов, в самом объекте измерения, находящимся в состоянии непрерывного движения и изменения. Вместе с тем введение в исследование количественных показателей сегодня является необходимым и обязательным компонентом получения объективных данных о результатах педагогического труда. Как правило, эти данные могут быть получены как путем прямого или опосредованного измерения различных составляющих педагогического процесса, так и посредством количественной оценки соответствующих параметров адекватно построенной его математической модели. С этой целью при исследовании проблем педагогики применяются методы математической статистики. С их помощью решаются различные задачи: обработка фактического материала, получение новых, дополнительных данных, обоснование научной организации исследования и другие.

1. Основные понятия математической статистики

Исключительно важную роль в анализе многих психолого-педагогических явлений играют средние величины, представляющие собой обобщенную характеристику качественно однородной совокупности по определенному количественному признаку.

В психолого-педагогических исследованиях обычно применяются различные виды средних величин; наиболее распространенными являются средняя арифметическая, медиана и мода.

Средняя арифметическая применяется в тех случаях, когда между определяющим свойством и данным признаком имеется прямо пропорциональная зависимость (например, при улучшении показателей работы учебной группы улучшаются показатели работы каждого ее члена).

Средняя арифметическая представляет собой частное от деления суммы величин на их число и вычисляется по формуле:

                     ;                                (1)

где Х - средняя арифметическая; X1, X2, Х3 ... Хn - результаты отдельных наблюдений (приемов, действий),

n  - количество наблюдений (приемов, действий),

S - сумма результатов всех наблюдений (приемов, действий).

Медианой (Ме) называется мера среднего положения, характеризующая значение признака на упорядоченной (построенной по признаку возрастания или убывания) шкале, которое соответствует середине исследуемой совокупности. Медиана может быть определена для порядковых и количественных признаков. Место расположения этого значения определяется по формуле: Место медианы = (n + 1) / 2

Например. По результатам исследования установлено, что:

– на «отлично» учатся – 5 человек из участвующих в эксперименте;

– на «хорошо» учатся – 18 человек;

– на «удовлетворительно» – 22 человека;

– на «неудовлетворительно» – 6 человек.

Так как всего в эксперименте принимало участие N = 54 человека, то середина выборки равна человек. Отсюда делается вывод, что больше половины обучающихся учатся ниже оценки «хорошо», то есть медиана больше «удовлетворительно», но меньше «хорошо» (см. рисунок).

Описание: 222

Мода (Мо) – наиболее часто встречающееся типичное значение признака среди других значений. Она соответствует классу с максимальной частотой. Этот класс называется модальным значением.

Например.

Если на вопрос анкеты: «укажите степень владения иностранным языком», ответы распределились:

1 – владею свободно                                                     – 25

2 – владею в достаточной степени для общения       – 54

3 – владею,  но испытываю трудности при общении – 253

4 – понимаю с трудом                                                   – 173

5 – не владею                                                                 – 28

Очевидно, что наиболее типичным значением здесь является – «владею, но испытываю трудности при общении», которое и будет модальным. Таким образом, мода равна – 253.   

Важное значение при использовании в психолого-педагогическом исследовании математических методов уделяется расчету дисперсии и среднеквадратических (стандартных) отклонений.

Дисперсия равна среднему квадрату отклонений значения варианты от среднего значения. Она выступает как одна из характеристик индивидуальных результатов разброса значений исследуемой переменной (например, оценок учащихся) вокруг среднего значения. Вычисление дисперсии осуществляется путем определения: отклонения от среднего значения; квадрата указанного отклонения; суммы квадратов отклонения и среднего значения квадрата отклонения (см. табл. 6.1)1.

Значение дисперсии используется в различных статистических расчетах, но не имеет непосредственного наблюдаемого характера. Величиной, непосредственно связанной с содержанием наблюдаемой переменной, является среднее квадратическое отклонение.

Таблица 6.1

Пример вычисления дисперсии

п/п

Значение

показателя

Отклонение

от среднего

Квадрат

отклонения

1

2

3

4

5

6

1

3

3

0

4

1

2 – 1 = +1

2 – 3 = –1

2 – 3 = – 1

2 – 0 = +2

2 – 4 = –2

2 – 1 = +1

1

1

1

4

4

1

Среднее квадратичное отклонение подтверждает типичность и показательность средней арифметической, отражает меру колебания численных значений признаков, из которых выводится средняя величина. Оно равно корню квадратному из дисперсии и определяется по формуле:

                                        ;                                      (2)

где: s – средняя квадратическая. При малом числе наблюдения (действий) – менее 100 – в значении формулы следует ставить не «N», а  «N – 1».

Средняя арифметическая и средняя квадратическая являются основными характеристиками полученных результатов в ходе исследования. Они позволяют обобщить данные, сравнить их, установить преимущества одной психолого-педагогической системы (программы) над другой.

Среднее квадратическое (стандартное) отклонение широко применяется как мера разброса для различных характеристик.

Оценивая результаты исследования важно определить рассеивание случайной величины около среднего значения. Это рассеивание описывается с помощью закона Гауса (закона нормального распределения вероятности случайной величины). Суть закона заключается в том, что при измерении некоторого признака в данной совокупности элементов всегда имеют место отклонения в обе стороны от нормы вследствие множества неконтролируемых причин, при этом, чем больше отклонения, тем реже они встречаются.

При дальнейшей обработке данных могут быть выявлены: коэффициент вариации (устойчивости) исследуемого явления, представляющий собой процентное отношение среднеквадратического отклонения к средней арифметической; мера косости, показывающая, в какую сторону направлено преимущественное число отклонений; мера крутости, которая показывает степень скопления значений случайной величины около среднего и др. Все эти статистические данные помогают более полно выявить признаки изучаемых явлений.

Меры связи между переменными. Связи (зависимости) между двумя и более переменными в статистике называют корреляцией. Она оценивается с помощью значения коэффициента корреляции, который является мерой степени и величины этой связи.

Коэффициентов корреляции много. Рассмотрим лишь часть из них, которые учитывают наличие линейной связи между переменными. Их выбор зависит от шкал измерения переменных, зависимость между которыми необходимо оценить. Наиболее часто в психологии и педагогике применяются коэффициенты Пирсона и Спирмена.

Рассмотрим вычисление значений коэффициентов корреляции на конкретных примерах.

Пример 1. Пусть две сравниваемые переменные X (семейное положение) и Y (исключение из университета) измеряются в дихотомической шкале (частный случай шкалы наименований). Для определения связи используем коэффициент Пирсона. 

В тех случаях, когда нет необходимости подсчитывать частоту появления различных значений переменных X и Y, удобно проводить вычисления коэффициента корреляции с помощью таблицы сопряженности (см. табл. 6.2, 6.3, 6.4)1, показывающей количество совместных появлений пар значений по двум переменным (признакам). А – количество случаев, когда переменная X имеет значение равное нулю, и, одновременно переменная Y имеет значение равное единице; В – количество случаев, когда переменные X и Y  имеют одновременно значения, равные единице; С – количество случаев, когда переменные X и Y имеют одновременно значения равные нулю; D – количество случаев, когда переменная X имеет значение, равное единице, и, одновременно, переменная Y имеет значение, равное нулю.

Таблица 6.2

Общая таблица сопряженности

Признак X

Всего

0

1

Признак

Y

1

0

А

С

В

D

A + B

C + D

                                     Итого

A + C

B + D

N

В общем виде формула коэффициента корреляции Пирсона для дихотомических данных имеет вид

                             ;                       (3)

Таблица 6.3

Пример данных в дихотомической шкале

Шифр испытуемого

Переменная X

Переменная Y

1

2

3

4

5

6

7

8

9

10

0

1

0

0

1

2

0

1

0

0

0

1

1

0

1

0

0

1

0

1

Таблица 6.4

Таблица сопряженности для данных из таблицы 6.3

Признак X

Всего

0

1

Признак

Y

1

0

2

4

3

1

6

5

                                     Итого

6

4

10

Подставим в формулу данные из таблицы сопряженности (см. табл. 6.4), соответствующей рассматриваемому примеру:

.

Таким образом, коэффициент корреляции Пирсона для выбранного примера равен 0,32, то есть зависимость между семейным положением студентов и фактами исключения из университета незначительная.

Пример 2. Если обе переменные измеряются в шкалах порядка, то в качестве меры связи используется коэффициент ранговой корреляции Спирмена (Rs). Он вычисляется по формуле

                                               ;                                       (4)

где Rs – коэффициент ранговой корреляции Спирмена; Di – разность рангов сравниваемых объектов; N – количество сравниваемых объектов.

Значение коэффициента Спирмена изменяется в пределах от –1 да + 1. В первом случае между анализируемыми переменными существует однозначная, но противоположено направленная связь (с увеличением значений одной уменьшается значения другой). Во втором – с ростом значений одной переменной пропорционально возрастает значение второй переменной. Если величина Rs равна нулю или имеет значение, близкое к нему, то значимая связь между переменными отсутствует.

В качестве примера вычисления коэффициента Спирмена используем данные из таблицы 6.5.1

Таблица 6.5

Данные и промежуточные результаты вычисления значения коэффициента

ранговой корреляции Rs

Качества

Ранги, присвоенные экспертом

Разность рангов

D

Квадрат разности рангов

D2

1-м

2-м

01

02

03

04

05

06

07

08

1

5

6

8

7

3

4

2

2

7

3

6

8

4

5

1

–1

–2

3

2

–1

–1

–1

1

1

4

9

4

1

1

1

1

Сумма квадратов разностей рангов Di = 22

Подставим данные примера в формулу для коэффициента Смирмена:

Результаты вычисления позволяют утверждать о наличии достаточно выраженной связи между рассматриваемыми переменными.

Статистическая проверка научной гипотезы. Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер: статистические доказательства не являются столь строгими и окончательными – в них всегда допускается риск ошибиться в выводах и потому статистическими методами не доказывается окончательно правомерность того или иного вывода, а показывается мера правдоподобности принятия той или иной гипотезы.

Педагогическая гипотеза (научное предположение о преимуществе того или иного метода и т.п.) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез. Первая (основная) называется нулевой гипотезой0), в которой исследователь говорит о своей исходной позиции. Он (априори) как бы декларирует, что новый (предполагаемый им, его коллегами или оппонентами) метод не обладает какими-либо преимуществами, и потому с самого начала исследователь психологически готов занять честную научную позицию: различия между новым и старым методами объявляются равными нулю. В другой, альтернативной гипотезе1) делается предположение о преимуществе нового метода. Иногда выдвигается несколько альтернативных гипотез с соответствующими обозначениями.

Например, гипотеза о преимуществе старого метода (H2). Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:

– первый уровень – 5% (в научных текстах пишут иногда р = 5% или а≤0,05, если представлено в долях), где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;

– второй уровень – 1%, т.е. соответственно допускается риск ошибиться только в одном случае из ста (а≤0,01, при тех же требованиях);

– третий уровень – 0,1%, т.е. допускается риск ошибиться только в одном случае из тысячи (а≤0,001). Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.

При сравнении средних арифметических экспериментальной и контрольной групп важно не только определить, какая средняя больше, но и насколько больше. Чем меньше разница между ними, тем более приемлемой окажется нулевая гипотеза об отсутствии статистически значимых (достоверных) различий. В отличие от мышления на уровне обыденного сознания, склонного воспринимать полученную в результате опыта разность средних как факт и основание для вывода, педагог-исследователь, знакомый с логикой статистического вывода, не будет торопиться в таких случаях. Он скорее всего сделает предположение о случайности различий, выдвинет нулевую гипотезу об отсутствии достоверных различий в результатах экспериментальной и контрольной групп и лишь после опровержения нулевой гипотезы примет альтернативную.

Таким образом, вопрос о различиях в рамках научного мышления переводится в другую плоскость. Дело не только в различиях (они почти всегда есть), а в величине этих различий и отсюда – в определении той разницы и границы, после которого можно сказать: да, различия неслучайны, они статистически достоверны, а значит, испытуемые этих двух групп принадлежат после эксперимента уже не к одной (как раньше), а к двум различным генеральным совокупностям и что уровень подготовленности учащихся, потенциально принадлежащих этим совокупностям, будет существенно отличаться. Для того чтобы показать границы этих различий, используются так называемые оценки генеральных параметров.

Рассмотрим на конкретном примере (см. таблицу 6.6), как с помощью математической статистики можно опровергнуть или подтвердить нулевую гипотезу. 

Допустим, необходимо определить зависит ли эффективность групповой деятельности студентов от уровня развития в учебной группе межличностных отношений. В качестве нулевой гипотезы выдвигается предположение, что такой зависимости не существует, а в качестве альтернативной – зависимость существует. Для этих целей сравниваются результаты эффективности деятельности в двух группах, одна из которых в этом случае выступает в качестве экспериментальной, а вторая – контрольной. Чтобы определить, является ли разность между средними значениями показателей эффективности в первой и во второй группе существенной (значимой), необходимо вычислить статистическую достоверность этой разницы. Для этого можно использовать t – критерий Стьюдента. Он вычисляется по формуле:

                                ;                             (5)

где X1 и X2 – среднее арифметическое значение переменных в группах 1 и 2; М1 и М2 – величины средних ошибок, которые вычисляются по формуле:

                                                 ;                                             (6)

где s - средняя квадратическая, вычисляемая по формуле (2).

Определим ошибки для первого ряда (экспериментальная группа) и второго ряда (контрольная группа):

,

.

Находим значение t – критерия по формуле:

.

Вычислив величину t – критерия, требуется по специальной таблице определить уровень статистической значимости различий между средними показателями эффективности деятельности в экспериментальной и контрольной группах. Чем выше значение t – критерия, тем выше значимость различий.

Для этого t расчетное сравниваем с t табличным. Табличное значение выбирается с учетом выбранного уровня достоверности (p = 0,05 или p = 0,01), а также в зависимости от числа степеней свободы, которое находится по формуле:

                                               ;                                          (7)

где U – число степеней свободы; N1 и N2 – число замеров в первом и во втором рядах. В нашем примере U = 7  + 7 –2 = 12.

Таблица 6.6

Данные и промежуточные результаты вычисления значимости статистических

*         различий средних значений

*          

п/п

Экспериментальная группа

Контрольная группа

Значение эффек-тивности деятельности

Значение эффек-тивности деятельности

1

2

3

4

5

6

7

5

6

7

10

6

8

7

2

1

0

–3

1

–1

0

4

1

0

9

1

1

0

6

3

4

5

5

3

2

–2

1

0

–1

–1

1

2

4

1

0

1

1

1

4

    

     

Для таблицы t – критерия находим, что значение t табл. = 3,055 для однопроцентного уровня (p < 0,01) при 12 степенях свободы. Таким образом, величина t табл. < t расч. Таким образом, можно сделать статистически обоснованный вывод о том, что эффективность деятельности в экспериментальной группе выше, чем в контрольной, при уровне значимости 0,01 (риск ошибки составляет одна из ста теоретически возможных).

Однако педагогу-исследователю следует помнить, что существование статистической значимости разности средних значений является важным, но не единственным аргументом в пользу наличия или отсутствия связи (зависимости) между явлениями или переменными. Поэтому необходимо привлекать и другие аргументы количественного или содержательного обоснования возможной связи.

Многомерные методы анализа данных. Анализ взаимосвязи между большим количеством переменных осуществляется путем использования многомерных методов статистической обработки. Цель применения подобных методов – сделать наглядными скрытые закономерности, выделить наиболее существенные взаимосвязи между переменными. Примерами таких многомерных статистических методов являются:

–       –       факторный анализ;

–       –       кластерный анализ;

–       –       дисперсионный анализ;

–       –       регрессионный  анализ;

–       –       латентно-структурный анализ;

–       –       многомерное шкалирование и другие.

Факторный анализ заключается в выявлении и интерпретации факторов. Фактор – обобщенная переменная, которая позволяет свернуть часть информации, т. е. представить ее в удобообозримом виде. Например, факторная теория личности выделяет ряд обобщенных характеристик поведения, которые в данном случае называются чертами личности.

Кластерный анализ позволяет выделить ведущий признак и иерархию взаимосвязей признаков.

Дисперсионный анализ – статистический метод, используемый для изучения одной или нескольких одновременно действующих и независимых переменных на изменчивость наблюдаемого признака. Его особенность состоит в том, что наблюдаемый признак может быть только количественным, в тоже время объясняющие признаки могут быть как количественными, так и качественными.

Регрессионный анализ позволяет выявить количественную (численную) зависимость среднего значения изменений результативного признака (объясняемой) от изменений одного или нескольких признаков (объясняющих переменных). Как правило данный вид анализа применяется тогда, когда требуется выяснить насколько изменяется средняя величина одного признака при изменении на единицу другого признака.

Латентно-структурный анализ представляет совокупность аналитико-статистических процедур выявления скрытых переменных (признаков), а также внутренней структуры связей между ними. Он дает возможность исследовать проявления сложных взаимосвязей непосредственно ненаблюдаемых характеристик социально-психологических и педагогических явлений. Латентный анализ может являться основой для моделирования указанных взаимосвязей.

Многомерное шкалирование обеспечивает наглядную оценку сходства или различия между некоторыми объектами, описываемыми большим количеством разнообразных переменных. Эти различия представляются в виде расстояния между оцениваемыми объектами в многомерном пространстве.

Ещё посмотрите лекцию "Разработка антикризисной стратегии предприятия" по этой теме.



1 Шевандрин Н.И. Социальная психология в образовании: Учебное пособие. Ч.1. Концептуальные и прикладные основы социальной психологии. – М.: ВЛАДОС, 1995.

1 Шевандрин Н.И. Социальная психология в образовании: Учебное пособие. Ч.1. Концептуальные и прикладные основы социальной психологии. – М.: ВЛАДОС, 1995.

1 Шевандрин Н.И. Социальная психология в образовании: Учебное пособие. Ч.1. Концептуальные и прикладные основы социальной психологии. – М.: ВЛАДОС, 1995.

Свежие статьи
Популярно сейчас