Очень часто перед исследователем в психологии стоит задача выявления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических особенностей хронически больных детей по сравнению со здоровыми, юных правонарушителей по сравнению с законопослушными сверстниками или различий между работниками государственных предприятий и частных фирм, между людьми разной национальности или разной культуры и, наконец, между людьми разного возраста в методе "поперечных срезов".

Иногда по выявленным в исследовании статистически достоверным различиям формируется "групповой профиль" или "усредненный портрет" человека той или иной профессии, статуса, соматического заболевания и др. (см., например, Cattell R.B., Eber H.W., Tatsuoka MM., 1970).

В последние годы все чаще встает задача выявления психологического портрета специалиста новых профессий: "успешного менеджера", "успешного политика", "успешного торгового представителя", "успешного коммерческого директора" и др. Такого рода исследования не всегда подразумевают участие двух или более выборок. Иногда обследуется одна, но достаточно представительная выборка численностью не менее 60 человек, а затем внутри, этой выборки выделяются группы более и менее успешных специалистов, и их данные по исследованным переменным сопоставляются между собой. В самом простом случае критерием для разделения выборки на "успешных" и "неуспешных-" будет средняя величина по показателю успешности. Однако такое деление является довольно грубым: лица, получившие близкие оценки по успешности, могут оказаться в противоположных группах, а лица, заметно различающиеся по оценкам успешности, - в одной и той же группе. Это может исказить результаты сопоставления групп или, по крайней мере, сделать различия между группами менее заметными.

Чтобы избежать этого, можно попробовать выделить группы "успешных" и "неуспешных" специалистов более строго, включая в первую из них только тех, чьи значения превышают среднюю величину не менее чем на 1/4 стандартного отклонения, а во вторую группу - только тех, чьи значения не менее чем на 1/4 стандартного отклонения ниже средней величины. При этом все, кто оказывается в зоне средних величин, М±1/4σ, выпадают из дальнейших сопоставлений. Если распределение близко к нормальному, то выпадет примерно 19,8% испытуемых. Если распределение отличается от нормального, то таких испытуемых может быть и больше. Чтобы избежать потерь, можно сопоставлять не две, а три группы испытуемых: с высокой, средней и низкой профессиональной успешностью.

Рис 2.1. Схематическое изображение процесса разделения выборки на группы с низкой, средней и высокой профессиональной успешностью.

На Рис. 2.1 представлена схема разделения выборки на группы с низкой, средней и высокой профессиональной успешностью по критерию отклонения значений от средней величины на 1/2 стандартного отклонения. При таком строгом критерии в "среднюю" группу попадают (при нормальном распределении) около 38,2% всех испытуемых, а в крайних группах оказывается по 30,9% испытуемых.

Чем меньше испытуемых оказывается в группах, тем меньше у нас возможностей для выявления достоверных различий, так как критические значения большинства критериев при малых n строже, чем при больших n.

Таким образом, при нестрогом разделении испытуемых на группы мы теряем в точности, а при строгом - в количестве испытуемых.

При решении задач выявления различий в уровневых показателях следует помнить, что "усредненный профиль успешного специалиста" должен рассматриваться скорее как исследовательский результат, позволяющий сформулировать гипотезы для дальнейших исследований, а не как основание для профессионального отбора. Тому есть две причины.

Во-первых, ни у одного из успешных специалистов может не наблюдаться "усредненный профиль" - он, в сущности, является отвлеченным обобщением;

во-вторых, в профессиональной деятельности наличие собственного индивидуального стиля важнее соответствия "среднегрупповому" профилю. Недостаток в тех качествах, которые могут казаться важными, компенсируется другими качествами. У каждого успешного специалиста его психологические свойства создают неповторимый ансамбль, который при усреднении данных теряется.

Р.Б. Кеттелл, учитывая это, предлагал при исследовании профессиональной успешности включать в рассмотрение индивидуальные профили выдающихся представителей той или иной профессии (Cattel! R.B., Eber H.W., Tatsuoka M., 1970).

Сопоставление уровневых показателей в разных выборках может быть необходимой частью комплексных диагностических, учебных, психокоррекционных и иных программ. Оно помогает нам обратить внимание на те особенности обследованных выборок, которые должны быть учтены и использованы при адаптации программ к данной группе в процессе их конкретного воплощения.

Критерии, которые рассматриваются в данной главе, предполагают, что мы сопоставляем так называемые независимые выборки, то есть две или более выборки, состоящие из разных испытуемых. Тот испытуемый, который входит в одну выборку, уже не может входить в другую. В противоположность этому, если мы обследуем одну и ту же выборку испытуемых, несколько раз подвергая её аналогичным измерениям ("замерам"), то перед нами - так называемые связанные, или зависимые, выборки данных. Сопоставление 2-х или более замеров, полученных на одной и той же выборке, рассматривается в Теме 4.

Решение о выборе того или иного критерия принимается на основе того, сколько выборок сопоставляется и каков их объем (см. Алгоритм 7 в конце темы).

Вопрос 2 Q - критерий Розенбаума

Назначение критерия

Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Описание критерия

Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.

В этом случае стоит применить критерий φ* Фишера. Если же Q-критерии выявляет достоверные различия между выборками с уровнем значимости р<0,01, можно ограничиться только им и избежать трудностей применения других критериев.

Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны. Например, если у нас только 3 значения признака, 1, 2 и 3, - нам очень трудно будет установить различия. Метод Роэенбаума требует, следовательно, достаточно тонко измеренных признаков.

Применение критерия начинаем с того, что упорядочиваем значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значении по интересующему нас признаку, раскладывая карточки на столе. Так мы сразу увидим, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений "выше" (S₁), а второй - "ниже" (S₂).

Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом - тот, где значения ниже.

Гипотезы

Н₀: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

H₁: Уровень признака в выборке 1 превышает уровень признака в выборке 2.

Графическое представление критерия Q

На Рис. 2.2. представлены три варианта соотношения рядов значений в двух выборках. В варианте (а) все значения первого ряда выше всех значений второго ряда. Различия, безусловно, достоверны, при соблюдении условия, что n_1,n_{2 >}11.

В варианте (б), напротив, оба ряда находятся на одном и том же уровне: различия недостоверны. В варианте (в) ряды частично перекрещиваются, но все же первый ряд оказывается гораздо выше второго. Достаточно ли велики зоны S₁ и S₂, в сумме составляющие Q, можно определить по Таблице I Приложения 1, где приведены критические значения Q для разных n. Чем величина Q больше, тем более достоверные различия мы сможем констатировать.

Рис. 2.2. Возможные соотношения рядов значений в двух выборках:

*S₁ - зона значений 1-го ряда, которые выше максимального значения 2-го ряда;

*S₂ - зона значений второго ряда, которые меньше минимального значения 1-го ряда;

*штриховкой отмечены перекрещивающиеся зоны двух рядов

Ограничения критерия Q

1. В каждой из сопоставляемых выборок должно быть не менее 11 наблюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:

а) если в обеих выборках меньше 50 наблюдений, то абсолютная величина разности между n₁ и n₂ не должна быть больше 10 наблюдений;

б) если в каждой из выборок больше 51 наблюдения, но меньше 100, то абсолютная величина разности между n₁ и n₂ не должна быть больше 20 наблюдений;

в) если в каждой из выборок больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза (Гублер Е.В., 1978, с. 75).

2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмысленно. Между тем, возможны случаи, когда

диапазоны разброса значений совпадают, но, вследствие разносторонней асимметрии двух распределений, различия в средних величинах признаков существенны (Рис. 2.3., 2.4).

Рис. 2.3. Вариант соотношения распределений признака в двух выборках, при котором критерий Q беспомощен

Рис. 2.4. Вариант соотношения распределений признака в двух выборках, при котором критерий Q может быть могущественным

Пример

У предполагаемых участников психологического эксперимента, моделирующего деятельность воздушного диспетчера, был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано 26 юношей в возрасте от 18 до 24 лет (средний возраст 20,5 лет). 14 из них были студентами физического факультета, а 12 - студентами психологического факультета Ленинградского университета (Сидоренко Е.В., 1978). Показатели вербального интеллекта представлены в Табл. 2.1.

Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

Таблица 2.1

Индивидуальные значения вербального интеллекта в выборках студентов физического (n₁=14) и психологического (п₂=12) факультетов

Студенты-физики	Студенты - психологи
Код имени испытуемого	Показатели вербального интеллекта	Код имени испытуемого	Показатель вербального интеллекта
1.	И.А	132	1.	Н.Т.	126
2.	К.А.	134	2.	О.В.	127
3.	К.Е.	124	3.	Е.В.	132
4.	П.А.	132	4.	Ф.О.	120
5.	С.А.	135	5.	И.Н.	119
6.	СтЛ.	132	6.	И.Ч.	126
7.	Т.А.	131	7.	И.8.	120
8.	Ф.А.	132	8.	КО.	123
9.	Ч.И.	121	9.	Р.Р.	120
10.	Ц.А.	127	10.	Р.И.	116
11.	См.А.	136	11.	O.K.	123
12.	КАн.	129	12.	Н.К.	115
13.	Б.Л.	136
14.	Ф.В.	136

Упорядочим значения в обеих выборках, а затем сформулируем гипотезы:

H₀: Студенты-физики не превосходят студентов-психологов по уровню вербального интеллекта.

H₁: Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта.

р а при Q₉_Mn<Q

мы

₁₍p

Таблица 2.2.

Упорядоченные по убыванию вербального интеллекта ряды индивидуальных значении в двух студенческих выборках

1 ряд – студенты-физики	2 ряд – студенты-психологи
1	См.А	136	S₁
2	Б.Л.	136
3	Ф.В.	136
4	С.А.	135
5	К.А.	134
6	И.К.	132				1	Е.В.	132
7	П.А.	132
8	Ст.А.	132
9	Ф.А.	132
10	Т.А.	131
11	К.Ан.	129
12	Ц.А.	127		2	О.В.	127
				3	Н.Т.	126
				4	И.Ч.	126
13	К.Е.	124
				5	К.О.	123
				6	О.К.	123
14	Ч.И.	121
			S₂	7	Ф.О.	120
		8	И.В.	120
		9	Р.Р.	120
		10	И.Н.	119
		11	Р.И.	116
		12	Н.К.	115

Как видно из Табл. 2.2, мы правильно обозначили ряды: первый, тот, что "выше" - ряд физиков, а второй, тот, что "ниже" - ряд психологов.

По Табл. 2.2 определяем количество значений первого ряда, которые больше максимального значения второго ряда: S₁=5.

Теперь определяем количество значений второго ряда, которые меньше минимального значения первого ряда: S₂=6.

Вычисляем Q_эмп по формуле:

Q_эмп= S₁+ S₂= 5+6 =11

По Табл.1 Приложения 1 определяем критические значения Q для n₁=14, n₂=12:

Q_кр=

Ясно, что чем больше расхождения между выборками, тем больше величина Q. Н₀отклоняется при Q_эмп ≥Qкр, а при Q_эмп < Q_крмы будем вынуждены принять Н_0.

Построим «ось значимости»

	Q_0,05		Q_0,01
…		?		Q_эмп	!
	7		9	11

Q_эмп > Q_кр(p≤0.01)

Ответ: H₀ отклоняется.

Принимается H₁. Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта (р<0,01). Отметим, что в тех случаях, когда эмпирическая величина критерия оказывается на границе зоны незначимости, мы имеем право утверждать лишь, что различия достоверны при р<0,05, если же оно оказывается между двумя критическими значениями, то мы можем утверждать, что р< 0,05.

Если эмпирическое значение критерия оказывается на границе, мы можем утверждать, что р< 0,01, если оно попадает в зону значимости, мы можем утверждать, что р< 0,01.

Поскольку уровень значимости выявленных различий достаточно высок (р<0,01), мы могли бы на этом остановиться. Однако если исследователь сам психолог, а не физик, вряд ли он на этом остановится. Он может попробовать сопоставить выборки по уровню невербального интеллекта, поскольку именно невербальный интеллект определяет уровень интеллекта в целом и степень его организованности (см., например: Бергер М.А., Логинова Н.А., 1974).

Мы вернемся к этому примеру при рассмотрении критерия Манна-Уитни и попытаемся ответить на вопрос о соотношении уровней невербального интеллекта в двух выборках. Быть может, психологи еще окажутся в более высоком ряду!

АЛГОРИТМ 3

Подсчет критерия Q Розенбаума

1.Проверить, выполняются ли ограничения: n_1, n₂≥ 11, n₁≈ n₂

2.Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.

3.Определить самое высокое (максимальное) значение в выборке 2.

4.Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S₁.

5.Определить самое низкое (минимальное) значение в выборке 1.

6.Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S₂.

7.Подсчитать эмпирическое значение Q по формуле: Q=S₁+S₂.

8.По Табл. I Приложения I определить критические значения Q для данных n_1, и n_2. Если Q_эмп равно Q_0,05 или превышает его, Н₀ отвергается.

9.При n_1, n₂ >26 сопоставить полученное эмпирическое значение с Q_кр =8 (р≤0,05) и Q_Kp=10(p≤0,01). Если Q_эмп превышает или по
крайней мере равняется Qкр=8, H₀ отвергается.

Вопрос 2.3 U - критерий Манна-Уитнн

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n_1,n₂≥3 или n₁=2, n₂≥5. И является более мощным, чем критерий Розенбаума.

Описание критерия

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П._Р 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U_эмп, тем более вероятно, что различия достоверны.

Гипотезы

H₀: Уровень признака в группе 2 не ниже уровня признака

в группе 1.

H₁: Уровень признака в группе 2 ниже уровня признака

в группе 1.

Графическое представление критерия U

На Рис. 2.5. представлены три из множества возможных вариантов соотношения двух рядов значений.

В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.

В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна. Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.

В варианте (в) второй ряд ниже первого, но область наложения настолько обширна, что различия между рядами скрадываются.

Рис. 2.5. Возможные варианты соотношении рядов значений в двух выборках; штриховкой обозначены зоны наложения

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдении:

n_1,n₂≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; Однако уже при n_1,n₂>20 ранжирование становится достаточно трудоемким.

На наш взгляд, в случае, если n_1,n₂>20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбинации с критерием λ, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками. Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.

Пример

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума мы в предыдущем параграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.

Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Таблица 2.3

Индивидуальные значения невербального интеллекта в выборках студентов физического (n₁ =14) и психологического (n₂=12) факультетов

Студенты-физики	Студенты - психологи
Код имени испытуемого	Показатели невербального интеллекта	Код имени испытуемого	Показатель невербального интеллекта
1.	И.А	111	1.	Н.Т.	113
2.	К.А.	104	2.	О.В.	107
3.	К.Е.	107	3.	Е.В.	123
4.	П.А.	90	4.	Ф.О.	122
5.	С.А.	115	5.	И.Н.	117
6.	СтЛ.	107	6.	И.Ч.	112
7.	Т.А.	106	7.	И.8.	105
8.	Ф.А.	107	8.	КО.	108
9.	Ч.И.	95	9.	Р.Р.	111
10.	Ц.А.	116	10.	Р.И.	114
11.	См.А.	127	11.	O.K.	102
12.	КАн.	115	12.	Н.К.	104
13.	Б.Л.	102
14.	Ф.В.	99

Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

Правила ранжирования

1. Меньшему значению начисляется меньший ранг.

Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если п=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

и т.д.

3. Общая сумма рангов должка совпадать с расчетной, которая определяется по формуле:

где N – общее количество ранжируемых наблюдений (значений).

Несовпадение реальной и расчётной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить её.

При подсчете критерия U легче всего сразу приучить себя действовать по строгому алгоритму.

АЛГОРИТМ 4

Подсчет критерия U Манна-Уитни

1.Перенести все данные испытуемых на индивидуальные карточки.

2.Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например, синим.

3.Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.

4.Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько у нас (n₁ +n₂).

5.Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой.

6.Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной.

7.Определить большую из двух ранговых сумм.

8.Определить значение U по формуле:

где n₁ - количество испытуемых в выборке 1;

n₂ - количество испытуемых в выборке 2;

Т_х - большая из двух ранговых сумм;

n_x - количество испытуемых в группе с большей суммой рангов. 9. Определить критические значения U по Табл. II Приложения

Если U_эмп>U_Kp _0,05, Н₀ принимается.

Если U_эмп≤U_Kp _0,05, Н_о отвергается. Чем меньше значения U, тем

достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Студенты-физики (n₁ =14)	Студенты-психологи (n₂ =12)
Показатель невербального интеллекта	Ранг	Показатель невербального интеллекта	Ранг
127	26
		123	25
		122	24
		117	23
116	22
115	20,5
115	20,5
		114	19
		113	18
		112	17
111	15,5	111	15,5
		108	14
107	11.5	107	115
107	11,5
107	11,5
106	9
		105	8
104	6.5	104	6,5
102	4,5	102	4,5
99	3
95	2
90	1
Суммы	1501	165	1338	186
Средние	107.2		111,5

Общая сумма рангов: 165+186=351.

Расчетная сумма:

Равенство реальной и расчетной сумм соблюдено.

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов.

Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:

H₀: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

H₁: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпирическую величину U:

Поскольку в нашем случае n₁не равно n₂ подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п_х:

Такую проверку рекомендуется производить в некоторых руководствах (Рунион Р., 1982; Greene J., D'Olivera M., 1989). Для сопоставления с критическим значением выбираем меньшую величину U: U_эмп =60.

По Табл. II Приложения 1 определяем критические значения для соответствующих п, причем меньшее п принимаем за n₁ (n₁ = 12) и отыскиваем его в верхней строке Табл. II Приложения 1, большее n принимаем за п₂ (п₂ = 14), и отыскиваем его в левом столбце Табл. II Приложения 1.

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если

Построим "ось значимости".

U_эмп >U_кр

Ответ: Н₀ принимается. Группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).

Вопрос 4 Н - критерий Крускала-Уоллиса

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.

Описание критерия

Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).

Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H₀: Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.

H₁: Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.

Графическое представление критерия Н

Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (Рис. 2.6 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 2.6 (б)), то различия между выборками оказываются недостоверными.

Рис. 2.6. 2 возможных варианта соотношения рядов значений в трех выборках; штриховкой отмечены зоны наложения

Ограничения критерия Н

При сопоставлении 3-х выборок допускается, чтобы в одной из них n=3, а двух других п=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (Р≤0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р≤0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица предусмотрена только для трех выборок и (n_1,n_2,n₃)≤5.

При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия X², поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению X² (Носенко И.А., 1981; J. Greene, M. DOlivera, 1982).

Количество степеней свободы при этом определяется по формуле: v=c-l где с - количество сопоставляемых выборок.

3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½*[c*(c-1)]^*1. Для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ*.

Пример

В эксперименте по исследованию интеллектуальной настойчивости (Е.В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в Табл. 2.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.

Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?

Таблица 2.5

Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N=22)

	Группа 1: анаграмма ФОЛИТОН (n₁=4)	Группа 2: анаграмма КАМУСТО (n₂=8)	Группа 3: анаграмма СНЕРАКО (n₃=6)	Группа 4: анаграмма ГРУТОСИЛ (n₄=4)
1	145	145	128	60
2	194	210	283	2361
3	731	236	469	2416
4	1200	385	482	3600
5		720	1678
б		848	2081
7		905
8		1080
Сум-мы	2270	4549	5121	8437
Сред-ние	568	566	854	2109

Сформулируем гипотезы.

Н₀: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.

H₁: 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток нх решения.

Теперь познакомимся с алгоритмом расчетов.

АЛГОРИТМ 5

Подсчет критерия Н Крускала-Уоллиса

1.Перенести все показатели испытуемых на индивидуальные карточки.

2.Пометить карточки испытуемых группы 1 определенным цветом, например, красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым к желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)

3.Разложить все карточки в единый ряд по степени нарастания признака, несчитаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4.Проранжкровать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5.Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

6.Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.

7.Подсчитать значение критерия Н по формуле:

где N- общее количество испытуемых в объединенной выборке;

п - количество испытуемых в каждой группе;

Т- суммы рангов по каждой группе.

8а. При количестве групп с=3, n_1,n_2,n₃≤5, определить критические значения и соответствующий им уровень значимости по Табл. IV Приложения 1.

Если Н_эмп равен или превышает критическое значение H_0,05 H₀ отвергается.

'с - количество выборок.

8б. При количестве групп с>3 или количестве испытуемых n_1,n_2,n₃≤5определить критические значения χ² по Табл. IX Приложения 1.

Если Н_эмп равен или превышает критическое значение χ² , Но отвергается.

Воспользуемся этим алгоритмом при решении задачи о неразрешимых анаграммах. Результаты работы по 1-6 шагам алгоритма представлены в Табл. 2.6.

Таблица 2.6

Подсчет ранговых сумм по группам испытуемых, работавших над четырьмя неразрешимыми анаграммами

Группа 1: анаграмма ФОЛИТОН (n₁=4)	Группа 2: анаграмма КАМУСТО (n₂=8)	Группа 3: анаграмма СНЕРАКО (n₃=6)	Группа 4: анаграмма ГРУТОСИЛ (n₄=4)
Длитель-ность	Ранг	Длитель-ность	Ранг	Длительность	Ранг	Длитель-ность	Ранг
						60	1
				128	2
145	3.5	145	3.5
194	5
		210	6
		236	7
				283	8
		385	9
				469	10
				482	11
		720	12
731	13
		848	14
		905	15
		1080	16
1200	17
				1678	18
				2081	19
						2361	20
						2416	21
						3600	22
Суммы	38,5		82,5		68		64
Средние	9.6		10,3		11.3		16,0

Общая сумма рангов =38,5+82,5+68+64=253.

Расчетная сумма рангов:

Равенство реальной и расчетной сумм соблюдено.

Теперь определяем эмпирическое значение Н:

Поскольку таблицы критических значений критерия Н предусмотрены только для количества групп с = 3, а в данном случае у нас 4 группы, придется сопоставлять полученное эмпирическое значение Н с критическими значениями χ². Для этого вначале определим количество степеней свободы V для с=4:

V = c- 1 = 4 - 1 = 3

Теперь определим критические значения по Табл. IX Приложения 1 для V=3:

Ответ: H₀ принимается: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.

Вопрос 5. S - критерий тенденций Джонкира

Описание этого критерия дается с использованием руководства J.Greene, M.D'Olivera (1982). Он описан также у М. Холлендера, ДА. Вулфа (1983).

Назначение критерия S

Критерий S предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок.

Описание критерия S

Критерий S позволяет нам упорядочить обследованные выборки по какому-либо признаку, например, по креативности, фрустрацноннон толерантности, гибкости и т.п.

Мы сможем утверждать, что на первом месте по выраженности исследуемого признака стоит выборка, скажем, Б, на втором - А, на третьем - В и т.д. Интерпретация полученных результатов будет зависеть от того, по какому принципу были образованы исследуемые выборки. Здесь возможны два принципиально отличных варианта.

1) Если обследованы выборки, различающиеся по качественным признакам (профессии, национальности, месту работы и т. п.), то с помощью критерия S мы сможем упорядочить выборки по количественно измеряемому признаку (креативности, фрустрационной толерантности, гибкости и т.п.).

2) Если обследованы выборки, различающиеся или специально сгруппированные по количественному признаку (возрасту, стажу работы, социометрическому статусу и др.), то, упорядочивая их теперь уже по другому количественному признаку, мы фактически устанавливаем меру связи между двумя количественными признаками. Например, мы можем показать с помощью критерия S, что при переходе от младшей возрастной группы к старшей фрустрационная толерантность возрастает, а гибкость, наоборот, снижается.

Меру связи между количественно измеренными переменными можно установить с помощью вычисления коэффициента ранговой корреляции или линейной корреляции. Однако критерий тенденции S имеет следующие преимущества перед коэффициентами корреляции:

а) критерий тенденций S более прост в подсчете;

б) он применим и в тех случаях, когда один из признаков варьирует в узком диапазоне, например, принимает всего 3 или 4 значения, в то время как при подсчете ранговой корреляции в этом случае мы получаем огрубленный результат, нуждающийся в поправке на одинаковые ранги.

Критерий S основан на способе расчета, близком к принципу критерия Q Розенбаума. Все выборки располагаются в порядке возрастания исследуемого признака, при этом выборку, в которой значения в общем ниже, мы помещаем слева, выборку, в которой значения выше, правее, и так далее в порядке возрастания значений. Таким образом, все выборки выстраиваются слева направо в порядке возрастания значений исследуемого признака.

При упорядочивании выборок мы можем опираться на средние значения в каждой выборке или даже на суммы всех значений в каждой выборке, потому что в каждой выборке должно быть одинаковое количество значений. В противном случае критерий S неприменим (подробнее об этом см. в разделе "Ограничения критерия S").

Для каждого индивидуального значения подсчитпывается количество значений справа, превышающих его по величине. Если тенденция возрастания признака слева направо существенна, то большая часть значений справа должна быть выше. Критерий S позволяет определить, преобладают ли справа более высокие значения или нет. Статистика S отражает степень этого преобладания. Чем выше эмпирическое значение S, тем тенденция возрастания признака является более существенной.

Следовательно, если S_эмп равняется критическому значению или превышает его, нулевая гипотеза может быть отвергнута.

Гипотезы

H₀: Тенденция возрастания значений признака при переходе от выборки к выборке является случайной.

H₁: Тенденция возрастания значений признака при переходе от выборки к выборке не является случайной.

Графическое представление критерия

Фактически критерий S позволяет определить, достаточно ли велика суммарная зона неперекрещивающихся значений в сопоставляемых выборках: действительно ли в первом ряду значения в общем ниже, чем в последующих, во втором - ниже, чем в оставшихся справа последующих и т. д.

Графически это представлено на Рис. 2.7.

На Рис. 2.7(а) у сопоставляемых рядов значений есть непере-крещивающиеся зоны, но их суммарная площадь может оказаться слишком небольшой, чтобы признать тенденцию возрастания признака существенной.

На рис. 2.7(6) сумма неперекрещивающихся зон, по-видимому, достаточно велика, чтобы тенденция возрастания признака была признана достоверной. Точно определить это мы сможем лишь с помощью критерия S.

Рис. 2.1. Варианты соотношения 3-х рядов значений: S_1-2 - зона тех значений 2-го ряда, которые выше всех значений 1-го ряда; S_1-3 - зона тех значений 3-го ряда, которые выше всех значений 1-го ряда; S_2-3 - зона тех значений 3-го рада, которые выше всех значений 2-го ряда

Ограничения критерия S

1. В каждой из сопоставляемых выборок должно быть одинаковое число наблюдений. Если число наблюдений неодинаково, то придется искусственно уравнивать выборки, утрачивая при этом часть полученных наблюдений.

Например, если в двух выборках по 7 наблюдений, а в третьей - 11, то 4 из них необходимо отсеять. Для этого карточки с индивидуальными значениями переворачиваются лицевой стороной вниз и перемешиваются, а затем из них случайным образом извлекается 7 карточек. Оставшиеся 4 карточки с индивидуальными значениями не включаются в дальнейшее рассмотрение и в подсчет критерия S. Ясно, что при таком подходе часть информации утрачивается, и общая картина может быть искажена.

Если исследователь хочет избежать этого, ему следует воспользоваться критерием Н, позволяющим выявить различия между тремя и более выборками без указания на направление этих различий (см. вопрос 4).

2. Нижний порог: не менее 3 выборок и не менее 2 наблюдений в каждой выборке. Верхний порог в существующих таблицах: не более 6 выборок и не более 10 наблюдений в каждой выборке (см. Табл. III Приложения 1 для определения критических значений S). При большем количестве выборок или наблюдений в них придется пользоваться критерием Н Крускала-Уоллиса.

Пример

Выборка претендентов на должность коммерческого директора в Санкт-Петербургском филиале зарубежной фирмы была обследована с помощью Оксфордской методики экспресс-видеодиагностики, использующей диагностические ролевые игры. Были обследованы 20 мужчин в возрасте от 25 до 40 лет, средний возраст 31,5 года. Оценки производились по 15 значимым, с точки зрения зарубежной фирмы, психологическим качествам, обеспечивающим эффективную деятельность на посту коммерческого директора. Одним из этих качеств была "Авторитетность". В конце 8-часового сеанса диагностических ролевых игр и упражнений проводился социометрический опрос участников группы, в котором они должны были ответить на вопрос: "Если бы я сам был представителем фирмы, я выбрал бы на должность коммерческого директора: 1).... 2).... 3)...." Участники знали, что каждый их шаг является материалом для диагностики, и что в данном случае, в частности, проверяется, помимо прочего, их способность к объективному суждению о людях. В результате этой процедуры каждый участник получил то или иное количество выборов от других участников, отражающее его социометрический статус в группе претендентов.

Результаты исследования представлены в Табл. 2.7 (данные Е. В. Сидоренко, И. В. Дермановой, 1991).

Можно ли считать, что группы с разным статусом различаются и по уровню авторитетности, определявшейся независимо от социометрии с помощью экспресс-видеодиагностики?

Таблица 2.7

Показатели по шкале Авторитетности в группах с разным социометрическим статусом (N=20)

Номера испытуемых	Группа 1 0 выборов (n₁=5)	Группа 2 1 выбор (n₂=5)	Группа 3 2-3 выбора (n₃=5)	Группа 4 4 и более выборов (n₄=5)
1	5	5	5	9
2	5	6	6	9
3	2	7	7	8
4	5	6	7	8
5	4	4	5	7
Суммы	21	28	30	41
Средние	4,2	5,6	6,0	8,2

Сформулируем гипотезы.

H₀: Тенденция повышения значений по шкале Авторитетности при переходе от группы к группе (слева направо) случайна.

H₁: Тенденция повышения значений по шкале Авторитетности при переходе от группы к группе (слева направо) неслучайна.

Для того, чтобы нам было удобнее подсчитывать количества более высоких значении (S;), лучше упорядочить значения в каждой группе по их возрастанию (Табл. 2.8).

Таблица 2.8

Расчет критерия S при сопоставлении групп с разным социометрическим статусом по показателю Авторитетности (N=20)

Места испыту-емых	Группа 1 0 выборов (n₁=5)	Группа 2 1 выбор (n₂=5)	Группа 3 2-3 выборf (n₃=5)	Группа 4 4 и более выборов (n₄=5)
	Индиви-дуальные значения	S_i	Индиви-дуальные значения	S_i	Индиви-дуальные значения	S_i	Индиви-дуальные значения
1	2	(15)	4	(10)	5	(5)	7
2	4	(14)	5	(8)	5	(5)	8
3	5	(11)	6	(7)	6	(5)	8
4	5	(11)	6	(7)	7	(4)	9
5	5	(11)	7	(4)	7	(4)	9
Суммы		(62)		(36)		(23)

После того, как все индивидуальные значения расположены в порядке возрастания, легко подсчитать, сколько значений справа превышают данное значение слева. Начнем с крайнего левого столбца. Значение "2" превышают все 15 значений из трех правых столбцов; значение "4" - 14 значений из трех правых столбцов; значение "5" превышают 11 значений из трех правых столбцов. Полученные количества "превышений" запишем в скобках слева от каждого индивидуального значения, как это сделано в Табл. 2.8.

Расчет для второго столбца производим по тому же принципу. Мы видим, что значение "4" превышают все 10 значений из оставшихся столбцов справа; значение "5" - 8 значений из столбцов справа и т.д.

Сумма всех чисел в скобках (S₁) составит величину А, которую нам нужно будет подставить в формулу для подсчета критерия S. Однако вначале определим максимально возможное значение А, которое мы получили бы, если бы все значения справа были больше значений слева. Эта величина называется величиной В и вычисляется по формуле:

² Для крайнего правого столбца S, не указываются, поскольку они равны нулю.

где с - количество столбцов (групп);

n - количество испытуемых в каждом столбце (груапе).

В данном случае:

Эмпирическое значение критерия S вычисляется по формуле:

S=2*А- В

где А- сумма всех "превышений" по всем значениям;

В- максимально возможное количество всех "превышений".

В данном случае:

S=[2*[(62+36+23+0)]-150=-92

По Табл. III Приложения 1 определяем критические значения S для с=4, п=5:

Построим "ось значимости".

Мы помним, что критерий S построен на подсчете количества превышающих значений. Чем это количество больше, тем более достоверные различия мы сможем констатировать. Поэтому "зона значимости" простирается вправо, в область более высоких значений, а "зона незначимости" - влево, в область более низких значении.

S_эмп > S_KP. (р≤0.01)

Ответ: H₀ отвергается. Принимается H₁. Тенденция повышения значений по шкале Авторитетности при переходе от группы к группе не случайна (р<0,01).

Отвечая на вопрос задачи, мы можем сказать, что группы с разным статусом различаются по показателю Авторитетности, определявшемуся независимо от социометрической процедуры. Критерий S поэволяет указать на тенденцию этих изменений: с ростом статуса растут и показатели по шкале Авторитетности. Однако мы имеем дело здесь, конечно же, не с причинно-следственными связями, а с сопряженными изменениями двух признаков. Возможно, оба они изменяются под влиянием одних и тех же общих факторов, например, последовательно проявляющейся в поведении привычки к лидерству, внушающей способности или "харизмы".

Теперь мы можем суммировать все сказанное, алгоритмизировав процесс подсчета критерия S.

АЛГОРИТМ 6

Подсчет критерия S Джонкнра

1.Перенести все показатели испытуемых на индивидуальные карточки.

2.Если количества испытуемых в группах не совпадают, уравнять группы, ориентируясь на количество наблюдений в меньшей из групп. Например, если в меньшей из групп n=3, то из остальных групп необходимо случайным образом
извлечь по три карточки, а остальные отсеять.

Если во всех группах одинаковое количество испытуемых (n≤10), можно сразу переходить к п. 3.

3.Разложить карточки первой группы в порядке возрастания признака и занести полученный ряд значений в крайний слева столбец таблицы, затем проделать то же самое для второй группы и занести полученный ряд значений во второй
слева столбец, и так далее, пока не будут заполнены все столбцы таблицы.

4.Начиная с крайнего левого столбца подсчитать для каждого индивидуального значения количество превышающих его значений во всех столбцах справа (Si).
Полученные суммы записать в скобках рядом с каждым индивидуальным значением.

5.Подсчитать суммы показателей в скобках по столбцам.

6.Подсчитать общую сумму, просуммировав все суммы по столбцам. Эту общую сумму обозначить как А.

7.Подсчитать максимально возможное количество превышающих значений (В), которое мы получили бы, если бы все значения справа были выше значений слева:

где с - количество столбцов (сопоставляемых групп);

п - количество наблюдений в каждом столбце (группе),

8.Определить эмпирическое значение S по формуле:
S=2*A-B

9.Определить критические значения S по Табл. III Приложения 1 для данного количества групп (с) и количества испытуемых в каждой группе (n).

Если эмпирическое значение S превышает или по крайней мере равняется критическому значению, H₀ отвергается.

Рекомендация для Вас - Кто виноват.

ВНИМАНИЕ! При выборе критерия рекомендуется пользоваться АЛГОРИТМОМ 7.

Алгоритм принятия решения о выборе критерия для сопоставлений

Поделитесь ссылкой:

Выявление различий в уровне исследуемого признака

Рекомендуемые материалы

Рекомендуемые лекции