130433 (Понятие о корреляции и корреляционном анализе в психологии), страница 2
Описание файла
Документ из архива "Понятие о корреляции и корреляционном анализе в психологии", который расположен в категории "". Всё это находится в предмете "психология" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "контрольные работы и аттестации", в предмете "психология" в общих файлах.
Онлайн просмотр документа "130433"
Текст 2 страницы из документа "130433"
Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.
2. Распределения переменных X и Y должны быть близки к нормальному.
3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
4. Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы k = n - 2.
3.2 Коэффициент корреляции рангов Спирмена
Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин. Правила ранжирования варьирующих величин были описаны выше (см. 1.4.1.).
Величина коэффициента линейной корреляции Спирмена также лежит в интервале +1 и -1. Он, как и коэффициент Пирсона, может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.
В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего чем 20 числа признаков — затруднителен. Возможно, что именно поэтому таблица критических значений рангового коэффициента корреляции рассчитана лишь для сорока ранжируемых признаков (n < 40, таблица 21 Приложения 1). В случае использования большего чем 40 числа ранжируемых признаков, уровень значимости коэффициента корреляции следует находить по таблице для коэффициента корреляции Пирсона.
Ранговый коэффициент линейной корреляции Спирмена подсчитывается по формуле:
(формула 3)
где n — количество ранжируемых признаков (показателей, испытуемых)
D —разность между рангами по двум переменным для каждого испытуемого
∑(D2) — сумма квадратов разностей рангов.
3.3 Случай одинаковых (равных) рангов
При наличии одинаковых рангов формула расчета коэффициента линейной корреляции Спирмена будет несколько иной. В этом случае в формулу вычисления коэффициентов корреляции добавляются два новых члена, учитывающие одинаковые ранги. Они называются поправками на одинаковые ранги и добавляются в числитель расчетной формулы.
(формула 4.1)
(формула 4.2)
где n — число одинаковых рангов в первом столбце,
k — число одинаковых рангов во втором столбце.
Если имеется две группы одинаковых рангов в каком либо столбце то формула поправки несколько усложняется:
(формула 4.3)
где n — число одинаковых рангов в первой группе ранжируемого столбца,
k – число одинаковых рангов в второй группе ранжируемого столбца. Модификация формулы в общем случае такова:
(формула 4.4)
Для применения коэффициента корреляции Спирмена, необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть получены в порядковой (ранговой) шкале, но могут быть измерены также в шкале интервалов и отношений.
2. Характер распределения коррелируемых величин не имеет значения.
3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
4. Таблицы для определения критических значений коэффициента корреляции Спирмена рассчитаны от числа признаков равных n = 5 до n = 40 и при большем числе сравниваемых переменных следует использовать таблицу для пирсоновского коэффициента корреляции . Нахождение критических значений осуществляется при k = n.
3.4 Расчет уровней значимости коэффициентов корреляции
Все коэффициенты корреляции, которые будут рассмотрены ниже, не имеют стандартных таблиц для нахождения критических значений. В этих случаях поиск критических значений осуществляется с помощью t-критерия Стьюдента по формуле:
((формула 5)
где rэмп — коэффициент корреляции,
n— число коррелируемых признаков, а величина Тф проверяется на уровень значимости по таблице для t-критерия Стьюдента. Число степеней свободы в этом случае будет равно k = n — 2.
Однако с помощью формулы можно проводить оценку уровней значимости и коэффициентов корреляции Пирсона и Спирмена.
3.5 Коэффициент корреляции «φ»
При сравнении двух переменных, измеренных в дихотомической шкале, мерой корреляционной связи служит так называемый коэффициент «φ», или, как назвал эту статистику ее автор К. Пирсон, — «коэффициент ассоциации».
Величина коэффициента «φ»лежит в интервале +1 и -1. Он может быть как положительным, так и отрицательным, характеризуя направление связи двух дихотомически измеренных признаков.
В общем виде формула вычисления коэффициента корреляции «φ» выглядит так:
(формула 6)
где рх — частота или доля признака, имеющего 1 по X,
(1 - рх) — доля или частота признака, имеющего 0 по X;
ру — частота или доля признака, имеющего 1 по Y,
(1 - ру) — доля или частота признака, имеющего 0 по Y,
рху — доля или частота признака, имеющая 1 одновременно как по X, так и по Y.
Частоты вычисляется следующим образом: подсчитывается количество 1 в переменной Х и полученная величина делится на общее число элементов этой переменной — N. Аналогично подсчитываются частоты для переменной Y. Обозначение рху — соответствует частоте или доле признаков, имеющих единицу как по Х так и по Y.
Второй способ вычисления коэффициента «φ»
Коэффициент «φ» можно вычислить, не применяя метод кодирования. В этом случае используется так называемая четырехпольная таблица, или таблица сопряженности. Каждую клетку таблицы обозначим соответствующими буквами а, b, с и d.
Приведем общую формулу расчета коэффициента «φ» по таблице сопряженности:
(формула 7)
Для применения коэффициента корреляции «φ» необходимо соблюдать следующие условия:
1. Сравниваемые признаки должны быть измерены в дихотомической шкале.
2. Число варьирующих признаков в сравниваемых переменных Х и Y должно быть одинаковым.
3. Для оценки уровня достоверности коэффициента «φ» следует пользоваться формулой (5) и таблицей критических значений для t-критерия Стьюдента при k = n - 2.
3.6 Коэффициент корреляции «τ» Кендалла
Коэффициент корреляции «τ» (тау) Кендалла относится к числу непараметрических, т.е. при вычислении этого коэффициента не играет роли характер распределения сравниваемых переменных. Коэффициент «τ» предназначен для работы с данными, полученными в ранговой шкале. Иногда этот коэффициент можно использовать вместо коэффициента корреляции Спирмена, поскольку способ его вычисления более прост. Он основан на вычислении суммы инверсий и совпадений.
Для применения коэффициента корреляции «т» Кендалла необходимо соблюдать следующие условия:
1. Сравниваемые признаки должны быть измерены в порядковой шкале.
2. Число варьирующих признаков в сравниваемых переменных Х и Y должно быть одинаковым.
3. Величина «τ» Кендалла независима от закона распределения величин Х и Y.
4. При расчетах этого коэффициента не допускается использование одинаковых рангов.
5. Для оценки уровня достоверности коэффициента «τ» следует пользоваться формулой (5) и таблицей критических значений для t-критерия Стьюдента при k= n -1.
3.7 Бисериальный коэффициент корреляции
В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в шкале интервалов или отношений (переменная Y), используется бисериальный коэффициент корреляции. Мы помним, что переменная X, полученная в дихотомической шкале, принимает только два значения (кода) 0 и 1. Особо подчеркнем, что несмотря на то, что этот коэффициент изменяется в диапазоне от - 1 до + 1 его знак для интерпретации результатов не имеет значения. Это исключение из общего правила.
Расчет этого коэффициента производится по формуле:
(формула 8)
где Х1 среднее по тем элементам переменной Y, которым соответствует код (признак) 1 в переменной X. Здесь n1 — количество единичек в переменной X.
Х0 среднее по тем элементам переменной Y, которым соответствует код (признак) 0 в переменной X. Здесь n0 — количество нулей в переменной X.
N = n1 + n0 — общее количество элементов в переменной X.
Sy— стандартное отклонение переменной Y, вычисляемое по формуле
Значимость бисериального коэффциента корреляции оценивается по величине Тф t-критерия Стьюдента с числом степеней свободы k = n - 2.
Для применения бисериального коэффициента корреляции необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть измерены в разных шкалах: одна Х — в дихотомической шкале; другая Y—в шкале интервалов или отношений.
2. Предполагается, что переменная Y имеет нормальный закон распределения.
3. Число варьирующих признаков в сравниваемых переменных Х и Y должно быть одинаковым.
4. Для оценки уровня достоверности бисериального коэффициента корреляции следует пользоваться формулой (5) и таблицей критических значений для t-критерия Стьюдента при k = n - 2.
3.8 Рангово-бисериальный коэффициент корреляции
В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в ранговой шкале (переменная Y), используется рангово-бисериальный коэффициент корреляции. Мы помним, что переменная X, измеренная в дихотомической шкале, принимает только два значения (кода) 0 и 1. Особо подчеркнем: несмотря на то что этот коэффициент изменяется в диапазоне от -1 до +1, его знак для интерпретации результатов не имеет значения. Это еще одно исключение из общего правила.
Расчет этого коэффициента производится по формуле:
(формула 9)
где Х1 — средний ранг по тем элементам переменной Y, которым соответствует код (признак) 1 в переменной X;
Для применения рангово-бисериального коэффициента корреляции необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть измерены в разных шкалах: одна X— в дихотомической шкале; другая Y—в ранговой шкале.
2. Число варьирующих признаков в сравниваемых переменных Х и Y должно быть одинаковым.
3. Для оценки уровня достоверности рангово-бисериального коэффициента корреляции следует пользоваться формулой (5) и таблицей критических значений для t-критерия Стьюдента при k = n - 2.
3.9 Корреляционное отношение Пирсона η
Все рассмотренные выше коэффициенты корреляции служат для выявления только линейной зависимости между признаками. Для измерения нелинейной зависимости К. Пирсон предложил показатель, который он назвал корреляционным отношением. Напомним, что коэффициент корреляции rxy(формула 11.1), который был введен Пирсоном, характеризует связь между переменными Х и Y с точки зрения прямой или обратной пропорциональности, иными словами, получаемая связь между переменными является согласованной и такой, что с увеличением одной переменной другая (в среднем) либо только увеличивается, либо только уменьшается (в среднем). При этом в первом случае получается положительный коэффициент корреляции, во втором отрицательный.
Корреляционное отношение описывает искомую связь, условно говоря, с двух сторон: со стороны переменной Х по отношению к Y, и со стороны переменной Y по отношению к X. Соответственно этому корреляционное отношение представляет собой два показателя, обозначаемые как hyx и hxy. Они вычисляются отдельно друг от друга. Однако они связаны между собой, поскольку при строго линейной зависимости между переменными Х и Y имеет место равенство hyx = hxy В этом случае величины обоих показателей корреляционного отношения совпадают с величиной коэффициента корреляции Пирсона.
Показатели корреляционного отношения вычисляются по следующим двум формулам:
(формула 10.1)
(формула 10.2)
здесь х и у общие, а хy и уx — групповые средние арифметические, fy и fx частоты рядов X и Y. Согласно этим формулам оба показателя всегда положительны и располагаются в интервале от 0 до +1.
Подчеркнем, что, как правило, hyx ≠ hxy. Равенство между этими коэффициентами возможно лишь при наличии строго линейной связи между коррелируемыми переменными. Именно поэтому различие между hyx и hxy убудет означать наличие не линейной, а связи более сложного типа между коррелируемыми признаками.
Для вычисления корреляционного соотношения hyx (Y по X) или hxy (X по Y) необходимо выполнить следующие действия:
1) расположить по порядку исходные данные по Х от меньшей величины к большей, при этом сохранив значения соответствующих величин У по отношению к Х;
2) определить частоты переменной Х — обозначение fx;
3) подсчитать арифметические (частные) средние по переменной Y для соответствующей частоты fx — обозначение уx ;
4) найти варианты (неповторяющиеся значения) величины Х — обозначение хi;
5) расположить по порядку исходные данные по Y от меньшей величины к большей, при этом сохранив значения соответствующих величин Х по отношению к Y;
6) определить частоты переменной Y— обозначение fy;
7) подсчитать арифметические (частные) средние по переменной Х для соответствующей частоты fy — обозначение хy;
8) найти варианты (неповторяющиеся значения) переменной Y — обозначение yi;
9) определить общие средние по переменной Х и Y обозначение x и у ;
10) произвести расчет по формулам (10.1) и (10.2);
11) определить уровень значимости полученных показателей корреляционного отношения но таблице критических значений для t-критерия Стьюдента при k = n — 2.
Разумеется, корреляционное отношение Пирсона не дает возможности установить характер выявленной зависимости — она может быть параболической, кубической, логарифмической и др. Из результатов анализа ясно только одно: связь между переменными Х и Y носит нелинейный характер. Более точно характер связи можно определить с помощью метода регрессионного анализа.
Для применения корреляционного отношения Пирсона необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть измерены в шкале интервалов или отношений.
2. Предполагается, что обе переменные имеют нормальный закон распределения.
3. Число варьирующих признаков в сравниваемых переменных Х и У должно быть одинаковым.