Stat_all (727079), страница 8
Текст из файла (страница 8)
Непараметрические
Их еще называют ранговыми методами. Они связаны с расчетами различных коэффициентов. Применяются как отдельно, так и совместно с параметрическими. Особенно эффективны непараметрические методы, когда необходимо измерить связь между качественными признаками. Они проще в вычислении и не требуют никаких предположений о законе распределения исходных статистических данных, т.к. при их расчете оперируют не самими значениями признаков, а их рангами, частотами, знаками и т.д.
Коэффициент Фехнера (коэффициент совпадения знаков)
x | y |
x1 x2 x3 . . . xn | y1 y2 y3 . . . yn |
х = хi - х | y = yi - y |
– + + – + + – | + + – – + – + |
i = | кол-во совпадений – кол-во несовпадений |
общее количество отклонений |
i = | 3 – 4 | = – | 1 |
7 | 7 |
Коэффициент совпадения знаков может принимать значения от –1 до +1. Чем ближе значение коэффициента к |1|, тем связь более тесная. Знак коэффициента говорит о направлении, величина – о силе связи.
Коэффициенты ассоциации и контингенции
Используются для измерения связи между двумя качественными признаками, состоящими только из двух групп.
| . . . . . | . . . . . | Итого |
. . . . . | a | b | a + b |
. . . . . | d | c | c + d |
Итого | a + c | b + d | a + b+ c+ d |
Посещение | Неудовлетв. | Положит. | Итого |
Посещали | 86 | 14 | 100 |
Не посещали | 22 | 28 | 50 |
Итого | 108 | 42 | 150 |
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если или
.
Коэффициент Спирмана (ранговый коэффициент)
Рассчитывается по следующей формуле: .
№ п/п | Себестоимость | Средняя з/п | Ранги | di = Rz - Rf | di2 | |
Rz | Rf | |||||
1. | 68,8 | 168,5 | 3 | 6 | -3 | 9 |
2. | 70,2 | 158,7 | 5 | 1 | 4 | 16 |
3. | 71,4 | 171,7 | 7 | 8 | -1 | 1 |
4. | 78,5 | 183,9 | 10 | 10 | 0 | 0 |
5. | 66,9 | 160,4 | 2 | 2 | 0 | 0 |
6. | 69,7 | 165,2 | 4 | 5 | -1 | 1 |
7. | 72,3 | 175,0 | 8 | 9 | -1 | 1 |
8. | 77,5 | 170,4 | 9 | 7 | 2 | 4 |
9. | 65,2 | 162,7 | 1 | 3 | -2 | 4 |
10. | 70,7 | 163,0 | 6 | 4 | 2 | 4 |
Итого | 40 |
Коэффициент Спирмана может принимать значения от –1 до +1, причем чем ближе значение коэффициента к |1|, тем связь более тесная. Знак коэффициента говорит о направлении связи.
Непараметрические
Главным параметрическим методом является корреляционный. Он заключается в нахождении уравнения связи, в котором результативный признак зависит только от интересующего нас фактора (или нескольких факторов). Все прочие факторы, также влияющие на результат, принимаются за постоянные средние.
Удобной формой изучения связи является корреляционная таблица. В этой таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.
Рассмотрим следующую схему:
Час. прод. | 3-5 | 5-7 | 7-9 | 9-11 | fy |
10-15 | 5 | 5 | |||
15-20 | 2 | 4 | 2 | 8 | |
20-25 | 6 | 1 | 7 | ||
25-30 | 6 | 6 | |||
30-35 | 2 | 2 | 4 | ||
fx | 7 | 10 | 11 | 2 | 30 |
По такой таблице можно сделать выводы (1) о том, существует ли связь, (2) о ее направлении и (3) о ее интенсивности (при условии существования связи).
В указанных уравнениях величина результативного признака представляет собой функцию только одного фактора х. Все прочие факторы приняты за постоянную и выражены параметром а0.
Таким образом, при выравнивании фактические значения у заменяются значениями, вычисленными по уравнению. Поскольку все факторы, определяющие у, являются постоянными средними величинами, постольку и выровненные значения (ух) являются средними величинами ( ).
Параметры а1 (а в уравнении параболы и а2) называются коэффициентами регрессии. В корреляционном анализе эти параметры показывают меру, в которой изменяется у при изменении х на одну единицу.
При линейной зависимости коэффициент регрессии а1 называется также коэффициентом пропорциональности. Он положителен при прямой зависимости, отрицателен – при обратной.
Параметр же а0 показывает влияние на результативный фактор множества неучтенных факторов.
Уравнение регрессии имеет большую ценность, поскольку позволяют экстраполировать показатели связи за пределы исследованных данных.
Корреляционное отношение для выровненных значений результативного признака рассчитывается так же, как и для значений, полученных на основе группировок.
В этом случае вся вариация результативного признака за счет всех факторов обозначается
Вариация результативного признака за счет всех факторов, кроме х, равна