Популярные услуги

Главная » Лекции » Социология » Анализ данных в социологии » Анализ взаимосвязей качественных и количественных переменных

Анализ взаимосвязей качественных и количественных переменных

2021-03-09СтудИзба

4. Анализ взаимосвязей качественных и количественных переменных

Рассмотренные ранее методы анализа одномерных распределений и таблиц сопряженности были направлены на построение описатель­ных, а не объяснительных моделей изучаемых явлений. Действитель­но, даже анализ таблиц сопряженности, вычисление коэффициентов связи в этих таблицах подразумевают фиксацию статистических взаи­мосвязей переменных, а на основе этих выявленных взаимосвязей со­циолог начинает конструировать объяснительные модели, привле­кая социологические теории, свое знание социальной реальности, т.е. ту информацию, которая в анализе данных отсутствует. Как уже отмечалось, ни один математико-статистический метод не может по­строить объяснительной модели, однако существует достаточно мно­го методов проверки тех моделей, которые конструирует социолог.

Прежде всего, при анализе социологических данных нас интере­суют причинные модели, в которых некий показатель выступает как следствие каких-то причин. При таком анализе интересует то, на­сколько, в какой степени эти причины определяют данное следствие. Целый ряд технических проблем, и прежде всего различия в уровне измерения переменных-причин и переменных-следствий, приводит к тому, что для проверки корректности выдвигаемых социологами од­нотипных причинных моделей используются различные математико-статистические методы. В данной главе мы рассмотрим методы, позволяющие строить причинные модели в ситуации, когда перемен­ная-следствие измерена по метрической шкале, а переменные-причи­ны — по неметрическим шкалам (порядковым или номинальным).

Визуализация различий средних значений

Достаточно распространенная задача, с которой сталкивается социо­лог еще на этапе описания собранных данных, это демонстрация сред­них значений каких-то количественных показателей в социальных, демографических или каких-то иных группах. Например, необходимо сопоставить величину средней заработной платы в группах респон­дентов, опрошенных в разных типах населенных пунктов, либо срав­нить средний возраст людей, проголосовавших за разных кандидатов на выборах, и т.п.

Данный тип задач напоминает задачи описательного анализа с помощью одномерных частотных распределений, однако в рассмат­риваемом случае нам требуется получить средние значения количе­ственного показателя не во всей выборке, а отдельно по нескольким группам. Так же как и при анализе одномерных распределений, ре­зультатом решения означенной задачи являются либо статистические характеристики, либо графические формы представления данных.

Построение статистических таблиц в рамках пакета программ SPSS выполняется с помощью специальной команды Means в рамках блока команд Compare Means.

Приме сравнения уровней зара­ботной платы в населенных пунктах разного типа показывает, что средняя заработная плата различается весьма и весьма существенно, что, вроде бы, избавляет нас от необходимости проведения дальней­шего статистического анализа. Визуальная убедительность (особенно рис. 3.6) полученных различий сама подталкивает нас к мысли, что мы доказали, нашли достаточно веское объяснение различий в уров­не заработной платы в нашей стране — это то, что респонденты про­живают в населенных пунктах разного типа.

Однако важно понимать, что, двигаясь по такому пути работы с данными, мы, на самом деле, ничего не доказали. На этом пути мы и не могли ничего доказать, поскольку этот путь — не путь доказательства.

Рассмотрим пример, который не имеет столь очевидного реше­ния. В табл. 4.1 представлены результаты команды Means при оценке различий среднего возраста респондентов, проживающих в населен­ных пунктах разного типа.

Рекомендуемые материалы

Таблица 4.1.

         Средние значения возраста респондентов в населенных пунктах разного типа

Тип населенного пункта

Mean

N

Std. Deviation

Москва, Санкт-Петербург

45,13

229

17,906

Большие города

42,23

663

17,077

Малые города

43,83

887

18,279

Села

45,65

628

18,356

Total

43,99

2407

17,977

Данные табл. 4.1 показывают, что средний возраст респонден­тов, проживающих в населенных пунктах разного типа, различается, хотя различия и не очень велики. Можем ли мы на основании данных табл. утверждать, что средний возраст жителей населенных пунктов разного типа действительно различается, или эти различия носят случайный, статистически незначимый характер? Средства команды Means (равно как и команды графического представления данных) не позволяют нам ответить на этот вопрос.

В блоке команд Compare means представлены две команды, ко­торые решают задачу математического доказательства наличия либо отсутствия различий средних значений. Это команды T-Test и Оnе-Way ANOVA.

Команда T-Test

Команда T-Test (или тест Стьюдента) решает задачу доказательства наличия различий средних значений количественной переменной в усеченном виде, а именно в случае, когда имеются лишь две сравни­ваемые группы. Таким образом, если мы хотим ответить на вопрос о том, различается ли средний возраст у жителей населенных пунк­тов разного типа, мы должны будем выполнить эту команду несколько раз, попарно сравнивая разные типы населенных пунктов.

Есть три разновидности команды T-Test, каждая из которых со­ответствует разным исследовательским задачам.

Команда T-Test для сравнения двух независимых выборок

Пусть мы имеем две группы респондентов, для каждой из которых измерены средние значения некоторой количественной переменной. Для социологических исследований важное допущение о том, что эти две группы (две выборки) являются независимыми, почти всегда вы­полняется. Действительно, если мы сравниваем выборки в двух ти­пах населенных пунктов либо выборки мужчин и женщин и т.п., мы знаем, что сбор данных в этих группах выполняется независимо. Дру­гими словами то, как отвечали женщины, никак не влияло на ответы мужчин и т.п.

Команда T-Test для одной выборки

В ходе анализа социологических данных нередко возникает ситуация, когда необходимо сравнить среднее значение какой-то количествен­ной переменной с некоторым фиксированным значением. Например, в ходе исследования образа жизни было выяснено, что в среднем рес­понденты тратят на просмотр телепередач около двух часов. Из мате­риалов предыдущих исследований известно, что год назад респон­денты тратили на этот вид деятельности приблизительно 1,8 часа. Можем ли мы, опираясь на эту информацию, утверждать, что за прошедший год люди стали больше времени проводить у телевизора, или обнаруженная разница носит случайный, статистически не зна­чимый характер? Другая исследовательская ситуация определяется необходимостью оценки репрезентативности проведенного опроса по количественным показателям. Если, скажем, мы провели всероссий­ский опрос, для оценки репрезентативности по параметру «возраст» требуется сопоставить данные опроса с материалами, представляе­мыми органами государственной статистики.

Команда T-Test для парных данных

Еще одна исследовательская задача, которая достаточно часто возни­кает при анализе социологических данных, это ситуация сравнения средних значений двух отдельных переменных на предмет выяснения вопроса о том, среднее значение какой из них больше, а какой — меньше. Например, в ходе панельного социологического исследова­ний «Российский мониторинг экономики и здоровья» (RLMS) одним из направлений изучения является анализ экономических источников жизни россиян. В рамках этого направления в ходе опроса у респон­дентов спрашивали, какое количество овощей, выращенных на соб­ственных приусадебных или дачных участках, они употребили в те­чение последнего года, а какую часть овощей продали. В этой связи интересно выяснить, есть ли разница между размерами доходов семей от продажи овощей.

Однофакторный дисперсионный анализ

Рассмотренные возможности применения разных модификаций T-Test (теста Стьюдента) показывали и существенные ограничения этого метода. Например, приведенные в табл. 4.1 результаты работы коман­ды Means свидетельствуют о том, что в данном случае число градаций в качественной переменной больше двух. Т-тест позволяет сопоста­вить только две градации. Как быть в данной ситуации?

С точки зрения построения социологической модели вопрос мож­но сформулировать следующим образом: оказывает ли значимое влияние на значение некоторой количественной переменной интере­сующая нас переменная, которая измерена на номинальном или порядковом уровне? В терминах метода дисперсионного анализа та переменная, которая, как мы считаем, должна оказывать влияние на конечный результат, называется фактором. Например, если для дан­ных табл. 3.1 мы начнем строить модель объяснения различий в зара­ботных платах респондентов тем, что респонденты проживают в на­селенных пунктах разного типа, переменная «Тип населенного пунк­та» будет выступать фактором.

Конкретную реализацию, значение фактора (например, опреде­ленный тип населенного пункта) называют уровнем фактора. Значе­ние измеряемого признака (в нашем примере—величину заработной платы) называют откликом.

Само название дисперсионного анализа происходит из того, что метод проверки статистической гипотезы Н о равенстве средних зна­чений в нескольких непересекающихся группах респондентов основан на сопоставлении двух оценок дисперсии анализируемой количествен­ной переменной (о чем речь пойдет ниже).

В рамках пакета SPSS программа, реализующая метод однофак-торного дисперсионного анализа, называется One-Way ANOVA и рас­положена в блоке команд Compare means. Название Опе-Way отражает тот факт, что эта программа выполняет метод однофак-торного дисперсионного анализа, т.е. анализируется влияние только одной качественной переменной (фактора) на количественную пере­менную. Слово «ANOVA» — аббревиатура и расшифровывается как ANAIisys Of Variance, или дисперсионный анализ.

Методы множественных сравнений

Полученный результат, указывающий, что средние зарплаты у рес­пондентов, принадлежащих к разным образовательным группам, различаются, не выглядит окончательным результатом социологичес­кого анализа данной проблемы. Это скорее промежуточный, или даже предварительный результат, который подразумевает дальнейшее рас­крытие того, в какой из образовательных групп зарплаты больше, в какой меньше, а в каких, быть может, зарплаты одинаковы. Основная процедура дисперсионного анализа не дает возможности ответить на эти вопросы, однако в команде One-Way ANOVA есть дополнительные возможности, которые направлены на решение этих задач с помощью методов множественных сравнений.

Суть методов множественных сравнений состоит в определении различий — совпадений средних значений количественной перемен­ной во всех возможных парах групп, определяемых градациями пере­менной — фактора. Иными словами, если мы проводим множествен­ные сравнения различий в уровнях заработной платы в образовательных группах, метод множественных сравнений построит все возмож­ные пары уровней образования и сравнит среднюю зарплату в этих мирах. Вызов данного метода выполняется нажатием клавиши Post Нос..., расположенной в нижней части главного меню команды One-Way ANOVA.

Дисперсионный анализ Краскэла — Уоллиса

До сих пор мы рассматривали ситуацию, в которой сравнивались (и анализировались результаты сравнения) средние значения перемен­ной, измеренной по метрической шкале либо в двух группах (T-Test), либо в п группах, задаваемых уровнями фактора (ANOVA).

Однако эти подходы имеют два существенных недостатка. Во-первых, в основе используемых статистических моделей лежит допу­щение о том, что в анализируемых выборках (одной или нескольких) рассматриваемые параметры имеют нормальное распределение. На­пример, T-Test для оценки различия средних значений какого-то по­казателя в двух независимых выборках основан на предположении, что значения этого показателя в данных выборках имеют нормальное распределение. В определенных случаях такое допущение кажется вполне естественным. Скажем, если мы пытаемся сравнить средний рост мужчин и женщин, предположение о том, что данный показа­тель в этих группах распределен нормально, не выглядит странным. Вместе с тем во многих случаях предположение о нормальности обос­новать довольно трудно, а подчас можно точно сказать, что распреде­ление резко отличается от нормального.

Вторым недостатком является то, что данные методы предназна­чены для фиксации различий в значениях переменных, измеренных по количественным (интервальным либо абсолютным) шкалам, а пе­ременные этого типа в данных социологических исследований встре­чаются достаточно редко. Материалы анкетных опросов преимуще­ственно состоят из переменных, измеренных по порядковым или но­минальным шкалам. Существует подход, позволяющий применять метод дисперсионного анализа для ситуации, когда переменная изме­рена по порядковой (ранговой) шкале, который называется дисперси­онным анализом Краскэла — Уоллиса.

При работе с ранговыми переменными учитывается лишь упо­рядоченность значений. Суть ранговых (порядковых) шкал состоит в том, что в данных кодируется некоторая числовая информация, но ис­пользуются только ранги. В ряде методов при вычислении критериев по имеющимся числовым значениям исследуемой переменной объек­там приписываются ранги. Для вычисления рангов объекты упорядо­чиваются от минимального значения переменной к максимальному, и порядковые номера объектов считаются рангами. Если для некоторой последовательности объектов числовые значения переменной повто­ряются, этим объектам приписывается средний ранг по этой последо­вательности. Об объектах, ранги которых совпадают, говорят, что они имеют связанные ранги. Наличие связанных рангов в выдаче по ранго­вым тестам обозначается словом «ties» (связи). Обычно выводится чис­ло связей и статистика критерия, скорректированная для связей.

В качестве примера рассмотрим упорядоченную информацию об успеваемости семи студентов.

Вам также может быть полезна лекция "Патфизиология как наука".

Среднийбалл        3,0     3,1     4,0     4,2     4,2     4,5     5,0 

Ранг                     1        2        3      4,5     4,5      6        7       

Первые три объекта имеют ранги 1, 2, 3; следующая пара — А,5 - (4 + 5) / 2, последняя пара — 6 и 7. Если предположить, что первые три студента в этой последовательности — юноши, а осталь­ные — девушки, можно ввести понятие среднего ранга у студентов разного пола. Это будут просто средние суммы рангов у студентов разного пола. Соответственно у юношей-студентов средний ранг бу­дет равен 2, у девушек — 4,5.

В основе метода дисперсионного анализа Краскэла — Уоллиса лежит однофакторный дисперсионный анализ, в котором вместо зна­мений переменных используется ранг объекта по исследуемой пере­менной, проводится сравнение средних произвольного числа групп. Нормированный межгрупповой разброс в условиях гипотезы равен­ства средних рангов в группах имеет распределение, близкое к рас­пределению 2.

Метод дисперсионного анализа Краскэла — Уоллиса в пакете программ SPSS выполняется через блок команд Nonparametric Tests, в котором выбирается команда К Independent Samples.

Необходимо отметить, что дисперсионный анализ Краскэ-ла — Уоллиса, равно как и в целом методы дисперсионного анализа, решает только задачу фиксации наличия связи (точнее — отсутствия независимости) между количественной и неколичественной перемен­ными. Мы не получаем информации о форме этой связи, однако, в некоторых случаях, имеем информацию о ее направлении.

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6439
Авторов
на СтудИзбе
306
Средний доход
с одного платного файла
Обучение Подробнее