Популярные услуги

Анализ различий

2021-03-09СтудИзба

Глава 3 Анализ различий

Цель анализа различий — выявление групп респондентов, статистически значимо различающихся между собой. Все ста­тистические процедуры, относящиеся к группе процедур, ко­торые позволяют выявить такие различия (t-тесты и диспер­сионный анализ), сравнивают респондентов на основании средних значений переменных. Иными словами, провести раз­личие можно на основании двух или более числовых перемен­ных.

В практике маркетинговых исследований достаточно часто встречаются ситуации, когда в ходе предварительного анали­за (на основании опыта исследователя, когнитивного или ста­тистического анализа) появляется гипотеза о разделении всей выборочной совокупности на определенные группы на осно­вании одного или нескольких признаков (например, при сег­ментировании потребителей продукта или при построении разрезов). Линейное распределение может показывать, что дан­ные группы респондентов действительно различаются (напри­мер, мужчин в выборке в два раза больше, чем женщин). Од­нако визуального различия между категориями недостаточно для того, чтобы с уверенностью констатировать наличие ста­тистически значимого различия. На установление статистиче­ской значимости различий между целевыми группами респон­дентов и направлены процедуры, объединенные под названием «Анализ различий».

Существует два основных метода определения различий меж­ду группами: t-тесты и дисперсионный анализ. Первый ме­тод прост в использовании, и поэтому он применяется часто (в том числе и в маркетинговых исследованиях). Однако в связи с ограничением на количество тестируемых групп (между которыми устанавливается различие) t-тесты не мо­гут применяться для решения всех задач, возникающих при проведении маркетингового анализа. Для преодоления дан­ного ограничения используется дисперсионный анализ, яв­ляющийся универсальной методикой для определения ста­тистически значимых различий между любым числом групп респондентов.

3.1. Т-тесты

Т-тесты предназначены для установления различий между двумя группами рес­пондентов. При этом сравниваются только два средних значения. SPSS предлага­ет три основных типа t-тестов:

Рекомендуемые материалы

Курсовая работа / Анализ хозяйственной деятельности муниципального предприятия на примере муп «водоканал»
Анализ финансового состояния ПАО "Почта Банк" и рекомендации по его улучшению
Анализ результатов финансовой деятельности коммерческого банка АО "ОТП Банк"
Определить максимальную с точки зрения сохранения массы прибыли величину скидки к цене изделия, если размер приобретаемой посредником партии изделий по сравнению с традиционными продажами по справочной цене возрастает в 1,5 раза, а доля переменных за
Предприятие планирует выпуск продукции в 1000 шт/год. Для этого необходимо приобрести технологическое оборудование стоимостью 20 тыс. д.е., приборы контроля стоимостью 10 тыс. д.е., вычислительную технику — 5 тыс. д.е. Для создания производственных у
Определить первоначальную и остаточную стоимость металлорежуще-го станка, если известны следующие данные. Цена станка, использование которого начато три года назад, составляла 4,5 тыс. д.е., доставка и монтаж – 0,5 тыс. д.е. Норма амортизации – 14,2

■   для двух независимых выборок;

■   для двух зависимых выборок;

■   для одной выборки.

В последующих разделах мы подробно расскажем о каждом из них, но сначала при­ведем основные характеристики переменных, участвующих в t-тестах (табл. 3.1).

Т-тесты для независимых  выборок

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Одна

Дихотомическая интервальная

Любое

Интервальная

Т-тесты для зависимых выборок

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

-

-

Две

Интервальная

Т-тесты для одной выборки

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

-

-

Любое

Интервальная

Обратите внимание: зависимая переменная есть только для t-тестов независимых выборок. Для других видов t-тестов (зависимых выборок и одной выборки) зави­симая переменная отсутствует. Это связано с тем, что в последнем случае анализу подвергается фактически одна и та же выборка респондентов. В качестве тестиру­емых независимых переменных во всех случаях используются только переменные с интервальной шкалой. Порядковые переменные могут использоваться только после преобразования их к интервальному виду (см. раздел 2.1).

3.1.1. Т-тесты для независимых выборок

В случае t-тестов для независимых выборок под независимыми выборками пони­маются бинарные категории (то есть варианты ответа) какой-либо переменной. Например, мужчины и женщины (вопрос Пол респондента), покупатели и не поку­патели какого-либо продукта (вопрос Покупаете ли Вы данный продукт?) и т. д. То есть когда есть два уровня группирующей (зависимой) переменной и несколько независимых переменных, на основании которых и будет выполняться различие между группами зависимой переменной.

Рассмотрим методику проведения t-тестов для независимых выборок на следую­щем примере. Предположим, что мы оцениваем различия в частоте посещения иг­ровых клубов между посетителями заведений марки X и других марок. Откройте диалоговое окно Independent-Samples T Test при помощи меню Analyze ► Compare Means ► Independent-Samples T Test (рис. 3.1). В область Test Variable(s) поместите переменные, являющиеся критерием для установления различий (в нашем случае это ql8_i Частота посещения). Затем в поле Grouping Variable переместите переменную, которая будет яв­ляться группирующей (зависимой). В нашем случае это переменная ql_8, кодирую­щая категории респондентов, посещающих/не посещающих игровые залы марки X.

Рис. 3.1. Диалоговое окно Independent-Samples T Test


Так как данная переменная является вариантом ответа на многовариантный во­прос Какие игровые клубы Вы посещаете?, она может принимать два значения:

■   1 — посещают клубы X;

■   0 — не посещают клубы X.


Эти два значения необходимо указать в специальном диалоговом окне Define Groups, вызываемом одноименной кнопкой (рис. 3.2). Обратите внимание, что если вмес­то дихотомии мы имеем группирующую переменную с интервальной шкалой, это диалоговое окно позволяет установить точку отсечения Cut point, которая буде! разделять все возможные значения данной переменной на две группы.

Рис. 3.2. Диалоговое окно Define Groups




С помощью кнопки Options в главном диалоговом окне рассматриваемой процедуры можно установить доверительный уровень для результатов расчета t-теста (рис. 3.3). По умолчанию установлен уровень доверия 95 %. Как было показано выше в раз­деле 1.2, этот уровень точности (достоверности) результатов является достаточ­ным при проведении статистического анализа в маркетинговых исследованиях.



Рис. 3.3. Диалоговое окно Independent-Samples T Test: Options




После завершения процедуры расчета t-теста в окне SPSS Viewer будут отражены результаты (рис. 3.4). В первой таблице Group Statistics вы видите средние значе­ния тестируемой переменной (частота посещения клубов) для обеих групп зави­симой переменной X. Как следует из рисунка, для респондентов, посещающих иг­ровые залы марки X, средняя частота посещения составляет 11,9 раз в месяц. Для респондентов, не посещающих данные залы, это значение равно 11,5. Вторая таб­лица Independent Samples Test позволяет установить статистическое различие меж­ду данными значениями.

Group StatistiosT-Test

X

N

Mean

Std. Deviation

Std. Emor Mean

Частота посещения

1

49

11,9288

10,43081

1,49140

0

526

11,5048

9,98682

,43546

Indeperdert Samples Test

Levene’s Test for Equality of Variances

t-test for Equality of Means

F

Sug.

t

df

Sig. (2-talid)

Mean Difference

Std. Emor Difference

Lower

Upper

Частота посеще-ния

Equal variances assumed

,382

,547

,283

573

,777

,4238

1,49745

-2,61734

3,36497

Equal variances not assumed

,273

56,495

,786

,4230

1,55367

-2,68795

3,51559

Рис. З.4. Результаты расчета t-теста для независимых выборок



Анализ этой таблицы начинается с определения значимости теста Ливина (Levene). Данный тест служит для тестирования гипотезы о равенстве дисперсий в тестиру­емых переменных. Если значение в столбце Sig. столбца Levene's Test for Equality of Variances показывает статистическую незначимость теста (в нашем случае — 0,547), то различие между двумя анализируемыми средними определяется из строки Equal variances assumed. В противном случае, если тест Levene статистически значим, раз­личие между двумя средними определяется из строки Equal variances not assumed.

Поскольку в нашем примере тест Ливина является статистически незначимым, то определить значимость различия между двумя тестируемыми группами можно при помощи значения, находящегося на пересечении первой строки и столбца Sig. (2-tailed). Значение 0,777 говорит о том, что различие в частоте посещения игро­вых залов респондентами, посещающими и не посещающими клубы марки X, яв­ляется статистически незначимым.


3.1.2. Т-тесты для спаренных выборок

Т-тесты для спаренных выборок применяются в случае, когда на различные во­просы отвечает одна и та же группа респондентов.

Например, пассажиры оценивают уровень и качество питания авиакомпании X и авиакомпании Y. Чтобы определить, является ли статистически значимой разница в оценке этих двух авиакомпаний, следует воспользоваться диалого­вым окном Paired-Samples T Test, вызываемым при помощи меню Analyze ► Compare Means ► Paired-Samples T Test (рис. 3.5). В левом списке содержатся все доступ­ные переменные из базы данных. Выберите из списка две переменные для тес­тирования. В нашем случае это qll (Питание в авиакомпании X) и q26 (Питание в авиакомпании Y). По мере того как вы будете выбирать переменные, они будут последовательно отображаться в области Current Selections. Указав две перемен­ные для анализа, щелкните на кнопке с символом ► , чтобы перенести перемен­ные в область Paired Variables. Кнопка Options позволяет установить уровень до­верия для производимых расчетов.

Рис. 3.5. Диалоговое окно Paired-Samples T Test




После щелчка на кнопке ОК будут произведены расчеты t-теста для анализиру­емых переменных; результаты теста будут отражены в окне SPSS Viewer (рис. 3.6). Как видно на рисунке, SPSS выводит на экран три таблицы. Рассмотрим их по порядку.

Итак, в первой таблице, Paired Samples Statistics, вы видите рассчитанные средние значения для обеих тестируемых переменных. Так, в нашем случае респонденты оценили питание в авиакомпании Y в среднем на 0,4 балла выше, чем в авиакомпа­нии X.

В следующей таблице Paired Samples Correlations представлен коэффициент корре­ляции (Пирсона) между оценками двух анализируемых переменных. Подробно корреляционный анализ рассматривается в разделе 4.2. Здесь стоит сказать лишь, что чем ближе значение коэффициента к 1, тем сильнее линейная связь между пе­ременными (при условии статистической значимости коэффициента). То есть чем выше уровень оценки по первой переменной, тем выше оценка второй — и наобо­рот. В нашем случае налицо отсутствие линейной связи между оценками питания в авиакомпании X и Y (коэффициент корреляции = 0,027 при статистической зна­чимости 0,463).

Paired Samples Statistics

T-Test

Mean

N

Std. Devition

Std. Emor Mean

Pair

Питание в X

3,9

731

,974

,036

1

Питание в Y

4,3

731

,787

,029


Paired Samples Correlations




N

Correlation

Sig.

Pair

Питание в X &

731

,027

,463

1

Питание в Y

Paired Samples Test



Paired Diffirences

t

df

Sig. (2-tailed)

Mean

Std. Devition

Std. Emor Mean

95% Confidence interval of the Difference

Lower

Upper

Pair

Питание в X &

-,4

1,236

,046

-,44

-,26

-7,692

730

,000

1

Рис. З.6. Результаты расчетов t-теста для спаренных выборок

Питание в Y

Наконец, третья таблица, Paired Samples Test, позволяет сделать вывод о наличии/ отсутствии статистически значимого различия между тестируемыми переменны­ми, что следует из значения в столбце Sig. (2-tailed). В нашем случае различие меж­ду оценками питания в авиакомпаниях X и Y, равное 0,4 балла, является статистиче­ски значимым (<0,001).

3.1.3. Т-тесты для одной выборки

В результате t-теста для одной выборки можно выяснить, отличается ли значи­тельно реальное среднее значение какой-либо переменной от стандарта. В марке­тинговых исследованиях при помощи данного теста определяют, отличается ли среднее значение какого-либо параметра для определенной целевой группы респон­дентов от среднего значения по всей выборке.

Например, питание на борту самолетов авиакомпании X (переменная qll) всеми респондентами оценено в среднем на 4,0 балла. Вместе с тем пассажиры первого класса оценили питание несколько выше: в среднем на 4,1 балла. Возникает во­прос, является ли выявленное различие статистически значимым. То есть отлича­ются ли пассажиры первого класса от всех респондентов на основании уровня оцен­ки питания на борту? Выяснить это нам поможет t-тест для одной выборки. Ниже описан механизм его проведения.

Рис. 3.7. Диалоговое окно One-Sample T Test&#13;&#10;&#13;&#10;


Для проведения t-теста мы должны отобрать только тех респондентов, которые летают первым классом. (Как это сделать, см. в разделе 1.5.1.1.) После этого следу­ет воспользоваться меню Analyze ► Compare Means ► One-Sample T Test, чтобы открыть диалоговое окно One-Sample T Test (рис. 3.7). Далее перенесите из левого списка всех доступных переменных в область Test Variable(s) интересующую нас перемен­ную qll (Питание). В поле Test Value укажите стандартное значение, с которым мы будем сравнивать среднее тестируемой переменной. В нашем случае это 4,0. Кнопка Options позволяет указать доверительный уровень, для которого устанавливается различие.

После того как SPSS завершит расчет t-теста, в окне SPSS Viewer появятся две таблицы с результатами (рис. 3.8).


Рис. З.8. Результаты расчета t-теста для одной выборки&#13;&#10;&#13;&#10;


В первой таблице, One-Sample Statistics, отражены расчеты среднего значения ис­следуемой переменной (столбец Mean). В нашем случае данное значение отражает среднюю оценку питания пассажиров первого класса (4,1 балла). Вторая таблица, One-Sample Test, позволяет сделать вывод о статистической значимости/незначи­мости тестируемого различия. Как следует из значения столбца Sig. (2-tailed), раз­личие в оценках пассажиров первого класса и всей выборочной совокупности рес­пондентов является статистически незначимым (0,149). Разница между реальным и тестируемым значениями (в нашем случае — 0,1 балла) отражается в столбце Mean Difference.

3.2. Дисперсионный анализ

Иногда при анализе данных маркетинговых исследований достаточно сравнить только две группы респондентов, то есть установить различия между двумя кате­гориями опрошенных. Однако часто у исследователей возникает необходимость проанализировать не две, а три или более категории респондентов. В этом случае

следует прибегнуть к использованию дисперсионного анализа, который позволяет анализировать одновременно любое число групп.

Различают одномерный (Analysis of variance, ANOVA) и многомерный (Multiple analysis of variance, MANOVA) дисперсионный анализ. Для одномерного диспер­сионного анализа существует только одна зависимая переменная; для многомерно­го — несколько. Также в этом разделе мы рассмотрим одномерный дисперсион­ный анализ с повторными измерениями (ANOVARM)1.

В табл. 3.2 приведены основные характеристики переменных, участвующих в раз­личных видах дисперсионного анализа.

Таблица 3.2. Основные характеристики переменных, участвующих в дисперсионном анализе

Одномерный дисперсионный анализ

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Одна

Любой

Любое

Любой

Одномерный дисперсионный анализе повторными измерениями

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Одна

Любой

Любой

Любой

Многомерный дисперсионной анализ

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Любое

Любой

Любое

Любой

3.2.1. Одномерный дисперсионный анализ

Как было сказано выше, одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномер­ный дисперсионный анализ может быть однофакторным (one-way ANOVA) или многофакторным (n-way ANOVA). В первом случае есть только одна независимая переменная; во втором — несколько.

Однофакторный одномерный дисперсионный анализ можно проводить двумя спо­собами: при помощи специальной процедуры One-way ANOVA (меню Analyze ► Compare Means ► One-way ANOVA) или посредством обобщенной линейной модели (меню Analyze ► General Linear Model ► Univariate). Второй прием является более универсальным и обладает полным объемом функциональности первого, поэтому да­лее мы рассмотрим только GLM (использование первого метода аналогично GLM). Необходимо отметить, что для проведения одномерного дисперсионного анализа на практике (в маркетинговых исследованиях) существует одно весьма существен­ное ограничение. При увеличении количества факторов (то есть независимых пере­менных) в модели сложность интерпретации результатов расчета возрастает много­кратно. Так, однофакторный анализ является наиболее простым. Его результаты понятны сразу при взгляде на итоговую таблицу. Двухфакторный анализ намного сложнее в интерпретации — чтобы понять его результаты, приходится потратить много времени, разбираясь в таблицах и графиках. Для интерпретации результатов трехфакторного анализа необходимо обладать некоторым опытом в его проведе­нии. Четырех- и мультифакторные модели в большинстве своем могут успешно интерпретироваться только квалифицированными исследователями. Таким об­разом, для практических целей лучше воздержаться от исследования большого числа взаимодействий между факторами и ограничиться несколькими наиболее важными. В настоящем разделе мы последовательно рассмотрим одно-, двух- и трехфакторные модели одномерного дисперсионного анализа. При этом будут использовать­ся следующие исходные данные:

Исследуется покупательское поведение потребителей глазированных сырков. Респонденты разделяются на целевые группы в зависимости от их пола (q3), возраста (q4) и количе­ства членов семьи (q72). Одним из вопросов анкеты является: «Какое количество глази­рованных сырков в среднем Вы покупаете за одно посещение магазина?» (q6) с варианта­ми ответа: 1 шт., 2 шт., 3 шт., 4 шт., 5 шт., 6-7 шт., 8-10 шт. и более 10 шт. Требуется выяснить, различается ли кратность покупок глазированных сырков различными целевы­ми группами респондентов (половыми, возрастными и по количеству членов семьи).

Прежде всего мы проведем однофакторный одномерный дисперсионный анализ и установим, насколько значимо различается кратность покупок в различных воз­растных группах респондентов (1 — младше 18 лет; 2 — 19-35 лет; 3 — 36-60 лет; 4 — старше 60 лет).

Диалоговое окно одномерного дисперсионного анализа запускается при помощи меню Analyze ► General Linear Model ► Univariate (рис. 3.9). Из левого списка всех до­ступных переменных переместите в поле для зависимой переменной Dependent Variable переменную q6 (Кратность покупок). Как видите, в качестве зависимой пере­менной в дисперсионном анализе выступает основание сегментирования респон­дентов по группам, то есть та переменная, которая и определяет различия между категориями независимой переменной. (Это замечание достаточно сложно осоз­нать, так как при проведении дисперсионного анализа как бы стираются границы в трактовке зависимых и независимых переменных — по крайней мере, по сравне­нию с другими видами статистического анализа, например регрессионного.)


В область для независимых переменных Fixed Factor(s) поместите Возраст (q4). Об­ратите внимание на разницу между областями Fixed Factor(s) (факторы с фиксиро­ванными эффектами) и Random Factor(s) (факторы со случайными эффектами). Фиксированными факторами называют переменные, уровни которых охватыва­ют все возможные состояния этой переменной. Например, пол может быть только мужской или женский, а возраст, например, младше 30 лет, от 30 до 60 лет и стар­ше 60 лет. Случайные факторы представляют переменные, уровни которых охватывают лишь часть из всего многообразия возможных состояний. Так как в нашем случае переменная q4 (Возраст) содержит все возможные возрастные группы рес­пондентов, мы поместили ее в область фиксированных факторов.

Рис. 3.9. Диалоговое окно Univariate


Если после этого вы щелкнете на кнопке ОК, то получите только одну таблицу, из которой можно узнать лишь о наличии/отсутствии значимых различий между воз­растными группами. Однако останется неизвестным, какие именно группы отли­чаются от других.

Для того чтобы определить это, существуют дополнительные статистические тес­ты, задаваемые при помощи кнопки Post Hoc. Соответствующее диалоговое окно представлено на рис. 3.10. Перенесите из области Factor(s) в область Post Hoc Tests for те независимые переменные (факторы), которые необходимо подвергнуть тес­тированию на предмет установления различий между их группами. В нашем слу­чае есть всего одна факторная переменная q4, которую и следует перенести в об­ласть тестирования. Далее укажите релевантные дополнительные тесты для указанной переменной. При этом, как видно на рисунке, SPSS выводит различные тесты для равных и неравных дисперсий (Equal Variances Assumed и Equal Variances Not Assumed соответственно).

Установить равенство/неравенство дисперсий позволяет тест Levene, вывод кото­рого на экран мы покажем ниже. В общем случае мы не знаем, равны ли дисперсии и, соответственно, какую группу статистических тестов следует использовать. По­этому рекомендуется сразу вывести тесты для равных и неравных дисперсий, что­бы сократить количество итераций при проведении дисперсионного анализа. SPSS предлагает много различных дополнительных тестов, помогающих определить различия между группами исследуемых переменных. Однако использовать их все нецелесообразно. Мы рекомендуем ограничиться наиболее популярным и универ­сальным тестом Scheffe для равных дисперсий и тестом Tamhane's T2 — для нерав­ных дисперсий. Теперь можно закрыть описываемое диалоговое окно щелчком на кнопке Continue.


Рис. 3.10. Диалоговое окно Univariate: Post Hoc Multiple Comparisons for Observed Means&#13;&#10;&#13;&#10;



Выше мы упомянули о специальном тесте, позволяющем установить равенство/ неравенство дисперсий. На необходимость проведения данного теста (так же как и многих других) можно указать в диалоговом окне Options, вызываемом одноимен­ной кнопкой в главном диалоговом окне Univariate (рис. 3.11). Для однофакторного дисперсионного анализа можно ограничиться только одним тестом Levene на равенство дисперсий (параметр Homogeneity tests).

Рис. 3.11. Диалоговое окно Univariate: Options&#13;&#10;&#13;&#10;


Следует отметить, что если исследуемая независимая переменная имеет всего две ка­тегории (дихотомия), апостериорные тесты для нее не проводятся. Установить на­правление различия между категориями позволяет вывод средних значений зависи­мой переменной в каждой из двух категорий. Для этого перенесите исследуемую независимую дихотомическую переменную из области Factor(s) and Factor Interactions

в область Display Means for. В нашем случае единственная независимая переменная Воз­раст имеет больше двух категорий (4), и поэтому специально выводить для нее сред­ние значения нет смысла (они будут выведены в таблице Homogenous Subsets).

Остальные кнопки главного диалогового окна Univariate предназначены для мно­гофакторного анализа, рассматриваемого ниже. Теперь щелкните на кнопке О К, что­бы запустить процедуру дисперсионного анализа. В окне SPSS Viewer будут выве­дены результаты расчетов.

Первой практически значимой таблицей является результат теста на равенство дисперсий зависимой и независимых переменных Levene's Test of Equality of Error Variances (рис. 3.12). В столбце Sig. данной таблицы содержится единственное ин­тересующее нас значение — это статистическая значимость тестовой статистики F. Если значение в данном столбце показывает незначимость F — значит, дисперсии равны, и в дальнейшем мы будем анализировать результаты расчета теста Scheffe (предполагающего равенство дисперсий). В противном случае, если F-статистика значима, — дисперсии не равны, и при анализе различий между группами следует использовать тест Tamhane's T2 (предполагающий неравенство дисперсий). Как вы видите на рисунке, статистика F незначима (Sig. = 0,433) — и, следовательно, можно сделать вывод о равенстве дисперсий.

Рис. 3.12. Таблица Levene's Test of Equality of Error Variances&#13;&#10;&#13;&#10;


Следующая таблица — это Tests of Between-Subjects Effects (рис. 3.13). Данная таб­лица является центральной в выводимых результатах дисперсионного анализа и показывает наличие/отсутствие значимых различий между категориями исследу­емых переменных. Первое, на что следует обратить внимание при анализе описы­ваемой таблицы, — это величина R2, отражающая долю совокупной дисперсии в зависимой переменной, описываемой статистической моделью. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на осно­вании независимой переменной. Естественно, что чем меньше независимых пере­менных, тем меньше величина R2, и наоборот.

Так, в нашем случае есть только одна независимая переменная q4 (Возраст), и при этом R2 весьма мала (0,019). Для дисперсионного анализа значения R2 можно про­сто проигнорировать, так как они не важны для практического использования по­лученной модели'. Второе, на что обращают внимание исследователи при интер­претации таблицы Tests of Between-Subjects Effects, — это собственно значимость различия между группами независимой переменной. Этот вывод следует из значения на пересечении строки, содержащей соответствующую независимую перемен­ную, и столбца Sig.. Как вы видите на рисунке, имеет место статистически высоко значимое различие между различными возрастными группами респондентов по кратности покупок глазированных сырков (значимость F-статистики у перемен­ной q4 < 0,001). Обратите внимание, что если тест Levene выявил факт неравен­ства дисперсий независимых и зависимых переменных, следует поднять по


рог зна­чимости со стандартного значения 0,05 до 0,01.

Рис. 3.13. Таблица Tests of Between-Subjects Effects


После того как мы установили наличие статистически значимого различия между возрастными группами респондентов на основании кратности покупок сырков, необходимо определить, какие из четырех имеющихся возрастных групп отлича­ются от остальных и каким образом (в большую или в меньшую сторону).

Давайте сделаем это при помощи таблицы Multiple Comparisons, представленной на рис. 3.14. При интерпретации данной таблицы прежде всего вспомните результа­ты теста Levene. Так, в нашем случае на основании данного теста дисперсии оказа­лись равными, и поэтому в данной таблице мы будем рассматривать только ту ее часть, в которой приведены расчеты по методу Scheffe (напомним, что тест Tamhane мы бы применяли только если бы дисперсии были неравны).

Итак, в первой части таблицы (Scheffe) мы видим сравнение различий между каж­дой из четырех возрастных категорий с остальными категориями. На основе этих данных и определяются та или те группы, которые значимо отличаются от других. Так, из столбца Sig. (статистическая значимость) мы видим, что только группа рес­пондентов старше 60 лет статистически значимо отличается от всех остальных. Остальные целевые группы не отличаются друг от друга. При этом из столбца Mean Difference можно видеть, насколько отличается среднее значение той или иной груп­пы от среднего значения других групп (звездочками отмечены значимые различия при 95%-ном доверительном уровне)1.

Наконец, в последней таблице Homogeneous Subsets (рис. 3.15) представлена однознач­ная картина различий между группами независимой переменной. Здесь все возрастные группы разделены на две категории на основании различий в кратности покупок. В первую категорию входит целевая группа респондентов старше 60 лет; во вторую — все остальные возрастные группы (то есть респонденты младше 60 лет). Если бы ока­залось, что статистически значимых различий в кратности покупок глазированных сырков различными возрастными группами респондентов не наблюдается, все груп­пы независимой переменной были бы отнесены к одной категории (Subset был бы толь­ко 1). Иногда возникает ситуация, при которой одна и та же группа респондентов мо­жет относиться сразу к нескольким группам. В таком случае следует поднять порог значимости со стандартных 0,05, скажем, до 0,01 (или любого другого значения).


Рис. 3.14. Таблица Multiple Comparisons


Также из рассматриваемой таблицы можно сделать вывод о направлении различия между выделенными категориями. Так, в нашем случае мы можем заключить, что респонденты старше 60 лет покупают глазированные сырки в меньших объемах, чем респонденты младше 60 лет. В точности определить размер или величину раз­личия можно, только если в качестве зависимой переменной выступает интерваль­ная переменная. Так как у нас переменная q6 Кратность покупок относится к поряд­ковой шкале, мы не можем сделать точный вывод о величине различия. Если стоит такая задача, можно преобразовать зависимую порядковую переменную к интер­вальному виду (например, при помощи перекодирования кодов групп в средние значения данных групп: 1 (от 16 до 18 лет) —> 17 и пересчитать дисперсионный анализ. Это даст хотя бы приблизительную оценку величины различия. Нам достаточно только установленной статистической значимости (то есть существова­ния) различия и его направления (респонденты старше 60 лет покупают меньше сырков, чем более молодые).



Рис. 3.15. Таблица Homogeneous Subsets


Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независи­мые переменные (и взаимодействия между ними), то есть выполнить двухфактор-ный одномерный дисперсионный анализ.

Исходные данные останутся такими же, как в предыдущем примере, однако те­перь мы будем устанавливать различие в кратности покупок сырков возрастными и половыми группами (переменная q3). Для этого вновь откроем диалоговое окно Univariate (рис. 3.9) и добавим в область для фиксированных факторов (независи­мых переменных с фиксированными эффектами) переменную Пол. При проведении многофакторного анализа (двухфакторной и более) кнопка Model позволяет задать исследование либо всех возможных взаимодействий между неза­висимыми переменными (в нашем случае будет установлено различие не только меж­ду четырьмя возрастными и двумя половыми группами по отдельности, но и между каждой половозрастной группой), либо только каких-то конкретных взаимодействий. В диалоговом окне Model можно задать и другие значения, но для большинства задач маркетинговых исследований достаточно оставлять все эти значения по умолчанию. Иными словами, кнопкой Model лучше не пользоваться. То же самое касается и кнопки Contrasts (исследование взаимодействий между уровнями независимых переменных), а также кнопки Save, позволяющей сохранять некоторые значения. В большинстве практических случаев, встречающихся в маркетинговых исследованиях, при прове­дении дисперсионного анализа вам не потребуется ничего сохранять. При проведении многофакторного дисперсионного анализа в диалоговом окне Post Нос (рис. 3.10) следует добавить к списку исследуемых переменных все независи­мые факторы, кроме дихотомических. В нашем случае переменная Пол является

дихотомической, так что добавлять ее в область Post Hoc Tests for (дополнительно к переменной Возраст) не следует. Таким образом, все параметры этого диалогово­го окна останутся неизменными по сравнению с предыдущим примером.

В диалоговом окне Options (рис. 3.11) необходимо добавить дихотомическую пере­менную q3 (Пол), а также ее взаимодействие с переменной q4 (Возраст) — q3*q4 — в область Display Means for, что позволит вывести средние значения по каждой группе мужчин и женщин при определении направления различия между ними. После этого можно запускать процедуру дисперсионного анализа на выполнение.

В окне SPSS Viewer будут выведены результаты расчетов. Они будут отличаться от результатов предыдущего примера. Во-первых, как видно из рис. 3.16, тест Levene те­перь является значимым (Sig. = 0,033), из чего следует вывод о неравенстве дисперсий.


Рис. 3.16. Таблица Levene's Test of Equality of Error Variances


Во-вторых, в таблице Tests of Between-Subjects Effects появились результаты расчета значимости F-статистики для переменной Пол (q3), а также для взаимодействия q3*q4. Как видно из рис. 3.17, мужчины и женщины не имеют статистически зна­чимых различий по кратности покупок глазированных сырков. То же относится и к взаимодействию q3*q4: оно не является статистически значимым. При этом, не­смотря на неравенство дисперсий (порог значимости возрос до 0,01), переменная q4 (Возраст) сохранила свое значимое влияние на зависимую переменную (Sig. = 0,011), то есть возрастные группы по-прежнему различаются по кратности поку­пок сырков. Необходимо также отметить, что с добавлением переменной q3 доля совокупной дисперсии в зависимой переменной, объясняемая построенной моде­лью, несколько возросла (R2 = 0,022).

После таблицы Tests of Between-Subjects Effects следуют расчеты средних значений для дихотомической переменной q3 (Пол) и для взаимодействия q3 x q4 (рис. 3.18). В нашем случае ни переменная q3, ни ее взаимодействие с q4 не являются статис­тически значимыми, поэтому данные таблицы бесполезны. Однако если бы пере­менная Пол была значима (то есть различие между мужчинами и женщинами су­ществовало), на основании первой таблицы можно было бы сделать заключение о том, какая именно половая группа покупает больше сырков.

Так, если предположить, что влияние переменной Пол статистически значимо, из рис. 3.18 можно было бы заключить, что женщины покупают глазированные сыр­ки в больших объемах по сравнению с мужчинами. То же можно сказать и относи­тельно второй таблицы (Пол х Возраст). Случается, что по результатам таблицы Tests of Between-Subjects Effects некая переменная оказывается незначимой, однако в таблице Multiple Comparisons отдельные уровни этой переменной значимо отлича­ются друг от друга. В такой ситуации все равно следует признать рассматриваемую переменную незначимой и в дальнейшем игнорировать связанные с нею апо­стериорные тесты.



Рис. 3.17. Таблица Tests of Between-Subjects Effects


Рис. 3.18. Таблицы Estimated Marginal Means


Завершают вывод результатов двухфакторного анализа таблицы с расчетами апо­стериорных тестов. В нашем случае они практически такие же, как в предыдущем примере, поскольку переменная Возраст сохранила свою значимость (см. рис. 3.14 и 3.15). Однако при интерпретации таблицы Multiple Comparisons следует помнить

о неравенстве дисперсий. Поэтому значимость различий между отдельными возраст­ными группами надо устанавливать на основании второй части таблицы Tamhane.

Итак, мы рассмотрели одно- и двухфакторный одномерный дисперсионный анализ. Далее мы поговорим более подробно о трехфакторном дисперсионном анализе. На его примере мы рассмотрим построение графиков и методы их использования с целью облегчения интерпретации значимых взаимодействий между переменными.

Теперь мы будем использовать все четыре переменные из исходного условия зада­чи (см. выше), то есть проанализируем различия в кратности покупки глазирован­ных сырков анализируемыми целевыми группами респондентов (половыми, воз­растными и по количеству членов семьи). Откройте диалоговое окно Univariate и добавьте в список независимых переменных (область Fixed Factor(s)) еще одну пе­ременную q72 (Количество членов семьи).

Здесь необходимо сделать одно важное отступление. Время проведения расчетов в дисперсионном анализе (как одномерном, так и многомерном) при добавлении каж­дого нового фактора существенно возрастает. Если при этом зависимая переменная содержит достаточно большое количество уровней, расчеты могут затянуться на весь­ма длительное время. Исследователям-практикам следует знать об одной существен­ной особенности SPSS: скорость ее работы лимитируется тактовой частотой основ­ного микропроцессора и объемом оперативной памяти (скорость работы жесткого диска не играет существенной роли). SPSS может использовать в своей работе толь­ко один процессор, то есть если у вас в компьютере установлено два и более процес­сора, для SPSS это не будет иметь никакого значения. Поэтому при работе с данной программой мы настоятельно рекомендуем использовать мощные машины с высо­копроизводительным процессором и достаточным объемом оперативной памяти. К сожалению, в настоящее время не все отечественные компании имеют возможность приобретать мощные компьютеры. Предлагаем следующий выход. В главном диало­говом окне Univariate есть кнопка Model, которая, как мы сказали выше, в маркетинго­вых исследованиях используется редко, поскольку при проведении дисперсионного анализа не требуется анализировать сразу много (четыре и более) факторов и, следо­вательно, скорость работы программы будет приемлемой. Однако если в анализ при­ходится включать четыре и более независимых переменных, придется воспользоваться кнопкой Model. Щелкните на ней — и вы увидите одноименное диалоговое окно, пока­занное на рис. 3.19. По умолчанию в SPSS выбрана полнофакторная модель дисперси­онного анализа Full factorial, где исследуется влияние на зависимую переменную:

1.   всех независимых переменных по отдельности;

2.   всех возможных взаимодействий между независимыми переменными.


Именно на расчеты, связанные со вторым пунктом, и тратится основное время. Поэтому при ограничениях, налагаемых аппаратным обеспечением компьютера, следует отказаться от использования полнофакторных моделей в пользу опреде­ляемых пользователем (Custom). Если ограничения жесткие, можно выполнить только исследования влияния независимых переменных на зависимую по отдель­ности (в терминологии SPSS, Main effects)1.

Рис. 3.19. Диалоговое окно Univariate: Model


В данном диалоговом окне в левом списке содержатся все выбранные для анализа независимые переменные. Чтобы определить пользовательскую модель, в левом списке Factors & Covariates выберите переменные, которые будут включены в итого­вую пользовательскую модель. Затем из раскрывающегося списка Build Term(s) выберите тот или иной тип взаимодействия между переменными. И наконец, щелк­ните на соответствующей кнопке, чтобы перенести сформированную пользователь­скую модель в правый список Model.

Если вы хотите рассмотреть только влияние факторных переменных по отдельно­сти, выполните действия, показанные на рис. 3.19. Выберите все независимые пе­ременные в левом списке, тип модели Main effects и перенесите эти переменные в правую область. Другими видами моделей являются:

■   Interaction — исследование всех видов взаимодействий между выбранными пе­ременными;

■   АН 2-, 3-, 4-, 5-way — исследование только взаимодействий соответственно второго (ql*q2), третьего (ql*q2*q3), четвертого (ql*q2*q3*q4) и пятого (ql*q2*q3*q4*q5) порядков.

Обратите внимание, что одновременно можно сформировать в правом списке Model сколько угодно различных моделей, подбирая только основные, необходимые вам взаимодействия факторов.

Для иллюстрации решения задачи (выполнение трехфакторного дисперсионного анализа) не будем задавать пользовательские модели, а воспользуемся полнофак­торной моделью, установленной по умолчанию. В диалоговом окне Model есть еще два не рассмотренных ранее параметра: Sum of squares и Include interceptin model. Пер­вый параметр позволяет задать тип формулы для расчета суммы квадратов (тесто­вой величины, на основании которой и производится расчет статистической значи­мости различий). В маркетинговых исследованиях рекомендуется использовать тип III, установленный по умолчанию. Второй параметр служит для указания на необ­ходимость включить в итоговую модель расчеты значимости отрезка значений. Дан­ный параметр также можно всегда оставлять установленным по умолчанию.

Вернемся к описанию решения поставленной задачи. Мы добавили в соответству­ющие поля главного диалогового окна Univariate одну зависимую переменную и cразу три независимые. При помощи кнопок Post Hoc и Options необходимо выбрать те же параметры, которые мы выбирали для одно- и двухфакторного анализа. В ре­зультате останется не рассмотренной одна важная кнопка в главном диалоговом окне Plots, позволяющая указать параметры для построения графиков. Эту кнопку следует использовать в тех ситуациях, когда обнаружено статистически значимое взаимодействие между факторами.

Для того чтобы построить график взаимодействия факторов, сначала мы должны про­вести дисперсионный анализ по обычной схеме (без графиков) и выяснить, есть ли значимые взаимодействия. После щелчка на кнопке ОК в окне SPSS Viewer будут выве­дены результаты расчетов для трехфакторного одномерного дисперсионного анализа. Нет смысла приводить их здесь — в них нет ничего для вас нового. Вместо этого да­вайте посмотрим, как интерпретировать значимые взаимодействия между факторами.

Существует два основных способа интерпретации взаимодействий:

■   в табличной форме — по результатам апостериорных тестов;

■   в графической форме — по построенным графикам взаимодействий.

Графическая форма представления результатов зачастую более предпочтительна по сравнению с табличной, особенно при анализе взаимодействий трех и более уровней. На рис. 3.20 показано диалоговое окно Profile Plots. Для того чтобы построить график по двухуровневому взаимодействию, из левого списка всех независимых переменных (область Factors) выберите переменную, категории которой будут располагаться по оси абсцисс (горизонтальной), и поместите ее в поле Horizontal Axis. Далее выберите пере­менную, значения каждой категории которой будут отображаться на графике в виде отдельных линий (пример см. ниже), и поместите ее в поле Separate Lines.


Рис. 3.20. Диалоговое окно Univariate: Profile Plots&#13;&#10;&#13;&#10;


Для иллюстрации процесса построения графиков предположим, что по результа­там трехфакторного дисперсионного анализа была установлена статистическая значимость взаимодействия между переменными q3 (Пол) и q4 (Возраст). В окне Profile Plots мы поместили переменную с наименьшим числом категорий q3 в поле Horizontal Axis, а переменную q4 — в поле Separate Lines. Теперь щелкните на кнопке Add, чтобы подтвердить построение графика с заданными параметрами. Таким спо­собом можно задать вывод сразу нескольких графиков.

После того как SPSS завершит расчеты, связанные с дисперсионным анализом, в окне SPSS Viewer после таблиц появится заданный график. В нашем примере он будет выглядеть так, как показано на рис. 3.21.


Рис. 3.21. График взаимодействия q3*q4


По оси ординат здесь (вертикальная ось) располагаются средние значения крат­ности покупок глазированных сырков каждой из рассматриваемых половозраст­ных групп. При этом на рисунке видно, что в возрастных группах от 36 до 60 лет и старше 60 лет кратность покупок сырков мужчинами и женщинами практически не различается (соответствующие линии близки к параллели), тогда как в других возрастных группах различие между мужчинами и женщинами выражено доста­точно существенно (соответствующие линии перпендикулярны). Так, мужчины младше 18 лет характеризуются существенно меньшей кратностью покупок сыр­ков, чем женщины младше 18 лет. Мужчины в возрасте до 18 лет имеют наимень­шую кратность покупок и по сравнению со всеми другими половозрастными груп­пами. Мужчины в возрасте 19-35 лет характеризуются наивысшей кратностью покупок сырков среди всех возрастных групп мужчин. Можно заметить, что ситу­ация с женщинами в двух рассматриваемых возрастных группах диаметрально противоположная. Мужчины младше 18 лет имеют наименьшую кратность поку­пок; женщины младше 18 лет — наивысшую. Мужчины от 19 до 35 лет имеют наи­высшую кратность покупок; женщины 19-35 лет — наименьшую.

Таким образом, вы видите, что графики в дисперсионном анализе являются весь­ма ценным ресурсом для построения заключений и выводов. Еще одним направ­лением интерпретации является кластеризация респондентов на основании их средних показателей (например, кратности покупок). Так, в нашем примере на основании кратности покупок можно разделить всех респондентов на следующие целевые сегменты:

1.   мужчины младше 18 лет характеризуются наименьшей кратностью покупок сырков;

2.   мужчины старше 36 лет и женщины старше 19 лет характеризуются средней кратностью покупок сырков;

3.  мужчины от 19 до 35 лет и женщины младше 18 лет характеризуются наивыс­шей кратностью покупок сырков.

В целом общая схема интерпретации графиков в дисперсионном анализе состоит из двух этапов. Сначала следует определить категории респондентов, отличающи­еся и не отличающиеся друг от друга. При этом интерпретация графиков всегда происходит только по двум переменным (представленным по горизонтальной оси и в виде отдельных линий). Для установления различия следует смотреть на фор­му данных линий. Если две (или более) линии близки к параллели, следовательно, различия между данными категориями минимальны (незначимы). В противном случае, если линии пересекаются, следует признать различие между ними суще­ственным (значимым).


Наиболее простым для интерпретации случаем является ситуация, в которой по горизонтальной оси располагается дихотомическая переменная (например, пере­менная Пол). Если линии на отрезке между двумя категориями данной перемен­ной не пересекаются — различий нет; если пересекаются — различия есть. На рис. 3.22 представлен пример максимальных различий (линии пересекаются под прямым углом); на рис. 3.23 — минимальных (линии параллельны).

Рис. 3.22. Значимые различия между взаимодействиями факторов


Рис. 3.23. Незначимые различия между взаимодействиями факторов&#13;&#10;&#13;&#10;



Можно сформулировать следующие рекомендации по построению графиков в дис­персионном анализе.

1.   Для горизонтальной оси лучше выбирать дихотомические вопросы.

2.   Если дихотомических переменных нет, следует выбрать переменную с наимень­шим четным количеством категорий и перекодировать данные категории в дихотомию. Для горизонтальной оси следует выбирать именно данную (уже ди­хотомическую) переменную. Данный способ работает далеко не всегда, ведь часто различия между взаимодействиями факторов находятся именно в тех категориях, которые будут перекодированы (сокращены).

При исследовании трехуровневых взаимодействий (ql x q2 x q3) переменную с наи­меньшим числом категорий (лучше дихотомическую) следует поместить в поле Separate Plots в диалоговом окне Univariate (например, ql), а для остальных двух исследуемых переменных (например, q2 и q3) — следовать вышеописанным пра­вилам. Это будет означать, что в результате будут построены отдельные графики по каждой категории переменной ql, где будут показаны двухуровневые взаимо­действия переменных q2 и q3.

В заключение настоящего раздела необходимо особо отметить, что графики вза­имодействий могут эффективно применяться только при числе взаимодействий 2 (ql х q2) или 3 (ql x q2 x q3). При взаимодействиях первого уровня (ql) мы гово­рим уже не о взаимодействиях как таковых, а о главных эффектах (Main effects), то есть о влиянии на зависимую переменную только каждого фактора в отдельности. В таком случае различия между конкретными группами независимой переменной определяются исходя из результатов апостериорных тестов. При числе взаимо­действий более трех сохраняется возможность разбиения данного взаимодействия на несколько взаимодействий второго или третьего уровней и построения затем серии графиков. Однако в этом случае интерпретация данных графиков является практически неразрешимой задачей.

3.2.2. Одномерный дисперсионный анализ с повторными

измерениями

Одномерный дисперсионный анализ с повторными измерениями (ANOVARM) является расширением одномерного дисперсионного анализа (ANOVA). Цель его заключается в анализе различий между ответами одних и тех же респондентов на одни и те же вопросы в несколько приемов, то есть в течение ряда дискретных временных промежутков.

В качестве примера можно привести панельные исследования, когда одни и те же респонденты (потребители какого-либо продукта) отвечают на одни и те же воп­росы через определенные интервалы времени (скажем, каждый квартал). Одной из основных целей дисперсионного анализа в рассматриваемом случае будет оценка влияния на ответы респондентов временного фактора. Таким образом, в частно­сти, можно установить уровень лояльности к продуктам различных марок: если с течением времени средние оценки продукта марки X существенно не меняются/ возрастают/убывают, следовательно, и отношение респондентов к данной марке сохраняется на прежнем уровне/улучшается/ухудшается. Иными словами, дис­персионный анализ с повторными измерениями может применяться для оценки значимости тенденций.

В маркетинговых исследованиях этот тип статистического анализа находит весь­ма разнообразные применения. Он может применяться не только в процессе ана­лиза баз данных по маркетинговым исследованиям, но и в процессе сбора анкет — для контроля работы интервьюеров. Например, если опрос производится каждый

день в течение недели в одних и тех же местах, можно анализировать средние зна­чения основных переменных, во-первых, по дням недели, а во-вторых, по каждому интервьюеру. Если будут выявлены существенные различия в анкетах интервьюе­ров, то высока вероятность фальсификации (тем интервьюером, анкеты которого наиболее сильно отличаются от остальных).

Необходимо сделать важное отступление. Дело в том, что некоторые источники иногда относят анализ с повторными измерениями к одномерному, а иногда — к многомерному дисперсионному анализу. В справочной системе SPSS не указана явно принадлежность ANOVARM к одной или другой группе статистических ме­тодов. По сути расчетов ANOVARM близок к многомерному дисперсионному ана­лизу, поскольку в качестве зависимой переменной выступают сразу несколько пере­менных, кодирующих ряд временных периодов. Но так как основная задача данного пособия — объяснение практических приемов работы с SPSS для эффективного применения этого программного продукта в маркетинговых исследованиях, мы отдаем предпочтение семантическому толкованию статистических терминов. За­висимые переменные в ANOVARM по смыслу (с точки зрения исследователя) представляют собой фактически одну и ту же переменную, только измеренную многократно. В этой трактовке следует скорее говорить о специфической форме одномерного дисперсионного анализа, в котором зависимая переменная представ­лена набором подпеременных (точно так же, как при кодировании многовариант­ных вопросов; см. раздел 1.4.2). Таким образом, мы придерживаемся точки зрения тех авторов, которые считают ANOVARM видом одномерного дисперсионного анализа (ANOVA).

Итак, в качестве иллюстрации использования одномерного дисперсионного ана­лиза с повторяющимися измерениями рассмотрим следующий пример. Проводится исследование мнений респондентов относительно одежды марки X. Одним из во­просов анкеты является следующий: Поставьте оценку одежды марки X по пятибалль­ной шкале (от 1 — очень плохо до 5 — отлично). Респонденты разделяются на группы по полу и возрасту. Исследование проводится с частотой раз в квартал в течение года. В результате в итоговой базе данных получены три переменные: ql8, ql9 и q20, отражающие уровень оценки респондентами одежды марки X в первом, вто­ром и третьем кварталах, а также две переменные, указывающие пол (q80) и воз­раст (q74) опрошенных. Требуется установить, как меняется общая картина вос­приятия респондентами одежды марки X в течение одного года. Поставленная задача легко решается методом одномерного дисперсионного ана­лиза с повторяющимися измерениями. Откройте диалоговое окно Repeated Measures Define Factor(s) при помощи меню Analyze ► General Linear Model ► Repeated Measures (рис. 3.24). Это диалоговое окно предназначено для формирования временных фак­торов, то есть определения составных переменных, описывающих эти факторы. У нас есть три временных интервала (квартала), поэтому в поле Within-Subject Factor Name напишите название этой составной переменной: кварталы, а в поле Number of Levels — число временных периодов, когда производились измерения (3 квартала). После этого щелкните на кнопке Add, чтобы добавить новую составную перемен­ную в список. Таким способом можно задать сразу несколько составных времен­ных переменных, однако в маркетинговых ис


следованиях в большинстве случаев ограничиваются только одной.

Рис. 3.24. Диалоговое окно Repeated Measures Define Factors


Кнопка Measure служит для задания дополнительных измерений временных пе­ременных, но в маркетинговых исследованиях эта функция обычно не использу­ется.


Щелкните на кнопке Define, и откроется новое диалоговое окно Repeated Measures (рис. 3.25), похожее (как по внешнему виду, так и по своим функциям) на окно Univariate. В этом окне в левом списке всех доступных переменных выберите те, в которых закодированы оценки респондентов в каждый из временных промежут­ков (в нашем случае — ql8, ql9, q20), и последовательно (то есть в порядке возрас­тания периодов) перенесите их в область Within-Subjects Variables (кварталы).

Рис. 3.25. Диалоговое окно Repeated Measures


Теперь в рассматриваемой области определена составная временная переменная, описывающая оценки респондентами одежды марки X в каждый из трех рассмат­риваемых кварталов. Таким образом, область Within-Subjects Variables (кварталы) является аналогом области Dependent Variable в одномерном дисперсионном ана­лизе, только зависимая переменная в нашем случае как бы распадается на три подпеременные, вместе составляющие одно целое. Далее в область Between-Subjects Factor(s) поместите те переменные, которые служат основаниями для различения оценок. В нашем случае это демографические характеристики респондентов: пол (q80) и возраст (q74).

Итак, вы задали все переменные для исследования и можете использовать кноп­ки, расположенные в нижней части этого диалогового окна, — так же, как вы де­лали это при одномерном дисперсионном анализе (см. раздел 3.2.1). В окне Post Нос задайте апостериорные тесты Scheffe (для равных дисперсий) и Tumhale (для неравных дисперсий) для переменных, имеющих более двух категорий (в нашем случае это только q74 — Возраст). В окне Options выберите параметр Homogeneity Tests и в соответствующее поле поместите переменные с двумя категориями, для которых следует рассчитать средние значения (q80 — Пол и все взаимодействия, в которых она участвует). Остальные диалоговые окна аналогичны рассмотрен­ным для одномерного дисперсионного анализа, поэтому мы не приводим их вто­рой раз.

В результате мы выясняем, какой из трех факторов — пол, возраст или время (квар­талы) — определяет различия в оценках одежды марки X. Запустив программу на исполнение щелчком на кнопке ОК, в окне SPSS Viewer вы увидите результаты дисперсионного анализа. В целом они аналогичны результатам, отображаемым при одномерном дисперсионном анализе, однако данные результаты значительно об­ширнее и содержат несколько дополнительных таблиц. Так как настоящее посо­бие посвящено сугубо практическим задачам использования SPSS в маркетинговых исследованиях, мы рассмотрим только ту часть результатов, которая необходима на практике.


Итак, первое, что должно привлечь ваше внимание, — это таблица Box's Test of Equality of Covariance Matrices (рис. 3.26). Тестовая статистика Box показывает, существуют ли статистически значимые различия в оценках респондентов в каждом из анали­зируемых периодов. В нашем случае мы видим высокую значимость (Sig. < 0,001), свидетельствующую о том, что оценки респондентами одежды марки X существен­но меняются от квартала к кварталу.

Рис. 3.26. Таблица Box's Test of Equality of Covariance Matrices


После анализа результатов теста Box мы смотрим на следующую важную табли­цу — Multivariate Tests (рис. 3.27), позволяющую сделать выводы о том, в какой степени выявленные различия определяются влиянием временного фактора, а также взаимодействием этого фактора с другими переменными, включенными

в анализ. Так, в нашем случае мы видим, что непосредственно временной фактор (кварталы) в значительной степени определяет различия в исследуемых оцен­ках (Sig. < 0,001). Сочетание эффектов времени и пола (Кварталы х q80), а также времени и возраста респондентов (Кварталы х q74) с высокой вероятностью опре­деляют различия в оценках одежды (Sig. = 0,002 и 0,024). А вот тройственное взаимодействие всех анализируемых величин в совокупности не оказывает ни­какого влияния на изучаемую разницу в оценках (Sig. = 0,935). Обратите внима­ние на то, что при интерпретации таблицы Multivariate Tests следует оценивать значимость того или иного фактора всегда на основании теста Pillai's Trace. Имен­но этот тест статистической значимости является наиболее надежным (робастп-ным).

Рис. 3.27. Таблица Multivariate Tests&#13;&#10;&#13;&#10;


Мы ответили на два основных вопроса:

1.   изменяются ли статистически значимо оценки респондентами одежды марки X?

2.   чем определяются эти различия: только влиянием временного фактора или так­же влиянием независимых переменных (пола и возраста)?

В результате анализа мы смогли утвердительно ответить на оба вопроса: различия в оценках есть, и они определяются как временем, так и его взаимодействием с полом и возрастом. Дальнейший анализ будет направлен на исследование влия­ния независимых переменных и их взаимодействий по отдельности на оценки респондентов.

Следующие три таблицы: — Mauchly's Test of Sphericity, Tests of Within-Subjects Effects и Tests of Within-Subjects Contrasts — обычно пропускаются, так как они не позволя­ют сделать никаких новых выводов и лишь подтверждают представленные выше результаты. После трех таблиц следуют результаты одномерного дисперсионного анализа для независимых переменных, для которых не производятся повторные измерения, знакомые вам по разделу 3.2.1.

Таблица Levene's Tests of Equality of Error Variances (рис. 3.28) позволяет определить однородность дисперсий в каждый из исследуемых промежутков времени. Так, в нашем случае мы видим, что во всех трех исследуемых кварталах дисперсии одно­родны (Sig. > 0,05).


Рис. 3.28. Таблица Levene's Tests of Equality of Error Variances&#13;&#10;&#13;&#10;




Из таблицы Tests of Between-Subjects Effects (рис. 3.29) мы видим, что и пол, и воз­раст респондентов с весьма высокой вероятностью определяют различия в оцен­ках одежды марки X (Sig. < 0,001), а вот их взаимодействие — нет (Sig. = 0,058).

Рис. 3.29. Таблица Tests of Between-Subjects Effects&#13;&#10;&#13;&#10;        

Теперь нам осталось определить, как именно различаются оценки под влиянием выявленных значимых факторов и их взаимодействий. Во-первых, мы определи-

ли, что на различии в оценках респондентов в каждый из трех анализируемых пе­риодов оказывают влияние пяти эффектов:

■   временной фактор (кварталы);

■   взаимодействие времени с полом;

■   взаимодействие времени с возрастом;

■   пол;

■   возраст.

К сожалению, провести апостериорные тесты для временной переменной SPSS не позволяет, поэтому при определении различий между группами временной переменной приходится ориентироваться исключительно на средние значения (оценки). Возраст является единственной переменной, для которой можно прове­сти стандартные апостериорные тесты (см. далее). Для остальных значимых взаимодействий выводятся средние значения: оценки одежды марки X в каждой рассматриваемой категории респондентов (см. рис. 3.28). Кроме таблиц для дан­ных взаимодействий целесообразно вывести и графики. Это облегчит интерпре­тацию и позволит наглядно определить различия между категориями респон­дентов.

Рис. 3.30. Таблица Homogeneous Subsets (вторая часть: MEASURE_1)&#13;&#10;&#13;&#10;


Завершают вывод результатов одномерного дисперсионного анализа с повторяю­щимися измерениями таблицы апостериорных тестов для переменных с числом категорий более двух1. В нашем случае это две таблицы для переменной Возраст: Multiple Comparisons и Homogeneous Subsets. Первую таблицу мы не приводим из-за ее большого размера, вместо этого приведена дублирующая ее вторая таблица, по­казывающая однородные группы респондентов по оценкам одежды марки X

(рис. 3.30). Из таблицы вы видите, что наивысший уровень оценок достигается в возрастной группе респондентов (в среднем 4,0 балла) младше 25 лет. Респонден­ты старше 25 лет склонны оценивать одежду марки X несколько ниже (в среднем на 3,8 балла).

3.2.3. Многомерный дисперсионный анализ

Многомерный дисперсионный анализ является дальнейшим расширением од­номерного дисперсионного анализа (после рассмотренного в разделе 3.2.2 ANOVARM), предназначенным для одновременного анализа сразу нескольких зависимых и независимых переменных. Процесс проведения многомерного ана­лиза аналогичен рассмотренному выше обычному одномерному дисперсионному анализу, за исключением того, что в данном случае в область для зависимых пере­менных можно поместить сразу несколько переменных, а при интерпретации при­ходится анализировать сразу несколько различий (во всех зависимых перемен­ных).

Давайте рассмотрим процесс проведения многомерного дисперсионного анализа на примере, аналогичном приведённому в разделе 3.2.1 для обычного одномерного дисперсионного анализа, — но в качестве зависимых переменных мы будем рас­сматривать не только кратность покупок глазированных сырков, но и частоту по­купок. В качестве независимых переменных мы возьмем также две переменные: возраст респондентов и количество членов их семей.

Откройте диалоговое окно Multivariate при помощи меню Analyze ► General Linear Model ► Multivariate. Как вы видите на рис. 3.31, оно аналогично окну Univariate. По­местите две зависимые переменные: q5 (Частота покупок) и q6 (Кратность покупок) в область для зависимых переменных Dependent Variables, а переменные q4 (Возраст) и q72 (Количество членов семьи) — в область для независимых переменных Fixed Factor(s). После этого так же, как для одномерного дисперсионного анализа в окне Post Hoc, задайте вывод тестов Scheffe и Tumhale для обеих независимых перемен­ных, а в окне Options отметьте параметр Homogeneity Tests. После этого можно на­чать расчеты, щелкнув на кнопке ОК.

В окне SPSS Viewer появятся результаты многомерного дисперсионного анализа. Первой таблицей, которая должна привлечь ваше внимание, является Box's Test of Equality of Covariance Matrices, представленная на рис. 3.32. В отличие от одномерно­го дисперсионного анализа с повторяющимися измерениями, здесь тест Box дол­жен быть незначимым (как в нашем случае, Sig. = 0,131), так как неравенство дис­персий исследуемых зависимых переменных в многомерном анализе не является положительным фактом. И напротив, равенство дисперсий зависимых перемен­ных является одним из основных условий проведения многомерного дисперсион­ного анализа1.

Таблица Multivariate Tests позволяет сделать выводы относительно влияния не­зависимых переменных в отдельности, а также их взаимодействий на зависимые переменные в целом. Поскольку с практической точки зрения влияние не несет никакой смысловой нагрузки, данная таблица обычно не рассматрива­ется.

Рис. 3.31. Диалоговое окно Multivariate&#13;&#10;&#13;&#10;


Рис. 3.32. Таблица Box's Test of Equality of Covariance Matrices



Следующей важной таблицей является тест Levene на равенство дисперсий зави­симых переменных. Как мы помним из описания одномерного дисперсионного анализа, от факта равенства/неравенства дисперсий в дальнейшем зависит выбор конкретного апостериорного теста: Scheffe или Tumhale. Как вы видите на рис. 3.33, в нашем случае дисперсии равны у обеих зависимых переменных, поэтому далее мы будем опираться на результаты теста Scheffe.

Таблица Tests of Between-Subjects Effects (рис. 3.34) позволяет установить, как каждый эффект влияет на каждую зависимую переменную в отдельности. В от­личие от таблицы Multivariate Tests, рассматриваемая таблица позволяет выяс­нить, на какую конкретно зависимую переменную влияет та или иная незави­симая переменная и их комбинации. В нашем случае мы видим, что частота покупок определяет различия между категориями переменной q4 Возраст (Sig. = 0,045), а кратность покупок — в категориях переменной q72 Количество членов семьи (Sig. < 0,001).


Рис. 3.33. Таблица Levene's Test of Equality of Error Variances&#13;&#10;&#13;&#10;
Рис. 3.34. Таблица Tests of Between-Subiects Effects&#13;&#10;&#13;&#10;



"2 Элементы и процессы твердотельной электроники" - тут тоже много полезного для Вас.

И наконец, последнее, что важно при практической интерпретации результатов многомерного дисперсионного анализа: какие группы каждой из рассматриваемых независимых переменных различаются на основании средних значений зависи­мых переменных. Это позволяют определить апостериорные тесты (в нашем слу­чае Scheffe). Они рассчитываются для каждой комбинации зависимая перемен­ная/ независимая переменная для всех значений индексов i. Эти таблицы по своему виду аналогичны рассмотренным в предыдущих разделах, посвященных диспер­сионному анализу.

Мы не приводим полностью результаты апостериорных тестов из-за их большого объема.

На рис. 3.35 представлены результирующие таблицы Homogenous Subsets, по ко­торым можно сделать выводы относительно различий между отдельными кате­гориями независимых переменных на основании обеих рассматриваемых зави­симых переменных. Также в этих таблицах вы видите однородные кластеры респондентов, различающиеся частотой и кратностью покупок глазированных сырков.


Рис. 3.35. Таблицы Homogeneous Subsets для переменных Возраст и Количество членов семьи&#13;&#10;&#13;&#10;


Итак, в данной главе мы рассмотрели статистические методы, применяемые для анализа различий между целевыми группами респондентов. Несмотря на то что данные методы (особенно обобщенная линейная модель) достаточно сложны для изучения, их применение позволяет поднять аналитическую работу на существен­но более высокий уровень.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5209
Авторов
на СтудИзбе
430
Средний доход
с одного платного файла
Обучение Подробнее