Популярные услуги

Ассоциативный анализ

2021-03-09СтудИзба

Глава 4 Ассоциативный анализ

Ассоциативный анализ служит для выявления связей между переменными. Применительно к маркетинговым исследовани­ям данная группа статистических процедур позволяет ответить на вопросы типа:

■   Влияет ли на частоту посещения магазина уровень дохо­дов покупателей?

■   Как связаны между собой пол респондентов и желание ку­пить мотоцикл?

■   Как влияет на покупательское поведение потребителей су­хих строительных смесей род занятий респондентов?

То есть при помощи ассоциативного анализа становится воз­можным анализировать вопросы анкеты не только по отдель­ности, а в зависимости от других вопросов. Этот вид анализа иногда называют построением разрезов, поскольку он позво­ляет определить не только наличие связи между вопросами анкеты, но и силу связи между переменными и то, каким обра­зом ведет себя одна переменная при изменении другой (воз­растает или убывает).

В процессе ассоциативного анализа выявляются следующие типы зависимостей.

■   Немонотонные зависимости свидетельствуют только о на­личии определенной связи между двумя переменными, но не позволяют судить о направлении или силе связи. При­мер немонотонной зависимости: мужчины в основном по­купают рыбные консервы в продовольственных магазинах, а женщины — на рынках.

Рекомендуемые материалы

■   Монотонные зависимости — это зависимости, по которым можно узнать не только наличие, но и направление связи. Пример монотонной зависимости: мужчины покупают пиво чаще, чем женщины. Монотонные зависимости бывают двух видов:

возрастающие — первая переменная возрастает при возра­стании второй;

убывающие — первая переменная убывает при возрастании второй.

■   Линейные зависимости характеризуются уравнением функции у = а + Ьх (гра­фик линейной функции). Связь между двумя переменными в данном случае является линейной, то есть на основании этой зависимости мы можем сказать, насколько изменится одна переменная при изменении второй.

■   Нелинейные. Примерами нелинейных связей между двумя переменными яв­ляются: экспоненциальная, логарифмическая, степенная, полиномиальная за­висимости — то есть в данном случае связь присутствует и изменяется по како­му-либо известному математическому закону.

Зависимости, выявленные в результате ассоциативного анализа, можно охаракте­ризовать тремя аспектами.

■   По наличию — определенная (систематическая) связь между двумя перемен­ными есть.

■   По направлению — связь является убывающей или возрастающей.

■   По силе — можно определить, насколько тесно связаны между собой две пере­менные, то есть насколько значима данная зависимость.

Между переменными с номинальной шкалой может быть установлена только не­монотонная зависимость, характеризуемая только наличием связи. Для перемен­ных, имеющих порядковую или интервальную шкалу, данное ограничение не дей­ствует — для них можно определить и направление, и силу связи.

4.1. Перекрестные распределения и  

Перекрестные распределения служат для выявления различных типов зависимо­стей между двумя и более переменными. Например, если требуется установить, где покупают сгущенное молоко мужчины и женщины, следует воспользоваться таблицами перекрестных распределений (таблицами сопряженности, или кросста-буляции). На основании перекрестных распределений можно установить не толь­ко наличие зависимости (немонотонной или монотонной) между переменными, но, в большинстве случаев, ее тип (линейная или нелинейная) и направление (возрастающая или убывающая)1. Установленная при помощи перекрестного рас­пределения зависимость может оказаться незначимой из-за малого размера вы­борки или по другим причинам. Статистическую значимость выявленной зависи­мости позволяет определить критерий .

В табл. 4.1 представлены основные характеристики переменных, участвующих в анализе.

Несмотря на то что перекрестные табуляции можно строить по переменным, име­ющим любой тип шкалы, необходимо иметь в виду, что большое количество категорий (вариантов ответа) анализировать трудно. Даже если анализ выявит значимую зависимость, при наличии большого числа категорий переменных ис­следователю будет сложно понять, каким именно образом связаны данные пере­менные.

Таблица 4.1. Основные характеристики переменных, участвующих в перекрестных распределениях

Перекрестные распределения

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

От двух до десяти

Любой

От двух до десяти

Любой

Также следует отметить, что наибольшую эффективность кросстабуляционный ана­лиз показывает на номинальных и порядковых переменных. Для интервальных пе­ременных больше подходит корреляционный анализ, рассматриваемый в разделе 4.2.

И наконец, последним ограничением применения перекрестных распределений для анализа зависимостей между переменными является тот факт, что различные ста­тистические тесты (такие как ) могут быть использованы только при анализе одновариантных переменных. Статистические тесты, применяемые для анализа зависимостей, предназначены только для двух переменных. При наличии допол­нительных слоев или уровней кросстабуляционной таблицы статистический ана­лиз производится для каждого уровня отдельно, при этом на каждом уровне он работает только с двумя переменными. Для многовариантных переменных SPSS содержит возможность отдельного построения кросстабуляции — выявить нали­чие и направление связи в данном случае можно только визуально.

Далее в этой главе мы покажем, как строить перекрестные распределения и анали­зировать зависимости для одновариантных и многовариантных переменных.

4.1.1. Перекрестные распределения для одновариантных вопросов и

Давайте рассмотрим перекрестные распределения для одновариантных вопросов на следующем примере.

ПРИМЕР----------------------------------------------------------------------------------------------

Исходные данные:

В результате маркетингового исследования, посвященного исследованию потребительских предпочтений посетителей развлекательного центра, оказалось, что средняя частота посе­щения центра составляет приблизительно 12 раз в месяц. Также были получены данные о распределении среди посетителей центра мужчин и женщин различных возрастных групп. В ходе подготовительного этапа анализа были сформированы, в частности, три одновариантные переменные:

1)   частота посещения центра (q25);

2)   возраст респондентов (ql8);

3)   пол респондентов (q23). Требуется:

1.    Построить перекрестное распределение частоты посещения развлекательного центра в разрезе возраста и пола респондентов. Рассчитать среднюю частоту посещения цент­ра различными целевыми группами потребителей.

2.    Определить, влияет ли на частоту посещения центра возраст потребителей. Установить статистическую значимость зависимости между частотой посещения и возрастом.

---------------------------------------------------------------------------------------------------------------------

Из условия первой задачи следует, что мы должны построить перекрестное рас­пределение сразу по трем переменным: q25 в зависимости от ql8 и q23 (то есть трехуровневое). Для решения задачи воспользуемся меню Analyze ► Descriptive Sta­tistics ► Crosstabs. В открывшемся диалоговом окне (рис. 4.1) из левого списка, со­держащего все доступные переменные, выберите те, которые будут расположены в строках результирующей таблицы, и те, которые будут расположены в столбцах. Поместите зависимую переменную q25 Частота посещения в область Rows (вариан­ты ответа на вопрос о частоте посещения будут расположены в строках таблицы), а независимую переменную ql8 Возраст — в область Columns (возрастные группы будут расположены в столбцах таблицы). Осталась еще одна независимая пере­менная q23 Пол. Поместите ее в область Layer (уровень или слой таблицы).

Обратите внимание, что всегда, когда обратное не обусловлено задачами исследо­вания, рекомендуется размещать переменные с малым количеством вариантов от­вета в слоях. Это позволит уменьшить размерность результирующей таблицы. Мы можем задать и большее количество измерений таблицы, щелкая на кнопке Next в области Layer и добавляя релевантные переменные. Максимальное количество сло­ев, которое можно задать, щелкая на кнопке Next, — 8. Следовательно, максимально возможное количество измерений перекрестной таблицы по одновариантным воп­росам — 10(10 = 8 слоев + 1 строковая переменная + 1 столбцовая переменная).


В диалоговом окне Crosstabs в область каждого измерения (Rows, Columns, Layer) можно поместить сразу несколько переменных. Максимальное число переменных, которые можно поместить в области Rows и Columns, — 76; для каждого из восьми возможных уровней Layer — 6. Если задано по одной переменной в строке и столб­це (как в нашем случае), все дополнительно указанные слои будут отображаться в одной и той же таблице. Ситуация будет отличаться, если мы укажем несколько переменных для строк, столбцов и слоев в одних и тех же областях (не щелкая на кнопке Next для задания нескольких слоев) перекрестной таблицы. В этом случае будут построены отдельные таблицы для каждой пары строковых и столбцовых переменных.

Рис. 4.1. Диалоговое окно Crosstabs





Теперь, когда вы указали все переменные для анализа, для построения перекрест­ных распределений можно щелкнуть на кнопке ОК. Однако сначала давайте рас­смотрим некоторые другие полезные функции диалогового окна Crosstabs. Щелкни­те на кнопке Cells. Отрывшееся диалоговое окно Cell Display (рис. 4.2) предназначено для задания значений, выводимых в кросстабуляционной таблице. По умолчанию SPSS в каждой ячейке таблицы выводит только количество респондентов (пара­метр Observed). Область Percentages позволяет организовать вывод в ячейках таб­лицы процентов по строкам (Rows), столбцам (Columns), а также от общего числа респондентов, ответивших одновременно на все вопросы, по которым строится перекрестное распределение (Частота посещения, Возраст и Пол) (Total).

Чтобы проиллюстрировать наш пример (расчет средних частот покупки), выве­дем проценты по вопросу Частота посещения внутри каждой возрастной и половой группы респондентов, отметив параметр Columns и проценты по всем возрастным группам в целом (Total). Также оставим выбранный по умолчанию вывод наблю­даемых частот (Observed). После этого можно закрыть окно Cell Display, щелкнув на кнопке Continue.

Рис. 4.2. Диалоговое окно Cell Display
Crosstabs





Следующее диалоговое окно, которое мы рассмотрим, — это Table Format, вызывае­мое при помощи кнопки Format (рис. 4.3). В нем можно выбрать тип сортировки вариантов ответа строковой переменной: возрастающая или убывающая (по алфа­виту). Оставьте выбранный по умолчанию вариант Ascending (возрастающая) и щелкните на кнопке Continue, чтобы закрыть окно. После этого запустите процеду­ру построения перекрестных распределений, щелкнув на кнопке О К в главном ди­алоговом окне Crosstabs. В главном диалоговом окне процедуры есть и другие по­лезные (Ьункпии: мы оассмотоим их ниже.

Рис. 4.3. Диалоговое окно Table Format




После этого в окне SPSS Viewer будет выведена требуемая таблица перекрестного распределения (рис. 4.4). В ячейках данной таблицы находятся искомые частоты

посещения развлекательного центра каждой из анализируемых целевых групп опрошенных. Например, первая ячейка показывает, что 5 (строка Count) респон­дентов-мужчин в возрасте от 18 до 25 лет посещают развлекательный центр каж­дый день. Это составляет 8,1% (подстрока % within Возраст) от общего количества мужчин в возрасте от 18 до 25 лет, ответивших на три предложенных вопроса, или 1,5% (подстрока % of Total) от общего числа мужчин, ответивших на вопросы (это число 333, оно представлено на пересечении строки и столбца Total в первой части таблицы Мужчины).

Строка Total показывает, сколько всего мужчин из каждой возрастной группы от­ветили на вопрос о частоте посещения центра (в нашем случае 62 респондента-мужчины в возрасте от 18 до 25 лет). Столбец Total показывает, сколько всего муж­чин, посещающих развлекательный центр с различной частотой, ответили на вопрос о возрасте (в нашем случае 15 респондентов-мужчин, посещающих центр каждый день).


Вторая часть таблицы Женщины построена аналогичным образом. Как вы видите, 15,8% женщин в возрасте от 41 до 45 лет посещают развлекательный центр 1-2 раза в месяц.

Рис. 4.4. Таблица перекрестного распределения по трем вопросам: Частота посещения, Возраст и Пол




На основании представленной таблицы перекрестного распределения вы можете рассчитать вручную средневзвешенные частоты посещения респондентами развле­кательного центра в зависимости от их пола и возраста. Для этого скопируйте ана­лизируемую таблицу в Microsoft Excel, щелкнув на ней правой кнопкой мыши в окне SPSS Viewer и выбрав пункт Сору (не Copy Objects !). Окончательный вид по­лученного распределения представлен в табл. 4.2.

Таблица 4.2. Средневзвешенные частоты посещения развлекательного центра в зависимости от пола и возраста респондентов (раз в месяц)

Пол

Возраст

ОТ 18 до 25 лет

От 26 до 30 лет

От 31 до 35 лет

От 36 до 40 лет

От 41 до 45 лет

От 46 до 50 лет

От 51 до 55 лет

Старше 55

Мужчины

12

12

12

12

13

13

9

10

Женщины

11

12

14

12

10

12

11

12

Из представленной таблицы следует, что средняя частота посещения развлекатель­ного центра различными половозрастными группами респондентов несколько раз­личается. Однако, исходя только из визуальных предположений, нельзя утверж­дать то, что частота посещения центра действительно зависит от пола и возраста. Для этого любая выявленная закономерность должна удовлетворять условию ста­тистической значимости. Определить, значима ли выявленная нами зависимость, позволяют статистические тесты, выполняемые при построении перекрестных рас­пределений.

Далее мы покажем, как решается второй пункт нашей задачи (условие см. выше), то есть как ответить на вопрос: «Действительно ли существует статистически зна­чимая зависимость между тремя анализируемыми переменными или показанные в табл. 4.2 различия в частотах посещения центра вызваны влиянием случайных факторов (то есть как таковой зависимости нет)?».

Выявить статистическую значимость зависимостей между переменными позволя­ют критерий  и сопутствующие тесты. Исследуем нашу зависимость между час­тотой посещения развлекательного центра, полом и возрастом респондентов на предмет статистической значимости. Для этого вновь откройте диалоговое окно Crosstabs. В этом окне остались две не рассмотренные нами кнопки: Exact и Statistics — именно они позволяют исследовать значимость перекрестных распределений. По умолчанию SPSS определяет статистическую значимость только на основании асимптотического метода. Одной из разновидностей данного метода и является . Данный критерий используется наиболее часто в маркетинговых исследовани­ях. Однако применение асимптотического критерия  накладывает на данные, содержащиеся в анализируемой перекрестной таблице, существенные ограниче­ния, которые подробно описаны ниже.

Так, важнейшим требованием к исследуемым данным является достаточно боль­шие значения в ячейках таблицы. При наличии небольших по размеру выборок или при построении разрезов третьего и более уровня данное условие является недостижимым. Исходя из опыта анализа данных в маркетинговых исследовани­ях, можно утверждать, что подобные ситуации встречаются достаточно часто. В свя­зи с этим в случае несоответствия имеющихся данных общепринятому критерию  следует воспользоваться другими статистическими методами.

Сначала на примере перекрестного распределения по трем переменным рассмотрим использование наиболее популярного статистического метода установления стати­стической значимости зависимостей — критерия . Для того чтобы организовать наряду с перекрестной таблицей вывод соответствующих статистик, в главном диа­логовом окне Crosstabs щелкните на кнопке Statistics (рис. 4.5). В открывшемся диа-

логовом окне выберите параметр Chi-square ). Это позволит впоследствии опреде­лить, имеется ли определенная связь между исследуемыми переменными.

При анализе зависимостей, кроме обнаружения наличия связи, также можно оп­ределить, насколько сильно выражена данная зависимость (установить силу связи). Сделать это позволяют релевантные статистические тесты, применяемые отдель­но для каждого из трех типов переменных, участвующих в анализе. Для номиналь­ных переменных следует применять один из тестов, представленных в области Nominal. Наиболее универсальным и часто применяемым методом является V Cra­mer's. Для порядковых переменных следует применять один из методов, представ­ленных в области Ordinal. Мы рекомендуем использовать наиболее универсальный метод: Gamma. Теоретически этот же метод можно применять и для интервальных переменных, однако все же для них рекомендуется использовать более релевант­ную процедуру корреляционного анализа.

Далее рассмотрим, как применять перечисленные статистические методы на приме­ре нашей задачи с двумя порядковыми переменными Частота посещения развлека­тельного центра и Возраст. Для этого выберите параметр Gamma и закройте описываемое окно, щелкнув на кнопке Continue. Запустите процедуру построения перекрестных распределений, щелкнув на кнопке ОК в главном диалоговом окне Crosstabs.

Рис. 4.5. Диалоговое окно Statistics



В окне SPSS Viewer появится уже рассмотренная выше таблица перекрестного распределения трех переменных: Частота посещения, Возраст и Пол. Но, в отличие от предыдущего случая, ниже будут отображены две таблицы, из которых можно уз­нать о наличии, силе и направлении (только для порядковых и интервальных пере­менных) связи между анализируемыми переменными. Рассмотрим их по порядку.

В первой таблице, Chi-Square Tests, выводятся результаты расчета критерия  (строка Pearson Chi-Square) и некоторых других статистик (рис. 4.6). Необходимо отметить, что расчет всех статистических процедур производится для каждого варианта пе­ременной, расположенной в слоях (в нашем случае Пол) по отдельности (то есть отдельно для целевых групп мужчин и женщин). Данное обстоятельство уже было отмечено выше.

В нашем примере для респондентов-мужчин величина критерия  — 56,048, одна­ко для практических целей важна не столько сама величина, столько ее значимость, представленная в столбце Asymp. Sig. (2-sided). Именно из условия статистической значимости критерия  следует статистическая значимость всей зависимости. В нашем примере значимость анализируемого критерия и для муж­чин, и для женщин достаточно высока (0,001 и 0,014 соответственно), что позволяет сделать предварительный вывод о том, что между частотой посещения развлека­тельного центра и возрастом для каждой половой группы респондентов существу­ет определенная статистически значимая зависимость. Тем не менее одной значи­мости критерия  недостаточно, чтобы с уверенностью утверждать о наличии значимой зависимости между тремя анализируемыми переменными. Для этого необходимо, чтобы выполнялись следующие два критерия.

Процент ячеек, в которых ожидаемые значения1 (Expected counts) меньше или равны 5, должен быть менее или равным 20 %. Это значение отображается в при­мечании «а» в первой строке после таблицы Chi-Square Tests. На практике приемле­мая доля ожидаемых частот меньше 5 может отклоняться от 20 % (в пределах +5 %). При наличии ярко выраженной зависимости можно считать такую зависимость статистически значимой. Также всегда необходимо иметь в виду практические со­ображения (и это относится ко всем без исключения статистическим процедурам). Если ожидаемые частоты меньше 5 у переменных, представляющих малую прак­тическую значимость для исследователя, — значит, можно не принимать в расчет рассматриваемый критерий и признать зависимость значимой по практическим соображениям. Как видно на рис. 4.58, в нашем случае 55 % ячеек имеют ожидае­мые значения меньше 5 (при этом минимальное ожидаемое значение 0,32). Следо­вательно, несмотря на то что критерий  является статистически значимым, он не удовлетворяет рассматриваемому дополнительному условию.

Суммы по строкам и столбцам должны быть больше 0. В нашем случае данное условие удовлетворяется.

Еще одной не рассмотренной статистикой в таблице Chi-Square Tests является тест Mantel-Hanzel (строка Linear-by-Lf near Association). Его значимость позволяет сде­лать вывод о наличии линейной зависимости между неноминальными перемен­ными. Если величина данного теста статистически значима, следовательно, между строковой и столбцовой переменными есть линейная зависимость. В нашем слу­чае (рис. 4.6) линейная зависимость между возрастом и частотой посещения раз­влекательного центра существует только в целевой группе респондентов-женщин. Про мужчин подобное сказать нельзя.


После того как мы установили наличие зависимости между тремя анализируе­мыми переменными (при этом между возрастом и частотой посещения для рес­пондентов-женщин существует и линейная зависимость), можно приступить к анализу таблицы Symmetric Measures (рис. 4.7), чтобы определить силу выяв­ленной связи.

Рис. 4.6. Таблица Chi-Square Tests




Рис. 4.7. Таблица Symmetric Measures для порядковых переменных


Для порядковых переменных (как в нашем случае) определить силу связи позво­ляет критерий Gamma. Этот показатель может варьироваться в интервале от -1 (мак­симально разнонаправленная зависимость) до 1 (полная зависимость); значение О показывает полное отсутствие зависимости. Значение критерия Gamma представ­лено в столбце Value таблицы Symmetric Measures. В нашем случае в группе респон­дентов-мужчин имеется лишь весьма слабая положительная зависимость (Gamma = 0,080). Столбец Approx. Sig. свидетельствует о том, что данная зависимость еще и статистически незначима. Обратная ситуация в группе респондентов-женщин: для них установлена слабая, но статистически значимая положительная зависимость между возрастом и частотой посещения развлекательного центра.


Если в перекрестном анализе участвуют номинальные переменные, силу (но не направление) связи позволяет определить критерий Cramer's V. Отображение этого критерия можно установить в диалоговом окне Statistics при помощи параметра Phi and Cramer's V (см. рис. 4.5).

Давайте рассчитаем данный критерий для наших переменных. Результаты расче­тов представлены на рис. 4.8. В целом, критерий Cramer's V может варьироваться в пределах от 0 до 1, где 0 показывает отсутствие связи между исследуемыми переменными, а 1 — полную зависимость. В нашем случае и для мужчин, и для женщин есть статистически значимые (как показывает столбец Approx. Sig.) слабые зависи­мости (для мужчин Cramer's V = 0,205; для женщин = 0,176). Необходимо отме­тить, что значение 1 для теста Cramer's V является практически недостижимым, поэтому значения 0,8-0,9 следует считать весьма высокими.


Рис. 4.8. Таблица Symmetric Measures для номинальных переменных (пример)


Итак, мы определили, что между тремя анализируемыми переменными — возра­стом, полом и частотой посещения респондентами развлекательного центра — есть слабые, но статистически значимые зависимости. Вместе с тем было уста­новлено, что больше половины (55 %) ячеек в перекрестной таблице имеют ожи­даемые частоты меньше 5 — из чего следует вывод о неприменимости теста  и сопутствующих асимптотических тестов (Gamma и Cramer's V) в нашем случае. В принципе мы ответили на второй пункт задачи (условие см. выше) и можем сказать, что различия, выявленные в ходе перекрестного анализа (см. табл. 4.2), действительно имеют место и являются статистически значимыми. Однако доб­росовестный аналитик в такой ситуации все же попытается доказать истинность сделанных выводов.

Когда анализируемые данные не удовлетворяют требованиям, предъявляемым асимптотическими методами (как, например, в нашем случае ), есть другая воз­можность установить статистическую значимость исследуемой зависимости. Это позволяют сделать точные (Exact) тесты.

Откройте главное диалоговое окно перекрестного анализа Crosstabs (см. рис. 4.1), щелкнув на кнопке Exact. В появившемся диалоговом окне Exact Tests (рис. 4.9) по умолчанию установлен расчет только асимптотических критериев. Данное диало­говое окно позволяет провести расчеты по двум неасимптотическим методам: Monte-Carlo и Exact, причем последний метод не рекомендуется использовать в практичес­ких целях, так как он занимает много времени. Для практических целей следует применять метод Monte-Carlo с установленным по умолчанию количеством выбо­рок (10 000). Доверительный уровень 99 % практически всегда является слишком высоким, поэтому измените его на 95 %, что соответствует доверительному уров­ню при расчете статистической ошибки выборки для маркетинговых исследова­ний (см. раздел 1.2). Все остальные параметры диалогового окна Crosstabs аналогичны указанным в предыдущем примере. Теперь можно запустить проце­дуру построения перекрестных распределений.

Рис. 4.9. Диалоговое окно Exact Tests




После завершения всех необходимых расчетов в окне SPSS Viewer будут выведе­ны результаты. Их структура аналогична рассмотренной выше, за исключением того, что таблицы Chi-Square Tests и Symmetric Measures расширены за счет результа­тов теста Monte-Carlo. Единственным практическим результатом данного теста является рассчитанная статистическая значимость критериев, указанных в диало­говом окне Statistics (см. рис. 4.5).


На рис. 4.10 представлена таблица Chi-Square Tests с результатами теста Monte-Carlo. Искомые значения статистической значимости представлены в столбце Monte Carlo Sig. (2-sided) в подстолбце Sig.. В подстолбцах Lower Bound и Upper Bound показаны, соответственно, нижний и верхний пределы, в которых варьируется значение стати­стической значимости Sig.. Так, в нашем случае критерий  действительно свиде­тельствует о наличии статистически значимой зависимости между полом, возрас­том и частотой посещения развлекательного центра — это следует из весьма высокой значимости теста Monte-Carlo (0,001 — для мужчин и 0,012 — для женщин). В 95 % случаев данное значение не выходит за рамки статистической значимости (например, для мужчин оно варьируется в пределах от 0,001 до 0,002). Также из таблицы мы ви­дим, что выявленная связь является линейной только для целевой группы респонден­тов-женщин. Таким образом, для нашего случая все предварительные выводы, сде­ланные нами в таблице Chi-Square Tests, подтвердились результатами теста Monte-Carlo.

Рис. 4.10. Таблица Chi-Square Tests с результатами теста Monte-Carlo



Теперь рассмотрим таблицу Symmetric Measures (рис. 4.11), на основании которой мы сделали выводы о силе выявленной зависимости. Результаты теста Monte-Carlo и в данном случае подтверждают выводы асимптотического метода: между часто­той посещения центра и возрастом в целевой группе респондентов-женщин выяв­лена слабая статистически значимая зависимость. Для мужчин зависимость ста­тистически незначима.

Рис. 4.11. Таблица Symmetric Measures с результатами теста Monte-Carlo


Таким образом, мы выяснили, что между частотой посещения развлекательного центра и возрастом респондентов-женщин существует статистически значимая зависимость, характеризующаяся слабой положительной линейностью. Для рес­пондентов-мужчин возраст и частота посещения центра также связаны статисти­чески значимой зависимостью, однако сделать точный вывод о характере данной зависимости не представляется возможным.

Вернемся к табл. 4.2 и покажем, как интерпретировать представленные в ней дан­ные. На основании проведенных расчетов можно утверждать, что мужчины в воз­расте старше 51 года посещают развлекательный центр реже всего (примерно 2 раза в неделю). Наиболее частыми посетителями развлекательного центра являются мужчины в возрасте младше 50 лет (примерно 3 раза в месяц). В целевой группе женщин можно выделить три группы. Наиболее частыми посетителями являются женщины в возрасте 31-35 лет (примерно 4 раза в неделю). Среднюю группу (при­мерно 3 раза в неделю) составляют женщины младше 30 лет, от 36 до 40 лет и стар­ше 46 лет. И наконец, группу респондентов-женщин, посещающих центр реже все­го, составляет возрастная группа от 41 до 45 лет.

4.1.2. Перекрестные распределения для многовариантных вопросов

Как уже было сказано выше (см. раздел 3.2), все статистические процедуры при­менимы только для одновариантных вопросов. На практике установить статисти­ческую зависимость в многовариантных вопросах можно только двумя способами.

■ Визуально. В этом случае аналитик должен самостоятельно (на основании опыта или опираясь на другие данные, выявленные в ходе исследования) попытаться сделать заключение о значимости различий между двумя переменными. На­пример, если мужчины покупают сметану в упаковке в 4 раза чаще, чем женщи­ны, и при этом число респондентов, ответивших на данный вопрос, достаточно велико (скажем, 100 человек), можно сделать вывод о статистической значимо­сти данного различия.

■   Можно рассматривать многовариантный вопрос как несколько дихотомических переменных с вариантами ответа «есть/нет» и строить по ним стандартные пе­рекрестные распределения (при помощи процедуры Crosstabs). На практике в подавляющем большинстве случаев именно данный способ является оптималь­ным. Тем не менее необходимо отметить, что дихотомические переменные, яв­ляющиеся вариантами ответа на многовариантный вопрос, могут принимать участие даже в корреляционном анализе в качестве порядковых переменных (см. раздел 4.2).

Кроме существенных ограничений при установлении статистических зависимо­стей между многовариантными переменными, их анализ осложнен также и тем, что результаты перекрестных распределений по многовариантным вопросам SPSS выводит только в виде простого текста (plain text)1.

Ниже мы проиллюстрируем процесс построения перекрестных распределений по многовариантным переменным на примере двух многовариантных вопросов из маркетингового исследования московского рынка сметаны. Первый вопрос Где Вы покупаете сметану? (q7) с вариантами ответа:

■   продмаг (q7_l);

■   рынок (q7_2);

■   супермаркет (q7_3);

■   палатка (q7_4);

■   универсам (q7_5).

Второй вопрос Какую сметану Вы предпочитаете? с вариантами ответа:

■   в упаковке (ql6_l);

■   развесную (ql6_2).

Как было сказано выше в разделе 2.2.2, чтобы строить распределения (линейные или перекрестные) по многовариантным переменным, сначала их нужно сформи­ровать. Мы не будем возвращаться к процедуре создания многовариантных пере­менных при помощи меню Analyze ► Multiple Response ► Define Sets; этот процесс опи­сан в разделе 2.2.2. Давайте исходить из того, что вы самостоятельно сформировали две многовариантные переменные, назовем их q7 (Место покупки сметаны) и ql6 (Наи­более предпочтительная для респондентов упаковка сметаны). Теперь можно заняться построением перекрестного распределения по этим вопросам, то есть ответить на вопрос: «Зависят ли предпочтения респондентов в отношении сметаны (упако­ванной или развесной) от места совершения покупки?».

Построение перекрестного распределения по многовариантным вопросам осуще­ствляется при помощи меню Analyze ► Multiple Response ► Crosstabs. В открывшемся диалоговом окне (рис. 4.12) слева вы видите два списка переменных. В верхнем находятся все доступные переменные из файла данных (включая и дихотомиче­ские переменные — варианты ответа на анализируемые многовариантные вопро­сы). Нижний список содержит только сформированные нами многовариантные переменные ($q7 и $ql6). В перекрестном анализе могут принимать участие как


многовариантные переменные, так и другие доступные одновариантные перемен­ные. Как для кросстабуляций (см. раздел 4.1.1), для перекрестных таблиц можно задать несколько измерений (максимум три) при помощи введения одного допол­нительного слоя (область Layer). Имейте в виду, что при построении перекрестных таблиц, переменные, находящиеся в областях Row(s), Column(s) и Layer(s), перекре­щиваются по тройкам последовательно.

Рис. 4.12. Диалоговое окно Multiple Response Crosstabs





Итак, поместите в область Row(s) переменную Место покупки сметаны (q7), а в об­ласть Column(s) — переменную Предпочтения сметаны (ql6). В область Layer(s) поме­стите переменную Пол (q3).

Как вы поняли, мы будем рассматривать трехмерное перекрестное распределение. Обратите внимание на то, что при внесении в одну из трех областей переменной из верхнего левого списка (всех доступных переменных в базе данных) после имени этой переменной появляется строка символов вида (? ?) и становится доступной кнопка Define Ranges. Это подсказывает нам, что следует ввести границы измене­ния одновариантной переменной. Выделите переменную q3 в поле Layer(s) и щелк­ните на кнопке Define Ranges.


На экране появится новое диалоговое окно Define Variable Ranges (рис. 4.13). В нем в соответствующих полях следует указать минимальное Minimum и максималь­ное Maximum значения, которые может принимать данная переменная. В нашем случае пол респондентов может быть либо мужским (код 1), либо женским (код 2). Поэтому введите 1 в качестве минимального значения, а 2 — в качестве макси­мального и щелкните на кнопке Continue для того, чтобы закрыть это диалоговое окно.

Рис. 4.13. Диалоговое окно Define Variable Ranges




Необходимо отметить, что переменные, участвующие в рассматриваемом статис­тическом анализе, для которых указываются интервалы допустимых значений, должны принимать только целые значения (дробные SPSS будет игнорировать). Это связано с ограничением при использовании в кросстабуляциях по многовари­антным вопросам переменных с интервальной шкалой. Такие переменные могут использоваться, только если они принимают целые значения.

Щелкните на кнопке Options. Открывшееся диалоговое окно (рис. 4.14) позво­ляет указать, нужно ли выводить проценты (по строкам — Row, по столбцам — Column или общие — Total), а также определить, что является базой для расчета процентов: количество респондентов (Cases) или количество ответов на вопрос (Responses)1.


Рис. 4.14. Диалоговое окно Options




Давайте выведем проценты по строкам (то есть доли респондентов, предпочитаю­щих разный вид сметаны в каждом из пяти рассматриваемых типов торговых то­чек). Оставьте выбранный по умолчанию параметр Cases в области Percentages Based on — это позволит вам рассчитать проценты от общего числа респондентов (гис­тограмма), а не от количества ответов на вопрос (сектограмма). Щелкните на кнопке Continue для того, чтобы закрыть диалоговое окно, и запустите процедуру построе­ния перекрестного распределения при помощи щелчка на кнопке О К в главном диалоговом окне программы.

В окне SPSS Viewer будет выведена перекрестная таблица с результатами рас­четов. Обратите внимание, что таблица разбита на две части: первая содержит результаты построения перекрестного распределения предпочтений сметаны и места покупки для мужчин (рис. 4.15), а вторая — для женщин (рис. 4.16). Та­ким образом, можно сказать, что собственно построения перекрестного распре­деления по трем заданным переменным (включая переменную Пол) не проис­ходит.


Переменная, указанная в качестве слоя (Layer), не отображается в таблице. Вместо этого ее значение (для каждого из вариантов ответа, в нашем случае — мужчины и женщины) отображается в верхней части каждой кросстабуляции как текст Category = 1 Мужчины (для мужчин) и Category = 2 Женщины (для женщин).

Рис. 4.15. Таблица Crosstabulation для мужчин



Рис. 4.16. Таблица Crosstabulation для женщин





В нижней части под всеми таблицами расположены две строки, содержащие ин­формацию об общих параметрах построения перекрестных распределений. Так, в нашем случае мы видим, что все проценты, представленные в таблицах, рассчита­ны от общего числа респондентов (Percents and totals based on respondents). Во вто­рой строке отражаются:

■   количество результативных анкет (то есть анкет, в которых респонденты отве­тили на три вопроса) — 940 valid cases;

■   количество анкет, не включенных в анализ (респонденты не дали ответа хотя бы на один из трех вопросов), — 63 missing cases.

Общий размер выборки равен сумме результативных и исключенных анкет: 1003 = 940 + 63. В таблицах приведены результаты построения перекрестного распределе­ния предпочтений респондентов по типу сметаны в зависимости от места покупки. Необходимо отметить, что проценты в ячейках таблицы отражают доли покупате­лей, предпочитающих сметану в упаковке и развесную для каждого из рассматрива­емых мест покупки. Например, 75,5 % мужчин, покупающих сметану в продоволь­ственных магазинах, предпочитают сметану в упаковке, а 24,5 % — развесную1.

Проценты в строке Column Total отражают доли респондентов, предпочитающих сметану в упаковке или развесную, от общего числа респондентов (в нашем случае мужского или женского пола), ответивших на рассматриваемые вопросы. Напри­мер, 79 % мужчин, ответивших на рассматриваемые вопросы, предпочитают упа­кованную сметану, а 21 % — развесную.

Проценты в столбце Row Total отражают доли респондентов, покупающих сметану в различных торговых точках. На рис. 4.15 вы видите, что 51,9 % мужчин, ответив­ших на рассматриваемые вопросы, покупают сметану в продовольственных магази­нах. Значения на пересечении строки Column Total и столбца Row Total показывают общее количество респондентов мужского пола, ответивших на вопросы о пред­почтениях сметаны и месте покупки (как и всегда, в абсолютных и относительных величинах). В нашем случае на рассматриваемые вопросы ответил 181 мужчина. Обратите внимание, что длинные таблицы, выводимые в виде текста, могут по умолчанию не отражаться полностью в окне SPSS Viewer. Чтобы убедиться, что вы видите таблицу целиком, дважды щелкните мышью на ней. Откроется специ­альная область с возможностью прокрутки, в которой вы можете увидеть все пост­роенные таблицы.

4.2. Корреляционный анализ

Корреляционный анализ предназначен для выявления наличия, а также опреде­ления направления и силы линейной связи между несколькими переменными, имеющими интервальный или порядковый тип шкалы. Необходимо отметить, что дихотомические переменные также могут принимать участие в корреляционном анализе. С точки зрения SPSS они рассматриваются как порядковые переменные.

В табл. 4.3 представлены основные характеристики переменных, участвующих в анализе.

Таблица 4.3. Основные характеристики переменных, участвующих в корреляционном анализе

Корреляционный анализ

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

_

_

Любое

Интервальная

Порядковая

Дихотомическая

Наличие, направление и силу линейной связи отражают коэффициенты корреля­ции. Они варьируются от -1 до +1.

■   -1 соответствует абсолютно разнонаправленной зависимости (с возрастанием одной переменной другая убывает);

■   +1 отражает полное соответствие между переменными (то есть они, по сути, являются одним и тем же);

■   0 показывает полное отсутствие всякой связи.

Для удобства интерпретации корреляций применяются семантические интерва­лы, причем при анализе данных в маркетинговых исследованиях обычно исполь­зуются следующие градации (табл. 4.4).


Таблица 4.4. Градации коэффициентов корреляции

Значение коэффициента корреляции

Характеристика силы линейной связи

От ±0,81 до ±1,00

Сильная

От ±0,61 до ±0,80

Умеренная (средняя)

От ±0,41 до ±0,60

Слабая

От ±0,21 до ±0,40

Очень слабая

От ±0,00 до ±0,20

Нет корреляции

Существует два основных типа коэффициентов корреляции, рассчитываемых в за­висимости от вида шкалы переменных, участвующих в анализе.

1.   Для переменных с интервальной шкалой применяется коэффициент корреля­ции Пирсона. Он позволяет охарактеризовать линейную связь между двумя пе­ременными по указанным параметрам (табл. 4.4): наличию (есть/нет), направле­нию (убывает/возрастает) и силе (очень слабая/слабая/умеренная/сильная).

2.   Если хотя бы одна из пары исследуемых переменных имеет порядковую или дихотомическую шкалу, используются ранговые коэффициенты корреляции Спирмана или Кендала. Чаще всего эти коэффициенты применяются в марке­тинговых исследованиях в тех случаях, когда необходимо установить степень соответствия двух ранжированных списков. Например, если имеются схемы выбора какого-либо продукта различными целевыми группами респондентов (в виде ранжированных по важности параметров) и необходимо установить, насколько точно они соответствуют друг другу (или различаются).

Ниже мы рассмотрим перечисленные типы коэффициентов корреляции более под­робно на практических примерах из маркетинговых исследований.

4.2.1. Исследование линейных корреляций по Пирсону, Спирману и Кендалу

Сначала мы рассмотрим пример применения коэффициента корреляции Пирсо­на. Предположим, что у нас есть ответы респондентов на следующие два вопроса. Каков Ваш среднемесячный доход в расчете на одного члена семьи? с вариантами ответа:

■   до $100;

■   от $ 100 до $ 300;

■   от $ 300 до $ 600;

■   от $ 600 до $ 1000;

■   от $ 1000 до $ 1500;

■   свыше $1500.

Как часто Вы посещаете рестораны? с вариантами ответа:

■   более 1 раза в день;

■   примерно 1 раз в день;

■   2-3 раза в неделю;

■   примерно 1 раз в неделю;

■   2-3 раза в месяц;

■   примерно 1 раз в месяц;

■   реже 1 раза в месяц.

В результате ввода в компьютер заполненных анкет респондентов были получены две переменные: q3 (первый вопрос) и q28 (второй вопрос). Необходимо устано­вить, зависит ли частота посещения ресторанов от дохода респондентов, и если да, то каким образом. В связи с тем, что в ходе опроса при ответе на каждый вопрос респондентам предлагалось на выбор несколько вариантов ответа, тип шкалы у полученных переменных получился порядковым (в файле данных есть только коды ответов, но не сами числовые значения, отражающие частоту посещения рестора­на или уровень дохода).

Далее мы рассмотрим не только как использовать коэффициент корреляции Пир­сона, но также как использовать данный коэффициент для анализа квазипорядко­вых переменных. Дело в том, что некоторые переменные, хотя они и закодированы как порядковые, по сути являются интервальными (как в нашем случае). Это де­лается специально, чтобы, с одной стороны, увеличить долю респондентов, от­ветивших на вопрос, а с другой стороны, уменьшить число возможных ошибок при вводе в компьютер текстовых полей (для открытых вопросов). Интервалы также полезны при анализе, поскольку нет необходимости кодировать текстовые (или интервальные) переменные, а можно сразу увидеть группы (интервалы) значений. Практика показывает, что подобное составление анкет для маркетинговых иссле­дований является стандартным, поэтому корреляционный анализ редко проводится на изначально интервальных переменных (текстовые поля анкеты).

Для описываемых квазипорядковых переменных следует применять именно ко­эффициент корреляции Пирсона. Использование коэффициентов Спирмана или Кендала в этом случае является некорректным. Более подробно эти два коэффи­циента представлены ниже; пока же в общих чертах о них можно сказать следую­щее. Коэффициенты Спирмана или Кендала показывают только степень соответ­ствия порядка следования вариантов ответа в ранжированных списках (есть отсутствие инверсий). При этом корреляции по Спирману и Кендалу используют­ся в основном, когда элементы ранжированных списков представлены мнемони­ческими, а не числовыми константами. Таким образом, данные коэффициенты не помогут нам в характеристике зависимости между частотой посещения рестора­нов и доходом респондентов. Однако в нашем случае нельзя применять и коэффи­циент корреляции Пирсона, так как в этом случае анализировались бы коды ин­тервалов (1 -6 — в первом вопросе и 1 -7 — во втором), а не действительные ответы респондентов на вопросы1.

Итак, сначала мы должны преобразовать имеющиеся у нас порядковые перемен­ные к интервальному виду. Лучше всего сделать это при помощи замены кодов интервалов (1-6) на средние значения данных интервалов. Например, среднее зна­чение для интервала 3 в переменной q3 — это $ 450 (450 = (300 + 600) / 2). Преоб­разовав обе переменные к данному виду, мы получим следующие интервальные переменные q3_i и q28_i (табл. 4.5)2.

Таблица 4.5. Схема перекодировки порядковых переменных (q3 и q28) в интервальные (q3_i и q28_i)

Порядковые переменные

Интервальные переменные

Каков Ваш среднемесячный доход в расчете на одного члена семьи?

до $ 100

$50

от $ 100 до $ 300

$200

от $ 300 до $ 600

$450

от $ 600 до $ 1000

$ 800

от $ 1000 до $ 1500

$ 1250

свыше $ 1500

$ 1750

Как часто Вы посещаете рестораны?

более 1 раза в день

60 раз в месяц

примерно 1 раз в день

30 раз в месяц

2-3 раза в неделю

10 раз в месяц

примерно 1 раз в неделю

4 раза в месяц

2-3 раза в месяц

2,5 раза в месяц

примерно 1 раз в месяц

1 раз в месяц

реже 1 раза в месяц

0,5 раза в месяц


Теперь мы можем приступить непосредственно к корреляционному анализу (опи­санию зависимости между частотой посещения ресторанов и уровнем дохода). Для этого выберите пункт меню Analyze ► Correlate ► Bivariate. В открывшемся диалого­вом окне (рис. 4.17) выберите в левом списке всех доступных переменных две ин­тересующие нас (q3_i и q28_i) и перенесите их в область Variables. Остальные пара­метры в этом диалоговом окне, установленные по умолчанию, следует оставить неизменными: вывод коэффициентов корреляции Пирсона (параметр Pearson в области Correlation Coefficients) и статистической значимости коэффициентов (па­раметр Two-tailed в области Test of Significance). Кнопка Options не предлагает иссле­дователю каких-либо существенных параметров. Чтобы запустить процедуру по­строения корреляционной таблицы, щелкните на кнопке ОК.

Рис. 4.17. Диалоговое окно Bivariate Correlations (корреляция Пирсона)




В окне SPSS Viewer появится таблица Correlations с результатами расчетов коэффи­циента корреляции Пирсона и статистической значимости данного коэффициента. Как видно из рис. 4.18, в нашем случае коэффициент корреляции Пирсона между двумя исследуемыми переменными (q3_i и q28_i) равен +0,665, а его статистическая значимость меньше 0,001. Следовательно, можно сделать вывод о том, что между среднемесячным доходом респондентов и частотой посещения ими ресторанов су­ществует статистически значимая умеренная (средняя) линейная возрастающая за­висимость. То есть частота посещения ресторанов в достаточно высокой степени (коэффициент Пирсона = 0,7) зависит от уровня доходов потребителей, причем при росте среднемесячного дохода частота посещения ресторанов линейно возрастает.

Существует возможность проводить корреляционный анализ сразу для нескольких переменных. Для этого необходимо поместить эти переменные в область Variables диалогового окна Bivariate Correlations. В таблице Correlations будут показаны коэф­фициенты корреляции для каждой пары исследуемых переменных.

Теперь рассмотрим процедуру проведения корреляционного анализа при помощи ранговых коэффициентов Спирмана и Кендала. В данных методах одна перемен­ная (эталонная) представлена в виде ранжированной последовательности мнемо­нических категорий, а другой переменной присваиваются ранговые места. Корре­ляционные коэффициенты рассчитываются исходя из количества инверсий, то есть числа нарушений порядка следования рангов по сравнению с первым рядом. В большинстве случаев рекомендуется применять коэффициент корреляции Спирмана. Использование коэффициента Кендала оправдано только в том случае, когда в структуре данных имеются выбросы.



Рис. 4.18. Таблица Correlations (корреляция Пирсона)


В практике маркетинговых исследований наиболее часто коэффициенты корре­ляции Спирмана применяются для анализа не всей выборочной совокупности рес­пондентов (базы данных в целом), а агрегированных ранжированных перечней, полученных в результате других преобразований1. Приведем пример. Предположим, что в результате опроса посетителей магазинов одежды были по­лучены ответы на следующие два вопроса. Какие факторы для Вас наиболее важны при выборе одежды? с вариантами ответа:

■   Высокое качество одежды.

■   Доступные цены.

■   Широта ассортимента одежды.

■   Близость к дому или работе.

■   Высокое качество обслуживания.

■   Красивый интерьер магазина.

Оцените, пожалуйста, следующие характеристики данного магазина одежды (в котором происходит опрос) по пятибалльной шкале (от 1 — очень плохо до 5 — отлично) с ва­риантами ответа:

■   Высокое качество одежды.

■   Доступные цены.

■   Широта ассортимента одежды.

■   Близость к дому или работе.

■   Высокое качество обслуживания.

■   Красивый интерьер магазина.

■   Ваша общая оценка работы данного магазина.

Над результатами второго вопроса был проведен множественный линейный рег­рессионный анализ. Анализировалось влияние оценок частных параметров всех исследованных магазинов одежды на их общую оценку. В разделе 4.3 подробно рассматривается процедура линейного регрессионного анализа, позволяющая, в частности, построить ранжированный перечень частных параметров по силе их влияния на общую оценку.

Таким образом, были получены два ранжированных списка с одинаковыми катего­риями: две схемы выбора магазина одежды. Затем оба списка были введены в SPSS под кодами, представленными выше: от 1 (наиболее важный фактор) до 6 (наименее важный фактор) (рис. 4.19). На рис. 4.20 представлены данные списки в мнемони­ческой форме. Первый список представлен в переменной sc_l; второй — в sc_2.


Рис. 4.19. Окно SPSS Data Editor с двумя ранжированными перечнями наиболее значимых для респондентов факторов выбора магазинов одежды



Рис. 4.20. Окно SPSS Data Editor с двумя ранжированными перечнями наиболее значимых для респондентов факторов выбора магазинов одежды одежды


Как вы видите на рис. 4.20, две схемы выбора, составленные на основании прямого метода (вопрос 1) и на основании регрессионного анализа (вопрос 2), соответству­ют друг другу не полностью, различаясь в порядке следования первой и второй категорий. Проанализируем эти схемы выбора магазинов одежды на предмет со­ответствия при помощи коэффициента корреляции Спирмана.


Для этого снова откройте диалоговое окно Bi variate Correlations, выбрав пункт меню Analyze ► Correlate ► Bivariate. Перенесите две интересующие нас переменные — Схе­ма №1 (составленная по вопросу 1) и Схема №2 (составленная по вопросу 2) — из левого списка всех доступных переменных в область Variables (рис. 4.21). Отмени­те вывод корреляции Пирсона и вместо него выберите параметр Spearman (корре­ляция Спирмана). После этого начните расчет при помощи щелчка на кнопке ОК.

Рис. 4.21. Диалоговое окно Bivariate Correlations 
(корреляция Спирмана)одежды





В окне SPSS Viewer появится таблица Correlations с результатами расчета коэффи­циента ранговой корреляции (Спирмана) по двум анализируемым переменным. Как следует из рис. 4.22, две рассматриваемые схемы выбора различаются несуще­ственно. Данный вывод можно сделать из сильной корреляции между переменны­ми sc_l и sc_2 (коэффициент корреляции Спирмана = 0,9), характеризующейся весьма высокой статистической значимостью (0,005).

Рис. 4.22. Таблица Correlations (корреляция Спирмана)


В заключение напомним, что ранговый коэффициент корреляции Спирмана (в от­личие от Кендала) может применяться и в качестве аналога корреляции Пирсона при исследовании зависимостей между переменными, не приводимыми к интер­вальному виду и потому не являющимися ранжированными списками. В качестве примера можно привести гипотетический случай, рассмотренный выше, когда анализируется влияние пола респондентов (дихотомическая шкала) на уровень обра­зования (порядковая по сути, но номинальная по виду шкала).

4.2.2. Частные корреляции. Выявление ложных корреляций

На практике иногда возникают ситуации, когда в результате корреляционного ана­лиза обнаруживаются логически необъяснимые, противоречащие объективному опыту исследователя корреляции между двумя переменными (например, оказы­вается, что между уровнем дохода респондентов и количеством детей в семье сущес­твует статистически значимая зависимость). В этом случае говорят о так называе­мой ложной корреляции, исследовать которую помогают частные коэффициенты корреляции.

Рассмотрим процедуру исследования частных корреляций на следующем приме­ре из маркетингового исследования поведения посетителей залов игровых авто­матов. В результате обработки анкет респондентов были, в частности, получены три интервальные переменные:

■   q47 — возраст;

■   q49 — количество членов семьи;

■   q50 — среднемесячный доход на 1 члена семьи.

Над данными переменными был проведен корреляционный анализ (Пирсона), который выявил логически необъяснимую, но статистически значимую зависи­мость между переменными: Доход и Количество членов семьи (рис. 4.23).


Рис. 4.23. Коэффициенты корреляции (Пирсона) для трех переменных: возраст, уровень доходов и количество членов семьи



Как видно из таблицы, обе рассматриваемые переменные коррелируют с третьей переменной Возраст. В такой ситуации корреляция между уровнем дохода респон­дентов и численностью их семей может объясняться влиянием третьей перемен­ной: возраста респондентов. То есть связанными (коррелирующими), на самом деле, являются пары возраст/уровень дохода и возраст/количество членов семьи. Прове­рим данную гипотезу при помощи частных коэффициентов корреляции.


Откройте диалоговое окно Partial Correlations (меню Analyze ► Correlate ► Partial). В ле­вом списке всех доступных переменных выберите переменные, между которыми обнаружена странная корреляция (q50 Доход и q49 Количество членов семьи), и поместите их в область Variables. Переменную, с которой коррелируют обе исследуе­мые переменные (q47 Возраст), поместите в область Controlling for (рис. 4.24). В этом диалоговом окне больше ничего не изменяйте — просто запустите программу на исполнение, щелкнув на кнопке ОК.

Рис. 4.24. Диалоговое окно Partial Correlations


В окне SPSS Viewer появятся результаты расчетов частных коэффициентов кор­реляции (рис. 4.25). В данной таблице первая строка каждой ячейки содержит ко­эффициент корреляции Пирсона, а третья — статистическую значимость данного коэффициента. Из таблицы вы видите, что между количеством членов семьи (q49) и уровнем дохода (q50) больше не наблюдается статистически значимой корреля­ции (Р = 0,520), а коэффициент Пирсона сильно уменьшился (0,0256). Следова­тельно, корреляция, представленная на рис. 4.23, объясняется влиянием третьей переменной Возраст и, таким образом, является ложной.



Рис. 4.25. Таблица Partial Correlation Coefficients




4.3. Линейный регрессионный анализ и статистическое

прогнозирование

Линейная регрессия является наиболее часто используемым видом регрессионно­го анализа. Ниже перечислены три основные задачи, решаемые в маркетинговых исследованиях при помощи линейного регрессионного анализа.

1.   Определение того, какие частные параметры продукта оказывают влияние на общее впечатление потребителей от данного продукта. Установление направ­ления и силы данного влияния. Расчет, каким будет значение результирующе­го параметра при тех или иных значениях частных параметров. Например, тре­буется установить, как влияет возраст респондента и его среднемесячный доход на частоту покупок глазированных сырков.

2.   Выявление того, какие частные характеристики продукта влияют на общее впе­чатление потребителей от данного продукта (построение схемы выбора продук­та потребителями). Установление соотношения между различными частными па­раметрами по силе и направлению влияния на общее впечатление. Например, имеются оценки респондентами двух характеристик мебели производителя X — цены и качества, — а также общая оценка мебели данного производителя. Требу­ется установить, какой из двух параметров является наиболее значимым для покупате­лей при выборе производителя мебели и в каком конкретном соотношении находится значимость для покупателей данных двух факторов (параметр Цена в х раз более значим для покупателей при выборе мебели, чем параметр Качество).

3.   Графическое прогнозирование поведения одной переменной в зависимости от изменения другой (используется только для двух переменных). Как правило, целью проведения регрессионного анализа в данном случае является не столько расчет уравнения, сколько построение тренда (то есть аппроксимирующей кри­вой, графически показывающей зависимость между переменными). По полу­ченному уравнению можно предсказать, каким будет значение одной перемен­ной при изменении (увеличении или уменьшении) другой. Например, требуется установить характер зависимости между долей респондентов, осведомленных о раз­личных марках глазированных сырков, и долей респондентов, покупающих данные марки. Также требуется рассчитать, насколько возрастет доля покупателей сырков марки х при увеличении потребительской осведомленности на 10 % (в результате про­ведения рекламной кампании).

В зависимости от типа решаемой задачи выбирается вид линейного регрессионно­го анализа. В большинстве случаев (1 и 2) применяется множественная линейная регрессия, в которой исследуется влияние нескольких независимых переменных на одну зависимую. В случае 3 применима только простая линейная регрессия, в которой участвуют только одна независимая и одна зависимая переменные. Это связано с тем, что основным результатом анализа в случае 3 является линия трен­да, которая может быть логически интерпретирована только в двухмерном про­странстве. В общем случае результатом проведения регрессионного анализа явля­ется построение уравнения регрессии вида: у = а + Ь,х, + Ь2х2 + ... + Ь„хп, позволяющего рассчитать значение зависимой переменной при различных значе­ниях независимых переменных.

В табл. 4.6 представлены основные характеристики переменных, участвующих в анализе.

Таблица 4.6. Основные характеристики переменных, участвующих в линейном регрессионном анализе

Линейная регрессия

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Одна

Интервальная

Любое

Интервальная

Порядковая

Порядковая

Дихотомическая

В связи с тем что и множественная и простая регрессии строятся в SPSS одинако­вым способом, рассмотрим общий случай множественной линейной регрессии как наиболее полно раскрывающий суть описываемого статистического метода. Да­вайте рассмотрим, как построить линию тренда с целью статистического прогно­зирования.

Исходные данные:

В ходе опроса респондентов, летающих одним из трех классов (первым, бизнес- или эко­ном-классом), просили оценить по пятибалльной шкале — от 1 (очень плохо) до 5 (отлич­но) — следующие характеристики сервиса на борту самолетов авиакомпании X: комфор­табельность салона, работа бортпроводников, питание во время полета, цена билетов, спиртные напитки, дорожные наборы, аудиопрограммы, видеопрограммы и пресса. Также респондентам предлагалось поставить общую (итоговую) оценку обслуживания на борту самолетов данной авиакомпании.

Для каждого класса полета требуется:

1)   Выявить наиболее значимые для респондентов параметры обслуживания на борту.

2)   Установить, какое влияние оказывают оценки частных параметров обслуживания на борту на общее впечатление авиапассажиров от полета.

Откройте диалоговое окно Linear Regression при помощи меню Analyze ► Regres­sion ► Linear. Из левого списка выберите зависимую переменную для анализа. Это будет Общая оценка сервиса на борту. Поместите ее в область Dependent. Далее в ле­вом списке выберите независимые переменные для анализа: частные параметры сервиса на борту — и поместите их в область Independent(s).

Существует несколько методов проведения регрессионного анализа: enter, stepwise, forward и backward. He вдаваясь в статистические тонкости, проведем регрессион­ный анализ посредством пошагового метода backward как наиболее универсально­го и релевантного для всех примеров из маркетинговых исследований.

Так как задача анализа содержит требование провести регрессионный анализ в раз­резе трех классов полета, выберите в левом списке переменную, обозначающую класс (q5) и перенесите ее в область Selection Variable. Затем щелкните на кнопке Rule, чтобы задать конкретное значение данной переменной для регрессионного анализа. Следует отметить, что за одну итерацию можно построить регрессию толь­ко в разрезе какого-то одного класса полета. В дальнейшем следует повторить все этапы сначала по количеству классов (3), каждый раз выбирая следующий класс.

Если нет необходимости проводить регрессионный анализ в каком-либо разрезе, оставьте поле Selection Variable пустым.

Итак, на экране открылось диалоговое окно Set Rule, в котором вы должны указать, для какого именно класса полета вы хотите построить регрессионную модель. Выберите экономический класс, закодированный как 3 (рис. 4.26).


Рис. 4.26. Диалоговое окно Set Rule




В более сложных случаях, когда требуется построить регрессионную модель в раз­резе трех и более переменных, следует воспользоваться условным отбором дан­ных (см. раздел 1.5.1). Например, если кроме класса полета есть еще и необходи­мость раздельного построения регрессионной модели для респондентов (мужчин и женщин), необходимо перед открытием диалогового окна Linear Regression про­извести условный отбор анкет респондентов, являющихся мужчинами. Далее про­водится регрессионный анализ по описываемой схеме. Для построения регрес­сии для женщин следует повторить все этапы сначала: вначале выбрать только анкеты респондентов-женщин и затем уже для них построить регрессионную модель.

Щелкните на кнопке Continue в диалоговом окне Set Rule — вы вновь вернетесь к основному диалоговому окну Linear Regression. Последним шагом перед запуском процедуры построения регрессионной модели является выбор пункта Collinearity Diagnostics в диалоговом окне, появляющемся при щелчке на кнопке Statistics (рис. 4.27). Установление требования провести диагностику наличия коллинеар­ности между независимыми переменными позволяет избежать эффекта мульти-коллинеарности, при котором несколько независимых переменных могут иметь настолько сильную корреляцию, что в регрессионной модели обозначают, в прин­ципе, одно и то же (это неприемлемо).

Рис. 4.26. Диалоговое окно Set Rule





Теперь основное диалоговое окно Linear Regression примет вид, показанный на рис. 4.28. Щелчок на кнопке О К приведет к запуску процедуры построения линей­ной регрессии.

Рис. 4.28. Диалоговое окно Linear Regression


Рассмотрим основные элементы отчета о построении регрессионной модели (окно SPSS Viewer), содержащие наиболее значимые для исследователя данные. Не­обходимо отметить, что все таблицы, представленные в отчете Output, содержат несколько блоков, соответствующих количеству шагов SPSS при построении модели. На каждом шаге при используемом методе backward из полного списка независимых переменных, введенных в модель изначально, при помощи наимень­ших частных коэффициентов корреляции последовательно исключаются пере­менные — до тех пор, пока соответствующий коэффициент регрессии не оказы­вается незначимым (Sig > 0,05). В нашем примере таблицы состоят из трех блоков (регрессия строилась в три шага). При интерпретации результатов регрессион­ного анализа следует обращать внимание только на последний блок (в нашем случае 3).

Первое, на что следует обратить внимание, — это таблица ANOVA (рис. 4.29). На третьем шаге статистическая значимость (столбец Sig) должна быть меньше или равна 0,05.

Затем следует рассмотреть таблицу Model Summary, содержащую важные сведения о построенной модели (рис. 4.30). Коэффициент детерминации R является харак­теристикой силы общей линейной связи между переменными в регрессионной модели. Он показывает, насколько хорошо выбранные независимые переменные способны определять поведение зависимой переменной. Чем выше коэффициент детерминации (изменяющийся в пределах от 0 до 1), тем лучше выбранные неза­висимые переменные подходят для определения поведения зависимой перемен­ной. Требования к коэффициенту R такие же, как к коэффициенту корреляции (см. табл. 4.4): в общем случае он должен превышать хотя бы 0,5. В нашем примере R = 0,66, что является приемлемым показателем.


Рис. 4.29. Таблица ANOVA


Также важной характеристикой регрессионной модели является коэффициент R2, показывающий, какая доля совокупной вариации в зависимой переменной описывается выбранным набором независимых переменных. Величина R2 из­меняется от 0 до 1. Как правило, данный показатель должен превышать 0,5 (чем он выше, тем показательнее построенная регрессионная модель). В нашем при­мере R2 =■ 0,43 — это значит, что регрессионной моделью описано только 43 % случаев (дисперсии в итоговой оценке полета). Таким образом, при интерпре­тации результатов регрессионного анализа следует постоянно иметь в виду су­щественное ограничение: построенная модель справедлива только для 43 % случаев.

Третьим практически значимым показателем, определяющим качество регресси­онной модели, является величина стандартной ошибки расчетов (столбец Std. Error of the Estimate). Данный показатель варьируется в пределах от 0 до 1. Чем он мень­ше, тем надежнее модель (в общем случае показатель должен быть меньше 0,5). В нашем примере ошибка составляет 0,42, что является завышенным, но в целом приемлемым результатом.

На основании таблиц AN OVA и Model Summary можно судить о практической пригод­ности построенной регрессионной модели. Учитывая, что AN OVA показывает весь­ма высокую значимость (менее 0,001), коэффициент детерминации превышает 0,6, а стандартная ошибка расчетов меньше 0,5, можно сделать вывод о том, что с уче­том ограничения модель описывает 43 % совокупной дисперсии, то есть построен­ная регрессионная модель является статистически значимой и практически при­емлемой.


Рис. 4.30. Таблица Model Summary



После того как мы констатировали приемлемый уровень качества регрессионной модели, можно приступать к интерпретации ее результатов. Основные практиче­ские результаты регрессии содержатся в таблице Coefficients (рис. 4.31). Под таб­лицей вы можете видеть, какая переменная была зависимой (общая оценка серви­са на борту) и для какого класса полета происходило построение регрессионной модели (эконом-класс). В таблице Coefficients практически значимыми являются четыре показателя: VIF, Beta, В и Std. Error. Рассмотрим последовательно, как их сле­дует интерпретировать.


Рис. 4.31. Таблица Coefficients




Прежде всего необходимо исключить возможность возникновения ситуации мультиколлинеарности (см. выше), при которой несколько переменных могут обозна­чать почти одно и то же. Для этого необходимо посмотреть на значение VIF возле каждой независимой переменной. Если величина данного показателя меньше 10 — значит, эффекта мультиколлинеарности не наблюдается и регрессионная модель приемлема для дальнейшей интерпретации. Чем выше этот показатель, тем более связаны между собой переменные. Если какая-либо переменная превышает значение в 10 VIF, следует пересчитать регрессию без этой независимой переменной. В данном примере автоматически уменьшится величина R2 и возрастет величина свободного члена (константы), однако, несмотря на это, новая регрессионная мо­дель будет более практически приемлема, чем первая.

В первом столбце таблицы Coefficients содержатся независимые переменные, со­ставляющие регрессионное уравнение (удовлетворяющие требованию статисти­ческой значимости). В нашем случае в регрессионную модель входят все частные характеристики сервиса на борту самолета, кроме аудиопрограмм. Исключенные переменные содержатся в таблице Excluded Variables (здесь не приводится). Итак, мы можем сделать первый вывод о том, что на общее впечатление авиапассажиров от полета оказывают влияние семь параметров: комфортабельность салона, работа бортпроводников, питание во время полета, спиртные напитки, дорожные наборы, видеопрограммы и пресса.

После того, как мы определили состав параметров, формирующих итоговое впе­чатление от полета, можно определить направление и силу влияния на него каж­дого частного параметра. Это позволяет сделать столбец Beta, содержащий стан­дартизированные - коэффициенты регрессии. Данные коэффициенты также дают возможность сравнить силу влияния параметров между собой. Знак (+ или -) пе­ред -коэффициентом показывает направление связи между независимой и зави­симой переменными. Положительные -коэффициенты свидетельствуют о том, что возрастание величины данного частного параметра увеличивает зависимую пере­менную (в нашем случае все независимые переменные ведут себя подобным обра­зом). Отрицательные коэффициенты означают, что при возрастании данного част­ного параметра общая оценка снижается. Как правило, при определении связи между оценками параметров это свидетельствует об ошибке и означает, например, что выборка слишком мала.

Например, если бы перед - коэффициентом параметра работы бортпроводников стоял знак -, его следовало бы интерпретировать следующим образом: чем хуже работают бортпроводники, тем лучше становится общее впечатление пассажиров от полета. Такая интерпретация является бессмысленной и не отражающей реаль­ного положения вещей, то есть ложной. В таком случае лучше пересчитать регрес­сию без данного параметра; тогда доля вариации в итоговой оценке, описываемой исключенным параметром, будет отнесена на счет константы (увеличивая ее). Соответственно уменьшится и процент совокупной дисперсии, описываемой рег­рессионной моделью (величина R2). Однако это позволит восстановить семанти­ческую релевантность.

Еще раз подчеркнем, что сделанное замечание справедливо для нашего случая (оценки параметров). Отрицательные - коэффициенты могут быть верными и от­ражать семантические реалии в других случаях. Например, когда уменьшение до­хода респондентов приводит к увеличению частоты покупок дешевых товаров. В таблице вы видите, что в наибольшей степени на общее впечатление пассажи­ров от полета влияют два параметра: работа бортпроводников и комфортабель­ность салона (- коэффициенты по 0,21). Напротив, в наименьшей степени форми­рование итоговой оценки сервиса на борту происходит за счет впечатления от обслуживания спиртными напитками (0,08). При этом два первых параметра ока­зывают почти в три раза более сильное влияние на итоговую оценку полета, чем

спиртные напитки. На основании стандартизированных (3-коэффициентов регрес­сии можно построить рейтинг влияния частных параметров сервиса на борту на общее впечатление авиапассажиров от полета, разделив их на три группы по силе влияния:

■   наиболее значимые параметры;

■   параметры, имеющие среднюю значимость;

■   параметры, имеющие низкую значимость для респондентов (рис. 4.32).

В крайнем правом столбце содержатся - коэффициенты, умноженные на 100, — для облегчения сравнения параметров между собой.


Рис. 4.32. Рейтинг значимости параметров сервиса на борту


Данный рейтинг также можно интерпретировать и как рейтинг значимости для респондентов различных параметров сервиса на борту (в общем случае — схема выбора). Так, наиболее важными факторами являются первые два (1-2); среднюю значимость для пассажиров имеют следующие три параметра (3-5); относительно малое значение имеют последние два фактора (6-7).

Регрессионный анализ позволяет выявить истинные, глубинные мотивы респон­дентов при формировании общего впечатления о каком-либо продукте. Как пока­зывает практика, такого уровня приближения нельзя достичь обычными метода­ми — например, просто спросив респондентов: Какие факторы из нижеперечисленных оказывают наибольшее влияние на Ваше общее впечатление от полета самолетами нашей авиакомпании?. Кроме того, регрессионный анализ позволяет достаточно точно оце­нить, насколько один параметр более-менее значим для респондентов, чем другой, и на этом основании классифицировать параметры на критические, имеющие сред­нюю значимость и малозначимые.

Столбец В таблицы Coefficients содержит коэффициенты регрессии (нестандарти-зированные). Они служат для формирования собственно регрессионного уравне­ния, по которому можно рассчитать величину зависимой переменной при разных значениях независимых.

Особая строка Constant содержит важную информацию о полученной регрессион­ной модели: значение зависимой переменной при нулевых значениях независимых переменных. Чем выше значение константы, тем хуже подходит выбранный перечень независимых переменных для описания поведения зависимой перемен­ной. В общем случае считается, что константа не должна быть наибольшим коэффи­циентом в регрессионном уравнении (коэффициент хотя бы при одной переменой должен быть больше константы). Однако в практике маркетинговых исследова­ний часто свободный член оказывается больше всех коэффициентов вместе взя­тых. Это связано в основном с относительно малыми размерами выборок, с кото­рыми приходится работать маркетологам, а также с неаккуратным заполнением анкет (некоторые респонденты могут не поставить оценку каким-либо парамет­рам). В нашем случае величина константы меньше 1, что является весьма хоро­шим результатом.

Итак, в результате построения регрессионной модели можно сформировать сле­дующее регрессионное уравнение:

СБ = 0,78 + 0,20К + 0.20Б + 0,08ПП + 0.07С + 0Д0Н + 0,08В + 0Д2П, где

■   СБ — общая оценка сервиса на борту;

■   К — комфортабельность салона;

■   Б — работа бортпроводников;

■   ПП — питание во время полета;

■   С — спиртные напитки;

■   Н — дорожные наборы;

■   В — видеопрограмма;

■   П — пресса.

Последний показатель, на который целесообразно обращать внимание при интер­претации результатов регрессионного анализа, — это стандартная ошибка, рассчи­тываемая для каждого коэффициента в регрессионном уравнении (столбец Std. Error). При 95%-ном доверительном уровне каждый коэффициент может отклоняться от величины В на ±2 х Std.Error. Это означает, что, например, коэффициент при пара­метре Комфортабельность салона (равный 0,202) в 95 % случаев может отклоняться от данного значения на ±2 х 0,016 или на ±0,032. Минимальное значение коэффициен­та будет равно 0,202 - 0,032 = 0,17; а максимальное - 0,202 + 0,032 = 0,234. Таким образом, в 95 % случаев коэффициент при параметре «комфортабельность салона» варьируется в пределах от 0,17 до 0,234 (при среднем значении 0,202). На этом интерпретация результатов регрессионного анализа может считаться за­вершенной. В нашем случае следует повторить все шаги еще раз: сначала для биз­нес -, потом для эконом-класса.

Теперь давайте рассмотрим другой случай, когда необходимо графически пред­ставить зависимость между двумя переменными (одной зависимой и одной неза­висимой) при помощи регрессионного анализа. Например, если мы примем итого­вую оценку полета авиакомпанией X в 2001 г. за зависимую переменную S,, а тот же показатель в 2000 г. — за независимую переменную So, то для построения урав­нения тренда (или регрессионного уравнения) нужно будет определить парамет­ры соотношения S, = а + b x So. Построив данное уравнение, также можно построить регрессионную прямую и, зная исходную итоговую оценку полета, спрогнози­ровать величину данного параметра на следующий год.

Эту операцию следует начать с построения регрессионного уравнения. Для этого повторите все вышеописанные шаги для двух переменных: зависимой Итоговая оценка 2001 и независимой Итоговая оценка 2000. Вы получите коэффициенты, при помощи которых можно в дальнейшем строить линию тренда (как в SPSS, так и любыми другими средствами). В нашем случае полученное регрессионное уравне­ние имеет вид: S{ = 0,18 + 0,81 х So. Теперь построим уравнение линии тренда в SPSS.


Диалоговое окно Linear Regression имеет встроенное средство для построения гра­фиков — кнопку Plots. Однако это средство, к сожалению, не позволяет на одном графике построить две переменные: S, и So- Для того чтобы построить тренд, необ­ходимо использовать меню Graphs ► Scatter. На экране появится диалоговое окно Scatterplot (рис. 4.32), которое служит для выбора типа диаграммы. Выберите вид Simple. Максимально возможное число независимых переменных, которое можно изобразить графически, — 2. Поэтому при необходимости графического построе­ния зависимости одной переменной (зависимой) от двух независимых (например, если бы в нашем распоряжении были данные не по двум, а по трем годам), в окне Scatterplot следует выбрать 3-D. Схема построения трехмерной диаграммы рассея­ния не имеет существенных отличий от описываемого способа построения двух­мерной диаграммы.

Рис. 4.33. Диалоговое окно Scatterplot



После щелчка на кнопке Define на экране появится новое диалоговое окно, пред­ставленное на рис. 4.34. Поместите в поле Y Axis зависимую переменную (Итоговая оценка 2001), а в поле X Axis — независимую (Итоговая оценка 2000). Щелкните на кнопке 0 К, что приведет к построению диаграммы рассеяния.

Для того чтобы построить линию тренда, дважды щелкните мышью на получен­ной диаграмме; откроется окно SPSS Chart Editor. В этом окне выберите пункт меню Chart ► Options; далее пункт Total в области Fit Line; щелкните на кнопке Fit Options. Откроется диалоговое окно Fit Line, выберите в нем тип аппроксимирующей ли­нии (в нашем случае Linear regression) и пункт Display R-square in legend. После за­крытия окна SPSS Chart Editor в окне SPSS Viewer появится линейный тренд, ап­проксимирующий наши наблюдения по методу наименьших квадратов. Также на диаграмме будет отражаться величина R2, которая, как было сказано выше, обо­значает долю совокупной вариации, описываемой данной моделью (рис. 4.35). В на­шем примере она равна 53 %.


С линейным регрессионным анализом связано множество интегральных показателей, рассчитываемых на основании коэффициентов регрессии (чаще всего стандартизированных). В качестве примера приведем расчет коэффициента потребительской привлекательности продукта/марки (Consumer Attractiveness), или коэффициента СА.

Рис. 4.34. Диалоговое окно Simple Scatterplot




Рис. 4.35. Диаграмма Scatterplot с построенной линией тренда





Этот коэффициент вводится в маркетинговых исследованиях для удобства сравне­ния привлекательности для респондентов анализируемых продуктов/марок. В анке­те должны присутствовать вопросы типа Оцените представленные параметры продукта/ марки X, в которых респондентам предлагается дать свои оценки частным параметрам продукта или марки X, скажем, по пятибалльной шкале (от 1 — очень плохо до 5 — отлично). В конце списка оцениваемых частных параметров респонденты должны поставить итоговую оценку продукту/марке X. При анализе полученных в ходе опро­са ответов респондентов на основании оценок респондентов формируются:

■   матрица средневзвешенных оценок по параметрам продукта/марки;

■   список стандартизированных  - коэффициентов регрессии (оценка влияния частных параметров продукта/марки X на его/ее общую оценку).

Далее коэффициент СА рассчитывается по следующей формуле:

где n — число параметров, формирующих итоговую оценку продукта или марки:

 - — значимость для респондентов параметра с индексом i (стандартизированный -коэффициент регрессии, оценивающей влияние частных параметров на общую оценку продукта/марки, подробнее см. выше);  — уровень средневзвешенной оценки продукта/марки по параметру с индексом i (при наличии пятибалльной шкалы):

 = 2               при высоком уровне оценки (средневзвешенный балл ≥ 4,5)

Бесплатная лекция: "21 Лечение сифилиса" также доступна.

 = 1               при среднем уровне оценки (средневзвешенный балл ≥4,0 и < 4,5)

 = -1             при низком уровне оценки (средневзвешенный балл ≥3,0 и < 4,0)

 = -2             при неудовлетворительной оценке (средневзвешенный балл < 3,0)

Рассчитанный для каждого конкурирующего продукта/марки коэффициент СА показывает его/ее относительную позицию в структуре потребительских предпоч­тений. Данный интегральный показатель учитывает уровень оценок по каждому параметру, скорректированный на их значимость. При этом он может изменяться в пределах от -1 (наихудшая относительная позиция среди всех рассматриваемых продуктов/марок) до 1 (наилучшее положение); 0 означает, что данный продукт/ марка ничем особенным не выделяется в глазах респондентов.

Итогом расчета коэффициента СА является рейтинг конкурентов по данному по­казателю. На основании рейтинга можно сделать важные выводы относительно лидерства и аутсайдерства конкретных продуктов/марок на потребительском рынке.

Мы завершаем рассмотрение ассоциативного анализа. Данная группа статисти­ческих методов применяется в отечественных компаниях в настоящее время дос­таточно широко (особенно это касается перекрестных распределений). Вместе с тем хотелось бы подчеркнуть, что только лишь перекрестными распределениями ассоциативные методы не ограничиваются. Для проведения действительно глубо­кого анализа следует расширить спектр применяемых методик за счет методов, описанных в настоящей главе.

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6390
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее