Обзор методов описательной статистики и математического анализа для интерпретации данных
Лекция 12.
Обзор методов описательной статистики и математического анализа для интерпретации данных в МИ.
Методы обработки данных:
Маркетолог не статистик и не обязан им быть. Однако он обязан уметь правильно поставить перед статистиком вопросы, касающиеся собранной в ходе исследования «сырой» информации, и уметь заранее оценить направление дальнейшего анализа, чтобы извлечь из него наибольшую пользу.
В зависимости от типа переменных возможны следующие статистические операции:
Над интервальными переменными (близкими до некоторой степени к порядковым качественным переменным) можно производить большую часть статистических расчетов;
Над относительными переменными можно производить любые расчеты, но графическое воспроизведение результатов будет неодинаковым для непрерывных и дискретных переменных;
Для номинальных качественных переменных возможно лишь исчисление моды и распределения численных показателей по возрастанию (убыванию) либо в виде процентного соотношения, а также обработку предусмотренную критерием согласия Пирсона χ2;
Порядковые качественные переменные допускают те же операции, что и номинальные, и сверх того — вычисление медианы.
Рекомендуемые материалы
Подготовка данных к анализу:
Редактирование (editing) – предварительная проверка анкет, устранение ошибок заполнения
Кодирование (coding) – процедура присвоения кода конкретному ответу на конкретный вопрос. Информация, полученная в результате исследования и образующая код, распределяется по столбцам
Преобразование данных:
Введение данных из анкет непосредственно в компьютерную программу (Excel, Statistica, SPSS)
Взвешивание (weighting) – метод статистической корректировки данных, при котором каждому наблюдению или респонденту в базе данных присваивается весовой коэффициент, отображающий степень его значимости по сравнению с другими наблюдениями или респондентами
Процесс кодирования:
Преобразование шкалы измерений (comparative scales):
Нормализация (Standardization) – корректировка данных для приведения их к одной и той же шкале вычитанием выборочного среднего и деления полученного значения на стандартное отклонение.
Чтобы нормализовать шкалу xi необходимо вычесть из каждого балла среднее значение
х (с черточкой), а затем разделить полученное значение на стандартное отклонение Sx
По сути это тоже самое, что вычисление значение Z
Zi=(xi-x(с черточкой))/Sx
Нормализация позволяет исследователю сравнивать переменные, полученные с использованием разных типов шкал.
1. Моновариантный анализ.:
Самый простой из всех методов: он применяется к одной переменной
Таблицы данных или таблицы распределения, полученные таким образом, могут представляться в графической форме (гистограммы, диаграммы), в форме числовых описаний при помощи структурных параметров (мода, медиана), дисперсии либо закономерностей распределения (показатели асимметрии и эксцесса (островершинности), призванные выявить профиль распределения).
Бивариантный анализ **:
Он применим к отношениям между двумя переменными; при этом в таблице имеются два столбца, или матрица данных, а не один столбец, как при моновариантном анализе.
Одномерный статистический анализ позволяет выявить характер эмпирического распределения измеренных характеристик и его соответствие известным законам распределения — в частности, нормальному закону.
**Анализ сопряженности и корреляции признаков устанавливает характер и тесноту взаимосвязи между двумя переменными
Вариационный ряд (Frequency distribution):
Математическое распределение, цель которого – подсчет ответов, связанных с различными значениями одной переменной (частот) и дальнейшее выражение их в процентном виде (частости).
Какое количество потребителей определенной марки можно считать лояльным ей?
Каково соотношение между разными группами потребителей товара: много использующие (heavy users), средне-, слабо- и непользователями?
Что представляет собой кривая распределения дохода для приверженцев данной марки товара? Смещено ли данное распределение в сторону группы потребителей с низкими доходами?
Какое количество потребителей хорошо осведомлены о предлагаемом новом товаре? Какова средняя степень осведомленности о товаре?
Что представляет собой кривая распределения дохода приверженцев данной марки товара?
Нет ли смещения данного распределения в сторону группы потребителей с низкими доходами?
Вариационный ряд помогает определить долю неответивших респондентов (один из 30 респондентов не ответил на вопрос), а также показывает долю ошибочных ответов
Частотные данные можно использовать для построения гистограмм, где по оси Х откладываются значения переменной, а по оси У – абсолютные частоты или относительные (частности) значения.
Статистики, связанные с распределением частот:
Показатели центра распределения
Средняя арифметическая – Mean
Modе – мода – значение переменной, которое чаще всего встречается в в выборочном распределении
Медиана (Median)- значение переменной которое приходится на середину распределения частот, т.е. одна половина всех значений больше, другая –меньше
Симметрическое распределение
Mean Median Mode
Смещенное Ассиметричное распределение
Mean Median Mode (b)
Дисперсия, среднеквадратическое отклонение.
Дисперсия (variance) – среднее из квадратов отклонений переменной от ее средней величины
Среднеквадратическое (стандартное) отклонение (standard deviation) корень квадратный из значения дисперсии
Стандартное отклонение выборки рассчитывается по формуле
Sx=
Коэффициент вариации – это отношение стандартного отклонения к среднему арифметическому, выраженному в процентах
CV=Sx/
Общая схема проверки гипотез
Формулировка гипотез:
Нулевая гипотеза – предположение о том, что между определенными статистическими параметрами генеральной совокупности (средними и долями) не существует связи или различия.
Альтернативная гипотеза - предположение о том, что между определенными статистическими параметрами генеральной совокупности есть связи или различия
В маркетинговых исследованиях нулевую гипотезу формулируют так, что ее неприятие приведет к желаемому заключению
Руководство универмага хочет ввести торговлю через Интернет. Новую услугу введут, если свыше 40% пользователей Интернет используют сеть для покупок.
Если нулевую гипотезу отклоняют, то принимают альтернативную гипотезу, в примере – стоит ввести новую услугу.
Опрос 500 респондентов показал, что респонденты делают покупки в конкретном магазине в среднем 4 раза в месяц (или 52 раза в год)
Менеджеры думают, что действительная величина совершения покупок в год 60 раз.
Насколько верно предположение менеджеров?
Стандартное отклонение 10
Н0 - средняя частота 60
Н1 - средняя частота не равняется 60
Если мы используем 95% уровень доверительности, то
Стандартная ошибка будет равна
Общая классификация типов проверки гипотезы:
Таблица сопряженности признаков Знакомство с Интернет
Chi-Square Distribution
Критерий хи-квадрат – используется для проверки стат.значимости связей в таблицах сопряженности признаков
Помогает определить наличие или отсутствие систематической связи между двумя переменными
Стратегия брендинга на международных рынках
С 1990 гг. наблюдается тенденция расширения присутствия компаний на международных рынках. Как можно продавать товар за границей, учитывая многообразие культурных и исторических традиций. Например, изменяя упаковку, а также изменение рецептуры в зависимости от требований национальных традиций. Менеджеры считают, что нужно мыслить глобально, а действовать локально. На самом ли деле потребители в разных странах предпочитают покупать товары известных фирм в разной упаковке, соответствующей традициями страны.
Н0 Для хорошо известного фирменного товара доработанная для локального рынка упаковка увеличит долю на международном рынке
Н1. При прочих равных условиях для хорошо известного фирменного товара доработанная упаковка для локального рынка увеличит долю на международном рынке
Ковариационный анализ – учет неконтролируемых независимых переменных на зависимые переменные
При определении намерений потребителей по приобретению товара известной фирмы в зависимости от цены, необходимо учитывать отношение к торговой марке
Для определения того, как различные группы потребителей под влиянием рекламы оценивают бренд, необходимо контролировать, какой информацией априорно обладают члены этих групп
Корреляция и регрессия – связь между двумя метрическими переменными
Связь объема продаж с расходами на рекламу
Связь между долей рынка и количеством торгового персонала
Восприятие качества товаров потребителями и их восприятие цены
Уравнение у=а +bх
Переменная, представленная х – это известное значение, переменную у нужно вычислять.
Например, зависимость между расходами на рекламу и объемом продаж
Факторный анализ
Класс методов, используемый для сокращения числа переменных и их обобщения.
Информация в лекции "5 Социальная Группа" поможет Вам.
Фактор – латентная переменная, конструируемая таким образом, чтобы можно было объяснить корреляцию между набором переменных
Совместный анализ
Метод, с помощью которого маркетологи определяют относительную важность, которую придают потребители ясно выраженным характеристикам, а также полезность, которую они связывают с уровнем характеристик товара, бренда, или товарных категорий
Попарный подход к сбору данных для совместного анализа:
Респонденты одновременно оценивают по две характеристики до тех пор, пока не оценят все возможные пары характеристики