Корниенко (1214588), страница 5

Файл №1214588 Корниенко (Современные технологии анализа данных DataMining в бизнесе) 5 страницаКорниенко (1214588) страница 52020-10-04СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 5)

где – константа(общее среднее),

- случайные величины, имеющие нормальное распределение с нулевым математическим ожиданием и одинаковыми дисперсиями. Все величины независимы.

Гипотезы

где – заданные числа, сумма которых равна нулю;

H1: нулевая гипотеза неверна.

Задан уровень значимости α.

Вычисления в значительной мере повторяют вычисления двухфакторного дисперсионного анализа: сначала вычисляются средние по строкам (i=1,2,…,r) и столбцам и общее среднее Далее вычисляются компоненты дисперсионной таблицы; хотя для дальнейших вычислений необходима только остаточная дисперсия , её сложно вычислить без остальных компонентов дисперсионной таблицы.

Вычисляется критериальная статистика

Построение критической области. При условии истинности нулевой гипотезы статистика Т имеет F-распределение со степенями свободы и

Определяется критическое значение как квантиль порядка распределения со степенями свободы Если выполняется неравенство то нулевая гипотеза принимается. В противном случае – отклоняется[4].

2.2.3 Парный критерий Стьюдента

Статистическая модель. Выборочные значения является реализацией случайной величины имеющей двухмерное нормальное распределение. Случайная величина X имеет математическое ожидание , случайная величина

Гипотеза

А. Равенство Б. Неравенство В. Неравенство

Здесь m - заданное число. Задан уровень значимости α.

Вычисления разности

Вычисляется среднее этих разностей

и их выборочная дисперсия

Вычисляется критериальная статистика

Построение критической области. При условии истинности нулевых гипотез статистика распределение Стьюдента с степенью свободы.

Вариант А. Определяются критические значения как квантиль порядка распределения Стьюдента с степенью свободы. Гипотеза принимается, если В противном случае гипотеза отклоняется.

Вариант Б. Определяется критическое значение как квантиль порядка распределения Стьюдента с степенью свободы. Гипотеза принимается, если .

Вариант В. Определяется критическое значение как квантиль порядка α распределения Стьюдента с степенью свободы. Гипотеза принимается, если

Практическая реализация критерия в Excel не представляет трудностей и во многом совпадает с вычислением доверительного интервала. Кроме того, в Excel реализация этого критерия осуществляется с помощью средства Парный двухвыборочный t-тест для средних. Кроме того, этот критерий для можно реализовать с помощью функции ТТЕСТ[4][5].

2.3 Алгоритм исследования

Д
ля реализации поставленной задачи, был разработан алгоритм исследования данных, схема алгоритма изображена на рисунке 2.1.

Рисунок 2.1 – Алгоритм исследования

3 Реализация алгоритма исследования

Для проведения ценового мониторинга в 1 квартале 2017 г. нами были выбраны аптечные сети Хабаровска, Новосибирска и Москвы имеющие в составе больше трех аптек, или крупные одиночные аптеки с высоким оборотом. Среди аптечных сетей были выделены сети, позиционирующие себя как аптеки «низких цен», или аптеки дискаунтеры, работающие под следующими брендами на территории России[6]: «Фармокопейка»[7], «Аптека Миницен»[8], «Здравсити»[9], «Твоя аптека»[10], «Монастырев» и др.

Для простоты использования введём обозначения для всех аптек, в таблице 3.1 находятся данные об обозначении аптек в г.Новосибирск, в таблице 3.2 находятся данные об обозначении аптек в г.Москва, в таблице 3.3 находятся данные об обозначении аптек в г.Хабаровск.

Таблица 3.1 – Обозначения аптек г.Новосибирск

Обозначение

Название аптеки

НСК1

Аптека от склада дискаунтер

НСК2

Аптека от склада (сайт)

НСК3

Солнышко №35

НСК4

Фармагрош (ул.Гоголя 180)

НСК5

Фармакопейка (ул.Богдана Хмельницкого 5) Социальная

НСК6

Монастырев (со скидкой)

НСК7

Фармакопейка (сайт)

НСК8

Зравсити портал, сайт

НСК9

Фармакопейка (ул.Гоголя 17) Радуга

НСК10

Фармакопейка (ул.Блюхера 7) Мелодия Здоровья

Таблица 3.2 – Обозначения аптек г.Москва

Обозначение

Название аптеки

МСК1

Озерки (Новокосино)

МСК2

Озерки (Алтуфьево)

МСК3

Аптеки Столички (ул.Беляево -Миклухо-Маклая - 47а)

МСК4

Самсон -фарма (ул.Балтийская, д. 4)

МСК5

Здравсити (Москва)

МСК6

Самсон-фарма (Миклухо -Маклая 43)

Таблица 3.3 – Обозначения аптек г.Хабаровск

Обозначение

Название аптеки

ХАБ1

Миницен (Пушкина)

ХАБ2

Монастырев

ХАБ3

Миницен (Ленина)

ХАБ4

Твоя аптека

ХАБ5

Здравсити

ХАБ6

Миницен (Ленинградская)

При выборе товарных наименований для мониторинга предпочтение отдавалось уникальным лекарственным препаратам(ЛП), произведенных одним предприятием. Это позволило избежать типичной исследовательской ошибки, когда выводы об уровне цен в аптечных организациях базируются на сравнении препаратов, имеющих идентичные наименования, форму выпуска и дозировку, но отличающиеся по таким потребительским характеристикам, как упаковка, биодоступность и пр.

По результатам мониторинга для каждой аптеки были собраны данные о ценах по каждому из 120 ЛП. (Приложение А, Приложение Б, Приложение В) Сбор данных производился вручную, т.к. автоматизированный сбор для выбранных источников информации не реализован.

На рисунке 3.2 изображено как производился сбор данных при помощи поисковой системы реализованной на сайте, на примере сайта «Здравсити».

Рисунок 3.2 - Пример источника сбора данных

На следующем этапе определялись ценовые отклонения от среднегородской цены.

где – цена на ЛП в аптеке

– среднегородская цена на ЛП

Таким образом всего было сформировано 22 ряда ценовых отклонений.

Далее проводим описательную статистику для каждой аптеки по городам в таблице 3.4 приведена описательная статистика аптек г. Новосибирск, в таблице 3.5 приведена описательная статистика аптек г. Москва, а в таблице 3.6 приведена описательная статистика аптек г. Хабаровск. Описательная статистика производится на основании таблиц данных с ценовыми отклонениями (Приложение Г, Приложение Д, Приложение Е)[11][12].

Описательная статистика нужна, для понимания характера совокупности, сырых данных. Включает в себя различные методы агрегирования данных. Для этого рассчитываются необходимые статистические характеристики:

– среднее значение отклонений

n – количество элементов выборки

- выборочное среднеквадратическое(стандартное) отклонение вычисляется по формуле

– значение t-критерия Стьюдента

– стандартная ошибка

– верхняя граница доверительного интервала

– нижняя граница доверительного интервала

– ошибка выборочного среднего

Таблица 3.4 – Описательная статистика г.Новосибирск

НСК1

НСК4

НСК3

НСК6

НСК7

НСК2

НСК5

НСК8

НСК9

НСК10

-6,082

-1,467

-0,945

-0,87

-0,03

0,685

1,49

1,61

1,76

5,10

n

90

89

93

111

104

91

88

70

65

97

8,267

7,539

7,635

8,1515

7,552

24,032

18,198

5,841

8,502

7,962

1,99

1,99

1,99

1,98

1,98

1,99

1,99

1,99

2

1,98

16,452

15,002

15,194

16,1401

14,953

47,824

36,215

11,623

17,005

15,764

10,369

13,535

14,25

15,2702

14,921

48,51

37,708

13,223

18,769

20,864

-22,534

-16,469

-16,139

-17,009

-14,986

-47,139

-34,721

-10,022

-15,241

-10,665

1,734

1,59

1,575

1,532

1,466

5,013

3,861

1,389

2,109

1,6

Таблица 3.5 – Описательная статистика г.Москва

МСК1

МСК2

МСК3

МСК4

МСК6

МСК5

-7,1335

-3,2645

-1,6148

2,9862

4,1502

4,6475

n

96

94

100

99

98

97

5,6640

8,8171

14,0972

7,5731

8,5851

15,4315

1,98

1,98

1,984

1,985

1,98

1,98

11,2147

17,4579

27,9689

15,0327

16,9985

30,5543

4,0811

14,1933

26,3540

18,0189

21,1487

35,2019

-18,3483

-20,7225

-29,5838

-12,0465

-12,8483

-25,9068

1,1446

1,8006

2,7968

1,5108

1,7171

3,1023

Таблица 3.6 – Описательная статистика г.Хабаровск

ХАБ1

ХАБ2

ХАБ3

ХАБ4

ХАБ5

ХАБ6

-4,7892

-1,2095

-0,04235

0,3106

2,7377

3,3673

n

114

107

115

108

96

114

6,3421

4,3956

4,3973

6,0521

4,4654

5,2633

1,98

1,98

1,98

1,98

1,985

1,98

12,5574

8,7033

8,7067

11,9832

8,8639

10,4214

7,7682

7,4938

8,6643

12,2939

11,6017

13,7887

-17,3467

-9,9128

-8,7490

-11,6726

-6,1262

-7,054

1,1761

0,8413

0,8119

1,1530

0,9046

0,976

Как видно из таблицы 3.4, цены в аптечной организации НСК1 на 6,1% ниже средних цен этого кластера, а в аптеке НСК10 – на 5,1% выше, так же это видно на рисунке 3.3[13].

Характеристики

Тип файла
Документ
Размер
2,73 Mb
Высшее учебное заведение

Список файлов ВКР

Современные технологии анализа данных DataMining в бизнесе
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6547
Авторов
на СтудИзбе
300
Средний доход
с одного платного файла
Обучение Подробнее