17757 (601292), страница 3

Файл №601292 17757 (Статистический пакет STATISTIKA) 3 страница17757 (601292) страница 32016-07-302016-07-30СтудИзба

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 3)

1) для y и переменных, соответствующих варианту (см. таб. 4), построить матрицу частных коэффициентов корреляции (корреляционную матрицу). Изобразить матрицу в графическом виде.

Таблица 4 – Варианты заданий

Вариант j	Независимые переменные (факторные признаки)	Задания по прогнозированию
Вариант j	Независимые переменные (факторные признаки)	Как изменится производительность труда на московском предприятии, если
0	х₁, х₂, х₄, x₅	среднегодовую численность рабочих сократить на 780 человек, а коэффициент сменности оборудования повысить до 3?
1	х₁, х₃, х₄, x₅	среднегодовую стоимость основных фондов увеличить на 80 тыс. руб., а и трудоемкость единицы продукции на 0,6?
2	х₃, х₄, x₅, x₆	трудоемкость единицы продукции сократить в 4 раза, а коэффициент сменности оборудования снизить в 2 раза?
3	х₁, х₂, х₃, x₅	среднегодовую стоимость основных фондов увеличить на 60 тыс. руб., а коэффициент сменности оборудования – на 0,9?
4	х₁, х₂, x₆, x₇	среднегодовую стоимость основных фондов сократить до 90 тыс. руб., а удельный вес потерь от брака понизить в 2 раза?
5	х₁, х₃, х₄, x₇	среднегодовую стоимость основных фондов сократить до 95 тыс. руб., а трудоемкость единицы продукции понизить на 0,1?
6	х₁, х₂, x₅, x₇	коэффициент сменности оборудования увеличить в 2 раза, а среднегодовой фонд заработной платы уменьшить на 92 тыс. руб.?
7	х₄, x₅, x₆, x₇	коэффициент сменности оборудования уменьшить в 2 раза, а среднегодовой фонд заработной платы увеличить на 92 тыс. руб.
8	х₂, х₃, x₅, x₇	коэффициент сменности оборудования увеличить на 1,5, а среднегодовой фонд заработной платы уменьшить на 32 тыс. руб.?
9	х₁, х₃, x₅, x₇	коэффициент сменности оборудования уменьшить на 1,5, а среднегодовой фонд заработной платы увеличить на 32 тыс. руб.?

2) построить линейное уравнение множественной регрессии, выбрав в качестве зависимой переменной – y, в качестве независимых – переменные х_i, соответствующие варианту (см. таб. 4).

3) Определить коэффициент множественной корреляции и коэффициент детерминации R² полученной модели

4) Проверить значимость построенной модели (например, используя уровень значимости α=0,05).

5) Если модель значима дать оценку коэффициентов множественной регрессии на основе t-критерия, если t_табл(15-4-1)= t_табл(10)=2,2281 и уровня значимости α=0,05.

6) Пересчитать уравнение множественной регрессии используя только значимые факторы.

7) Проверить адекватность регрессионной модели (полученной на предыдущем этапе анализа).

8) Осуществить прогнозирование в соответствии с вариантом

9) Оформить отчет о проделанной работе используя распечатки отчета, полученного средствами пакета STATISTICA или в MS Word.

Порядок выполнения задания

В системе STATISTICA для построения корреляционной матрицы можно воспользоваться модулем Basic Statistics/Tables (Основные статистики и таблицы), выбрав процедуры , используя в качестве переменных все исходные данные (Select all). И процедуру для представления матрицы в графическом виде.

По корреляционной матрице можно в первом приближении судить о тесноте связи факторных признаков х₁, х₂,…,x_m между собой и с результативным признаком y, а также осуществлять предварительный отбор факторов для включения их в уравнение регрессии. При этом не следует включать в модель факторы, слабо коррелирующие с результативным признаком и тесно связанные между собой. Не допускается включать в модель функционально связанные между собой факторные признаки, так как это приводит к неопределенности решения.

Выбор уравнения модели, в большинстве случаев, производятся среди функций перечисленных в таблице 3. В системе STATISTICA для построения линейного уравнения множественной регрессии можно воспользоваться модулем множественной регрессии , определив зависимую (dependent) переменную y и независимые (independent) переменные х₁, х₂, x₃, x₄.

Статистический вывод о пригодности (значимости) уравнения регрессии в системе Statistica обычно проверяется в следующей последовательности.

Проводится общая проверка модели, целью которой является выяснение, объясняют ли х-переменные значимую долю изменения у. Определение значимости модели рекомендуется проводить по следующим методам (см. табл. 5).

Таблица 5

Критерий Фишера

Использование уровня

значимости α

Использование коэффициента детерминации R²

Проверяется нулевая гипотеза H₀о равенстве полученных коэффициентов регрессии нулю: a₀=a₁=a₂=…=a_m=0. Для этого рассчитанное системой Statistica значение F-критерия (F_расч), сравнивается с табличным значением F_табл, определяемым с использованием специальных таблиц по заданным уровню значимости (например, =0,05) и числу степеней свободы (df1=m, df2=n-m-1). Если выполняется неравенство F_расч < F_табл, то с уверенностью, например на 95 %, можно утверждать, что рассматриваемая зависимость y = а₀ + a₁x₁+ … +a_mx_m является статистически значимой.

Если рассчитанное в Statistica значение уровня значимости р больше, чем заданный уровень значимости (например, =0,05), то полученный результат нужно трактовать как незначимый

(для 95% вероятности). В том случае, когда величина р<0,05, то вывод такой: это значимое уравнение с вероятностью 95%.

Рассчитанная системой Statistica величина сравнивается с табличными (критическими) значениями , определяемым с использованием специальных таблиц по заданному уровню значимости (например, α =0,05). Если окажется, что > , то с упомянутой степенью вероятности (95 %) можно утверждать, что анализируемая регрессия является значимой.

Если регрессия не является значимой, то говорить больше не о чем.

В при веденном примере модель значима, т.к. вычисленный уровень значимости модели р=0,000000<0,05.

Осуществив переход к результатам регрессии (Summary: Regression results) получаем уравнение линейной множественной регрессии вида y(x₁, x₂, x₃, x₄)=6,9+0,07x₁ –0,00035x₂–2,08x₃+0,00003x₄:

2. Если регрессия оказывается значимой, то существует взаимосвязь между параметром у и переменными х₁, х₂,…,x_m. Однако остается неясно, каково влияние конкретных факторов х₁, х₂,…,x_m на исследуемую функцию у. Можно продолжить анализ, используя t-тесты для отдельных коэффициентов регрессии а₀, a₁,a₂,…,a_m с целью выяснить, насколько значимой является влияние той или иной переменной х на параметр у при условии, что все другие факторы х_k остаются неизменными. Проверку на адекватность коэффициентов регрессии рекомендуется проводить по следующим эквивалентным методам (см. табл. 5).

Таблица 5

Использование t-критерия Стьюдента

Использование

уровня значимости α

Анализируемый коэффициент а₀_, a₁,a₂,…,a_mсчитается значимым, если рассчитанное системой Statistica для него значение t-критерия по абсолютной величине превышает t_табл, определяемым с использованием специальных таблиц по заданным уровню значимости (например, =0,05) и числу степеней свободы (df=n-m-1).

Коэффициент регрессии а₀_, a₁,a₂,…,a_mпризнается значимым, если рассчитанное системой Statistica для него значение уровня значимости р меньше (или равно) 0,05 (для 95%-ной доверительной вероятности).

Т.к. вычисленные уровни значимости p-level для коэффициентов, стоящих при x₂и x₄ меньше 0,05, то они не значимы. К аналогичному выводу можно прийти, воспользовавшись t-критерием: t₂(10)=-0,013<2,228 и t₃(10)=1,44<2,228.

С учетом этого факта, пересчитаем уравнение множественной регрессии, выбрав в качестве зависимой (dependent) переменную y и независимые (independent) переменные х₁и x₃, коэффициенты при которых значимы:

Получаем:

Т.о., уравнение регрессии имеет вид

y(x₁, x₃)=4,957+0,096x₁–1,559x₃

Для выполнения прогнозов по полученному уравнению необходимо показать, что регрессионная модель адекватна результатам наблюдений. С этой целью можно воспользоваться критерием Дарбина-Уотсона, согласно которого, рассчитанный системой Statistica коэффициент d_расч необходимо сравнить с табличным значением d_табл (для совокупности объемом n=15, уровня значимости =0,05 и трех оцениваемых параметров регрессии, значение d_таб_л=1,75). Если d_расч>d_табл, то полученная модель адекватна и пригодна для прогнозирования. Для определения d_расч в Statistica в окне Residual Analysis на вкладке Advanced необходимо выбрать опцию Durbin-Watson statistic:

В рассматриваемом примере d_расч=1,2<1,75, следовательно, модель не желательно использовать для прогнозирования.

В случае, когда модель адекватна результатам наблюдения для выполнения прогноза в окне Multyple Regression Results вкладки Residuals/assumptions/prediction (Остатки/Предположения/Прогнозирование) выбрать опцию (прогнозирование зависимой переменной). Например, если в Москве среднегодовую стоимость основных фондов (переменная x₁) повысить на 50 тыс. руб., а трудоемкость единицы продукции (переменная х₃) уменьшить в два раза, то следует ожидать производительности труда равной 19,16 (увеличится на 19,16-14=5,16):

2.2 Практическое задание 2. Кластерный анализ в STATISTICA

Постановка задачи

Двадцать банков, акции которых котируются на рынке, предоставили следующую информацию (см. табл.), где – x затраты за прошлый период, y – прибыль за прошлый период.

Необходимо:

1) дополнить таблицу до 20 значений. Данные можно не просто придумать, а взять из любых примеров деятельности банков того или иного города, приведенных в книгах по статистике, эконометрике, СМИ, Internet или любых иных источников.

2) построить график по исходным данным (Scatterplot)

3) c использованием системы STATISTICA выяснить (дать рекомендацию) акции каких банков некоторому предприятию имеет смысл приобрести, каких – придержать, а от каких – избавиться.

Таблица

Номер банка	Затраты x	Прибыль y
1	4	2
2	6	10
3	5	7
4	12	3
5	17	4
6	3	10
7	6	1
8	6	3
9	15	1
10	15	4
11	5	4
12	3	8
13	13	5
14	15	3
15	5	9

Порядок выполнения задания

Кластерный анализ – один из методов статистического многомерного анализа, предназначенный для группировки (кластеризации) совокупности элементов, которые характеризуются многими факторами, и получения однородных групп (кластеров). Задача кластерного анализа состоит в представлении исходной информации об элементах в сжатом виде без ее существенной потери.

STATISTICA предлагает несколько методов кластерного анализа. В дальнейшем будем использовать Joining (tree clustering) – группу иерархических методов (7 видов), которые используются в том случае, если число кластеров заранее неизвестно.

Используемый метод – Ward’s method – метод Уорда, который хорошо работает с небольшим количеством элементов и нацелен на выбор кластеров с примерно одинаковым количеством членов. В качестве метрики расстояния пакет предлагает различные меры, но наиболее употребительными являются Euclidean distance (евклидово расстояние). При кластеризации элементов в пакете STATISTICA следует выбирать режим: cases (rows) – строки, а при кластеризации факторов: variables (columns) – столбцы. В качестве переменных для рассматриваемого примере следует выбрать все переменные (all).

Для вывода результатов на экран следует выбрать

либо .

Вывести график на печать.

Проанализировать результат и заполнить таблицу.

Номер банка	Затраты x	Прибыль y	Рекомендация приобрести/придержать/избавиться
1	4	2
2	6	10
3	5	7
4	12	3
5	17	4
6	3	10
7	6	1
8	6	3
9	15	1
10	15	4
11	5	4
12	3	8
13	13	5
14	15	3
15	5	9
16
17
18
19
20

Характеристики

Тип файла

Документ

Размер

9,11 Mb

Материал

Статистический пакет STATISTIKA

Тип материала

Курсовая работа

Предмет

Бухгалтерский учет

Учебное заведение

Неизвестно

Список файлов курсовой работы

statisticheskiy-paket-statistika-1469847921-17757.zip

17757.rtf

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.