183967 (599269)

Файл №599269 183967 (Множественная регрессия и корреляция)183967 (599269)2016-07-30СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

Размещено на http://www.allbest.ru/

Множественная регрессия и корреляция

Пусть требуется построить линейную модель зависимости некоторого выходного экономического показателя , называемого объясняемой переменной от набора входных показателей , называемых объясняющими переменными. Основным методом построения таких моделей является метод наименьших квадратов, смысл которого состоит в том, чтобы подобрать параметры модели, минимизирующие суммы квадратов отклонений модельных значений объясняемой переменной от истинных значений. Метод наименьших квадратов реализован во всех статистических пакетах программ, а также в средствах статистического пакета Анализа данных Microsoft Excel.

Пусть - наблюдений объясняемой переменной, а - наблюдений объясняющих переменных. Задача состоит в построении по данной выборке линейной модели зависимости объясняемой переменной от вектора объясняющих переменных.

.

Здесь – коэффициенты модели, которые надо определить, а - ошибка измерения модели.

Для адекватной работы метода наименьших квадратов требуется выполнение следующих гипотез:

  1. . (спецификация модели).

  2. -детерминированные величины, причем в матрице

столбцы линейно независимые, т.е. ранг этой матрицы равен .

  1. - случайная величина, удовлетворяющая условиям

3а. , математическое ожидание ошибки равно нулю;

3b. , дисперсия ошибки не зависит от номера наблюдения;

3с. , т.е. ошибки разных наблюдений не зависят друг от друга.

Справедлива теорема Гаусса-Маркова, что при этих условиях метод наименьших квадратов дает наилучшую в некотором смысле модель. Если некоторые из условий не выполняются, то приходится использовать более сложные методы.

В результате применения метода наименьших квадратов находятся оценки коэффициентов модели . По этим оценкам и по значениям объясняющих переменных строятся модельные значения объясняемой переменной . Обозначим через отклонение истинного значения объясняемой переменной от модельного для -го наблюдения ( ). Качество модели оценивается через сумму квадратов отклонений модели

.

( error sum of squares) называется суммой квадратов ошибок.

Метод наименьших квадратов состоит в том, что среди всех возможных наборов коэффициентов модели находится набор, минимизирующий .

Если все коэффициенты модели, кроме константы , равны нулю, то - среднему значению объясняемой переменной. Тогда сумма квадратов отклонений равна

.

( total sum of squares) называется общей суммой квадратов.

За счет того, что не все коэффициенты модели равны нулю, сумма квадратов отклонений уменьшается. В соответствии с этим величина

означает объясненную сумму квадратов (regression sum of squares).

После получения оценок необходимо определить, все ли из них значимо отличаются от нуля, так как, если коэффициент равен нулю, это означает, что соответствующая объясняющая переменная не участвует в модели. Коэффициент значим, если гипотезу его равенства нулю надо отвергнуть. Соответственно значимостью коэффициента называется вероятность того, что его знак совпадает со знаком его оценки.

Для полученной модели необходимо уметь определять, можно ли отбросить несколько входящих в нее объясняющих переменных или добавить переменные, не входящие в модель. С этой целью, проводят тест для определения какая модель лучше – «длинная» или «короткая». Также необходимо проверять однородность модели для разных наборов переменных. Для этого предназначен тест Чоу. Для оценки адекватности модели надо проверять тесты на выполнение условий теоремы Гаусса-Маркова.

Тест на выбор «длинной» или «короткой» регрессии

Данный тест используется для отбора наиболее существенных объясняющих переменных. Например, переход от большого числа исходных показателей состояния анализируемой системы к меньшему числу наиболее информативных переменных может быть обусловлен дублированием информации, доставляемой сильно взаимосвязанными признаками или неинформативностью признаков, мало меняющихся при переходе от одного объекта к другому. Так, если две какие-либо объясняющие переменные сильно коррелированы с результирующим показателем и друг с другом, то часто бывает достаточно включения в модель одной из них, а дополнительным вкладом от включения другой можно пренебречь.

Пусть . Предположим, что модель не зависит от последних объясняющих переменных и их можно исключить из модели. Это соответствует гипотезе

,

т.е. последние коэффициентов равны .

Тест по проверке данной гипотезы состоит в следующем:

1. Построить по МНК «длинную» (unrestricted) регрессию по всем параметрам и найти для нее .

2. Используя МНК, построить «короткую» (restricted) регрессию по первым параметрам и найти для нее .

3. Вычислить F-статистику:

4. Найти критическую точку распределения Фишера при выбранном уровне значимости : .

5. Если , то гипотеза отвергается, т.е. следует использовать «длинную» модель.

Если , то гипотеза принимается, т.е. лучше «короткая» модель.

Тест Чоу на однородность зависимости объясняемой переменной от объясняющих

На практике нередки случаи, когда имеются две выборки пар значений зависимой и объясняющей переменных . Например, одна выборка пар значений переменных объемом получена при одних условиях, а другая, объемом , - при несколько измененных условиях. Необходимо выяснить, действительно ли две выборки однородны в регрессионном смысле? Другими словами, можно ли объединить две выборки в одну и рассматривать единую модель регрессии по (гипотеза )?

Для проверки гипотезы применяется тест Чоу (Chow), состоящий в следующем:

1. Используя МНК, построить модель по выборке объемом и найти для нее .

2. Пусть есть основание предполагать, что вся выборка состоит из двух подвыборок объемами и соответственно. Для каждой из них строится линейная регрессия. - сумма квадратов отклонений значений от регрессионных значений , посчитанных по первой подвыборке, – сумма квадратов отклонений значений от регрессионных значений , посчитанных по второй подвыборке.

3. Вычислить F – статистику:

,

где – число объясняющих переменных модели.

4. Найти критическую точку распределения Фишера при выбранном уровне значимости .

5. Если , то мы можем объединить две выборки в одну. Если , то необходимо использовать две модели.

Тесты на гетероскедастичность

Гомоскедастичность – дисперсия каждого отклонения одинакова для всех значений .

Гетероскедастичность – дисперсия объясняемой переменной (следовательно, и случайных ошибок) непостоянна.

В тестах на гетероскедастичность проверяется основная гипотеза (т.е. модель гомоскедастична) против альтернативной гипотезы : не (т.е. модель гетероскедастична).

Тест Гольдфельда – Куандта (Goldfeld - Quandt)

Этот тест применяется, как правило, когда есть предположение о прямой зависимости дисперсии ошибок от величины некоторой объясняющей переменной, входящей в модель.

Предполагается, что имеет нормальное распределение. Тест включает в себя следующие шаги:

1. Упорядочить данные по убыванию (или по возрастанию) той независимой переменной, относительно которой есть подозрение на гетероскедастичность.

2. Исключить средних (в этом упорядочении) наблюдений ( , где – общее количество наблюдений).

3. Провести две независимых регрессии первых наблюдений и последних наблюдений и найти, соответственно, и . Из и выбираем большую и меньшую величины, соответственно, и .

4. Составить статистику и найти по распределению Фишера , где – число объясняющих переменных модели.

5. Если , то гипотеза отвергается, т.е. модель гетероскедастична, а если , то гипотеза принимается, т.е. модель гомоскедастична.

Тест Бреуша – Пагана (Breusch - Pagan)

Этот тест применяется в тех случаях, когда предполагается, что дисперсии зависят от некоторых дополнительных переменных. Пусть , . Тест состоит в следующем:

1. Провести обычную регрессию и получить . (Для этого в диалоговом окне Регрессия установить флажок на функцию Остатки)

2. Построить оценку .

3. Провести регрессию и найти для нее объясненную часть вариации .

4. Построить статистику .

5. Если (где p – число переменных, от которых зависит ), то имеет место гетероскедастичность.

Характеристики

Тип файла
Документ
Размер
363,62 Kb
Тип материала
Учебное заведение
Неизвестно

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов книги

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6390
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее