3_Регрес (Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ), страница 6

2017-12-262017-12-26kosmosСтудИзба

Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ216

Описание файла

Файл "3_Регрес" внутри архива находится в папке "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ". Документ из архива "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ", который расположен в категории "". Всё это находится в предмете "математический анализ" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "высшая математика" в общих файлах.

Онлайн просмотр документа "3_Регрес"

Текст 6 страницы из документа "3_Регрес"

y_j=f(x_j,)+_i , j=1..N

где f(x,) - функция регрессии, заданная с точностью до неизвестных параметров =(₁,..., _m).

В данном случае метод наименьших квадратов является одним из наиболее распространенных методов оценивания параметров нелинейных регрессионных моделей.

МНК-оценкой неизвестных параметров и в схеме нелинейной регрессии называется оценка вида

, где .

Нелинейность функции регрессии при расчете параметров регрессии, приводит к нелинейности системы нормальных уравнений

Для решения системы используются стандартные численные процедуры поиска минимума функции Q(). Используются как методы поиска глобального экстремума (если нет уверенности в том, что локальный минимум у функции Q один), так и стандартные методы поиска локального экстремума. Разработан класс методов локальной минимизации, учитывающий специфику функции Q. Принцип построения этих методов тот же, что и у общих методов локальной оптимизации.

Алгоритм оценивания параметров регрессии может быть записан в следующем виде

^(t+1)=^(t)-_t[F^T(^(t)) F(^(t))+_tA]^-1 F^T(^(t)) Y(^(t))

где _t>0, _t0, ^(t), t=0,1,...

A - неотрицательно определенная матрица;

⁽⁰⁾ - начальное приближение параметров регрессии;

Вектор Y()=((y₁-f(x₁, ),.., (y_N-f(x_N, ))^T;

Оценка матрицы плана принимает вид

Если _t>0, то метод называется методом Марквардта;

_t=0, _t= arg min Q(^(t+1))- методом Хартли;

_t=0, _t= 1 - методом Гаусса-Ньютона.

Утверждение о сходимости рассмотренных алгоритмов легко формулируется на основе общих теорем о сходимости методов поиска локального экстремума. Все эти алгоритмы имеют недостаток, присущий большинству общих методов локального поиска и заключающийся в том, что для их сходимости требуется хорошее начальное приближение.

При программном расчете получают:

промежуточные и конечные оценки параметров регрессии;
промежуточные и конечные сумму квадратов отклонений S как меру качества подгонки;
оценки асимптотических дисперсий D(_i)

Величина s²=S/(n-m), называемая среднеквадратической ошибкой, служит оценкой дисперсии ошибки ² . Указанные оценки асимптотических дисперсий используются для приближенной проверки гипотез и аппроксимации 100(1-)%-ых доверительных интервалов для параметров. В выходные данные включаются предсказанные значения y.

В случае нелинейной регрессии существуют лишь приближенные схемы проверки гипотез.

Для проверки гипотезы H₀ : _i =_i0 , i=1..m используется статистика

z=(_i -_i0)/[D(_i)]^1/2,

где D(_i) - численное значение МНК-оценки для _i.

D(_i) - оценка асимптотической дисперсии для _i.

При истинности H₀ и при больших n эта статистика приближенно распределена по нормальному закону N(0,1).

Приближенным 100(1-)%-ным доверительным интервалом для и служит

_i z_1-__/2[D(_i)]^1/2

Получение доверительного интервала для среднего значения Y при значения x₁, x₂, ... ,x_m не принадлежащих выборке, является непростой задачей.

Statistica. Построим нелинейную модель для зависимости объемов перевозок от суммарной грузоподъемности парка в предыдущий месяц (GRSM). На рис.13. приведен график прогноза по экспоненциальной регрессии.

Результаты нелинейной регрессии

Рис.

3.13.

Динамика роста суммарной грузоподъемности

Рис.

3.14.

Действительно, в данном случае наблюдается отклонение от линейности, что видно из кривой тренда. Также интересен факт разбиения всех точек на две группы, что говорит о наращивании парка. На рис.14. приведен график суммарной грузоподъемности, из которого видно, что после 20 месяцев работы автоколонна существенно повысила состав автопарка.

Рассчитанные значение параметров регрессии приведены в таблице 8.

Таблица

3.8.

Параметры регрессии

	Const.C	Const.B0	GRSM
Estimate	40,05468	1,453673	,001143

Для анализа остатков построим гистограмму, приведенную на рис.15.

Гистограмма остатков

Рис.

3.15.

Гистограмма говорит о некотором несимметричном поведении модели. В связи с этим возможен подбор кривых из другого класса, например, логистической или логарифмической.

3.13 Пошаговая регрессия

Во многих случаях применения регрессионного анализа экспериментатор не имеет достаточной информации о порядке независимых переменных X₁, X₂, ... X_m по их важности для предсказания независимой переменной Y.

Статистикой, измеряющей эффективность набора независимых переменных как предикторов, служит множественный коэффициент корреляции, одно из решений упомянутой выше проблемы сводится к регрессии Y по всем возможным подмножествам независимых переменных и выбору наилучшего подмножества согласно следующей процедуре.

Среди всех подмножеств переменных размерности k: k=1..m выбирается подмножество S_k, которому соответствует наибольшее значение множественного коэффициента корреляции, который был рассмотрен выше.

Для описания стохастической зависимости случайных величин помимо простого и множественного коэффициента корреляции используются еще и частный коэффициент корреляции.

Частный коэффициент корреляции используется как мера линейной зависимости между двумя какими-либо переменными из X₁, X₂, ... X_m после вычитания "эффекта", обусловленного взаимодействием этих двух переменных с некоторым непустым подмножеством из оставшихся m-1 переменных.

Пусть l и h - две какие-либо переменные из набора X₁, X₂, ... X_m и C - некоторое непустое подмножество из оставшихся m-2 переменных.

Определим величины Z_l = X_l - m_l._C , Z_h = X_h - m_h._C,

где m_h.C , m_l.C - условные математические ожидания X_l и X_h при заданных значениях переменных из множества C.

Частный коэффициент корреляции между l и h при фиксированных значениях переменных из C есть

где - простой коэффициент корреляции между Z_l и Z_h .

Частный коэффициент корреляции обладает рядом свойств:

Частный коэффициент корреляции есть мера линейной зависимости между X_l и X_h когда величины переменных из C фиксированы.
Между частными и множественными коэффициентами корреляции имеет место следующее тождество

Квадрат частного коэффициента корреляции можно определить как долю остаточной дисперсии Y, "объясненной" добавлением переменной X_m к набору (X_m ,..,. X_m-1).

Перечисленные свойства частного коэффициента корреляции приводят к методам построения эвристических процедур выбора наиболее информативных подмножеств параметров регрессионной зависимости.

Предположим, что имеется набор независимых переменных X₁ , ... , X_m , которые являются кандидатами на роль предикторов Y и случайная выборка объема N. Стандартная процедура состоит из правил включения и исключения переменных из набора, и последовательности их применения.

Включение и удаление переменных осуществляется с помощью статистики проверки на нуль частного коэффициента корреляции. Предположим, что в набор уже включено л переменных, k=0..K. Далее - оценка частного коэффициента корреляции.

Статистика включения. Значение статистики F-включения для переменной X (не входящей в С) вычисляется на основании

Эта величина служит статистикой критерия для проверки гипотезы о том, что предсказание Y значимо не улучшается при включении X в набор С.

Статистика исключения. Величина F-исключения для какой либо переменной X из набора С служит статистикой критерия проверки гипотезы о том, что набор С* , получающийся из С при удалении X и содержащей k*=k-1 переменных, предсказывает Y "также хорошо", как и набор С. Величина статистики F-исключения вычисляется на основании

Алгоритмы и процедуры пошаговой процедуры включает следующие шаги:

Шаг 0. Вычисление простых коэффициентов корреляции r_yxi и величин статистик F-включения F_yxi , i=1..p.

Величина F_yxi имеет F-распределение с 1 и n-2 степенями свободы и служит для проверки гипотезы

H₀: _yxi=0, i=1..p;

Шаг 1. Переменная X_i, которой отвечает наибольшее значение F-включения, выбирается как наилучший предиктор для Y. Вычисляется оценка множественного коэффициента корреляции |r_y__xi|. Величина F-исключения в этом случае совпадает с величиной F-включения. Вычисляются коэффициенты частной корреляции r_yxi__C и значения F-включения

Если все вычисленные значения F-включения меньше установленного минимума, то переход к шагу S. В противном случае переход к шагу 2.

Шаг 2. Переменная X₂ , имеющая наибольшее значение F-включения выбирается как наилучший предиктор для Y при условии, что уже выбрана переменная X₁ . Вычисляется множественный коэффициент корреляции r_y__{x1 x2} и значения F-исключения F*_yx1__x2 и F*_yx2__x1. Эти статистики имеют 1 и n-3 степеней свободы и определяются выражениями

Они используются для проверки гипотезы незначимости корреляции

H₀:_yx1__x2=0 и _yx2__x1=0

Вычисляется частный коэффициент корреляции r_yx__x1x2 и значение F-включения

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.