Парный регрессионный анализ
С1. Лекция 4. Тема: Парный регрессионный анализ.
1. Функциональная, статистическая и корреляционная связи (зависимости).
2. Линейная парная регрессия.
Вопрос 1. Функциональная, статистическая и корреляционная связи
(зависимости).
Между различными явлениями и их признаками выделяют два типа связей:
- функциональную (жестко детерминированную) и
- статистическую (стохастически детерминированную).
В соответствии с жестко детерминистическим представлением о функционировании экономических систем, необходимость и закономерность однозначно проявляются в каждом отдельном явлении. То есть любое действие вызывает строго определенный результат; случайными (непредвиденными заранее) воздействиями при этом пренебрегают. Поэтому при заданных начальных условиях состояние такой системы может быть определено с вероятностью, равной единице. Разновидностью такой закономерности является функциональная связь.
Рекомендуемые материалы
С1. Связь признака у с признаком х называется функциональной, если каждому возможному значению независимого признака х соответствует одно или несколько строго определенных значений зависимого признака у. Определение функциональной связи может быть легко обобщено для случая многих признаков х1, х2,…хп.
Характерной особенностью функциональных связей является то, что в каждом отдельном случае известен полный перечень факторов, определяющих значение зависимого (результативного) признака, а также точный механизм их влияния, выраженный определенным уравнением.
С1. Функциональную связь можно представить уравнением:
yi =f(хi) (1)
где yi – результативный признак (i = 1, ...,n); f(хi) – известная функция связи результативного и факторного признаков; хi – факторный признак.
Чаще всего функциональные связи наблюдаются в явлениях, описываемых математикой, физикой и другими точными науками. Имеют место функциональные связи и в социально-экономических процессах, но довольно редко (они отражают взаимосвязь только отдельных сторон сложных явлений общественной жизни). В экономике примером функциональной связи может служить связь между оплатой труда у и количеством изготовленных деталей х при простой сдельной оплате труда. Так, если расценка за одну деталь составляет 3 тыс. руб., то связь между признаками однозначно выразится простым линейным уравнением у = 3·х. Для каждого допустимого значения х можно указать вполне определенное значение у. Если, положим, х = 5, то, соответственно, у = 15.
В реальной общественной жизни, ввиду неполноты информации жестко детерминированной системы, может возникнуть неопределенность, из-за которой эта система по своей природе должна рассматриваться как вероятностная, при этом связь между признаками становится стохастической.
С2. Стохастическая связь – это связь между величинами, при которой одна из них, случайная величина у, реагирует на изменение другой величины х или других величин х1, x2, ..., хn (случайных или неслучайных) изменением закона распределения. Это обусловливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подвержена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть определены с достаточной точностью, а только указаны с определенной вероятностью.
Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице (причем не известен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком). Всегда имеет место влияние случайного. Появляющиеся различные значения зависимой переменной – это реализации случайной величины.
С2. Модель стохастической связи может быть представлена в общем виде уравнением:
yi =f(хi) +εi (2)
где yi – расчетное значение результативного признака; f(xi) – часть результативного признака, сформировавшаяся под воздействием учтенных известных факторных признаков (одного иди множества), находящихся в стохастической связи с признаком; εi – часть результативного признака, возникшая вследствие действия неконтролируемых или неучтенных факторов, а также измерения признаков, неизбежно сопровождающегося некоторыми случайными ошибками.
Вам также может быть полезна лекция "8 Заключение".
Проявление стохастических связей подвержено действию закона больших чисел, сущность которого заключается в том, что лишь в достаточно большом числе единиц индивидуальные особенности сгладятся, случайности взаимопогасятся и зависимость, если она имеет существенную силу, проявится достаточно отчетливо.
В социально-экономической жизни приходится сталкиваться со многими явлениями, имеющими вероятностный характер. Например, уровень производительности труда рабочих стохастически связан с целым комплексом факторов: квалификацией, стажем работы, уровнем механизации и автоматизации производства, интенсивностью труда, простоями, состоянием здоровья работника, его настроением, атмосферным давлением и др. Полный перечень факторов неизвестен. Кроме того, неодинаково действие любого известного фактора на уровень производительности труда каждого рабочего. Изменение атмосферного давления, к примеру, значительно снижает работоспособность рабочих, страдающих заболеваниями сердечно-сосудистой системы, и практически не сказывается на производительности труда здоровых. В результате, при одинаковых возможностях наблюдается распределение значений дневной выработки рабочих. Такое распределение носит условный характер, поскольку оно связано с фиксированными значениями факторных признаков. Различия условных распределений имеют выраженную направленность связи (например, выработка растет с повышением квалификации рабочего). Эту направленность связи можно раскрыть более наглядно, если ограничиться рассмотрением только одного аспекта стохастической связи - изучением вместо условных распределений лишь одного их параметра - условного математического ожидания (частные случаи стохастической связи - корреляционная и регрессионная).
Вопрос 2. Линейная парная регрессия.
С3. Наиболее разработанной в теории статистики является методология парной корреляции, рассматривающая влияние вариации факторного признака х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей.
Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п.
При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму.