Ахтямов - Математика для социологов и экономистов - 2004 (947340), страница 47
Текст из файла (страница 47)
В этом случае вспомогательная функция Лагранжа имеет вид г'(х, у, г, Л) = 1(х, у, г) + Лд(х, у, в). Переменные х, у и в могут быть связаны двумя уравнениями связи; д1(х, у, л) = О, д2(х, у, г) = О. Н я. М. Аятяяоя !'и. !а Отпимииационние задачи 322 Тогда функция Лагранжа имеет вид Р(х, д, в, Лы Лв) = !'(х, д, г) + Л! у!(х, у, а) + Лвув(х, у, г). 15.5. Метод наименьших квадратов В социально-экономических науках одной из важнейших задач является задача определения аналитических зависимостей между различными величинами.
Получение соответствующих формул позволяет лучше !юнять ситуацию и спрогнозировать как она будет меняться в будущем. Одним из наилучших способов получения таких формул — это метод наименьших квадратов. Изложим идею этого способа. Пусть мы хотим установить зависимость между двумя величинами х и д. Произведем соответствующие статистические исследования и занесем их результаты в таблицу: Требуется наилучшим образом отразить общую тенденцию зависимости у от х, исключив при этом случайные отклонения, связанные с неизбежными погрешностями статистических наблюдений. '1акую зависимость стремятся представить в виде формулы у = !'(х). Формулы, служащие для аналитического представления опытных данных, получили название эмпирических формул.
Задача нахождения эмпирических формул разбивается на два этапа. На первом этапе нужно установить вид зависимости у = 1(х), т. е. решить является ли она линейной, квадратичной, логарифмической или какой-либо другой. Для выбора функции у = г (х) привлекаются соображения нематематического характера (теоретические предпосылки, соображения экспертов и т. и.), а также характер расположения точек (х;, у;) на плоскости. Если вид функции д = Г(х) установлен,то переходят ко второму этапу определению неизвестных параметров этой функции. Например, для зависимости у = ах + 6 неизвестными параметрами являк)тся а и 6. В методе наименьших квадратов в качестве неизвестных параметров выбирают такие значения, чтобы сумма квадратов отклонений теоретических значений г" (х1), 16.,7.
Метод наименьших нвадоаепов 323 Рис. 1ое.4. Метод наименьших квадратов найденных по эмпирической формуле у = д(ш), от соответству1ощих опытных значений д1, т. е. была минимальной. Числа д'(ш1) — у1 будем обозначать г1 и называть погрешностями (рис. 15.4). На языке погрешностей метод наименьших квадратов состоит в следующем; нужно подобрать неизвестные параметры лак, чтобы сумма квадратов погрешностей была возможно меньшей. Если эта минимальная сумма квадратов окажется малой, тогда и сами погрешности будут малыми по абсолютной величине.
Следует отметить, что выбор в качестве отклонения Я эмпирических точек (х;, рл) от точек кривой р = д (х) именно суммы квадратов погрешностей впервые предложил французский математик Лежандр. В принципе можно было взять в качестве Я сумму погрешностей г1 или сумму их абсолютных величин ~ге~. Но делать это нецелесообразно, так как в первом случае 2, г1 1=1 может быть малой или даже равняться нулю при значительном разбросе эмпирических точек, так как положительные отклонения г1 компенсируются отрицательными. Во втором случае и функция 2,' ~г1~ лишена этого недостатка., однако имеет другой 1=1 з л.
!д. Они!анизапианные задачи она не является дифференцируемой, что существенно затрудняет решение задачи. Пусть в качестве функции д = д (х) взята линейная функция у = ах + 6. Задача сводится к отысканию таких параметров а и 6, при которых функция Я вЂ” ~(ах, + 6 — у,) 1=1 дд — = О. дЬ дд — =О, да Отсюда 2(ах! + Ь вЂ” д!)х; = О, 1=! ~ 2(ах! + 6 — у;) = О. После алгебраических преобразований эта система принима- ет вид х; а+ ~ ~х; 6=~ х д;, ! н и х,) а + пЬ = " д! 1=1 1=1 Эта система называется системой нормальных уравнений.
Она имеет единственное решение, так как ее определитель (что можно доказать методом математической индукции при и > 2). Убедимся, что найденные значения дают минимум функции о' = Я(а, 6). Найдем частные производные ,ааль — — 2 ~ х! = В, 1=1 Яана=2;з х,'=А, ~ьиь = 2 и = б. принимает наименьшее значение. Заметим, что Я можно рассматривать как функцию от двух неизвестных параметров а и 6. Подберем коэффициенты а и 6 так, чтобы функция Я получила возможно меньшее значение.
Для этого необходимо, чтобы соблюдались условия 1б.,б. Метод наименыиих авадоаепов 32в Поскольку 2) =А — С'=п~х,' — ~~х;) >О е=! е=! А=~ хе>0, то согласно достаточному условию экстремума функция Я = = о'(а, 6) имеет единственную точку минимума, определяемую из системы нормальных уравнений. Причем эта точка является точкой глобального минимума, поскольку она является единственной критической точкой. Линейная зависимость. Значительный интерес представляет дифференциация по возрастным группам населения.
Зная различия состава потребления в зависимости от возраста, можно предвидеть изменения спроса на основании ожидаемых изменений в составе населения. Известно, например, что потребление молока больше в тех семьях, в составе которых имеется по нескольку детей, и меньше в тех, где детей нет. Требуется определить как зависит среднедушевое потребление в семье у от количества детей х (в % ).
Чтобы получить представление об изменении д в зависимости от х были собраны статистические данные, результаты которых занесены в следующую таблицу. Теперь нужно найти формулу зависимости у от х. Как уже было отмечено выше, эта задача разбивается на два этапа. На первом этапе нужно установить вид зависимости у = 2(х), а на втором -. определить неизвестные параметры этой функции. Гл.!б. Оиошиизациоииие задачи 326 и уи+ о у„и у„о у, и у„(о+ и — и) у„. у + + + и+о и+о и+о и+о и Или, если относительное число детей обозначить х и выдеи+о лить слагаемое у„, то у = (уи уо)Х + уо.
Отсюда видно, что при данных у и у„величина у представляет собой линейную функцию относительно числа детей. Это же подтверждается и графическим расположением точек (х,, у,). Второй этап. Определим неизвестные параметры а и 6 линейной зависимости у = их+6. Для этого вычислим все суммы ~ х, ~ х, ~ у, ~ху. Подставим эти значения в систему нормальных уравнений: 193а + 56 = 36,9, 11037а + 1936 = 1770,0. Решив эту систему, получим: а = 0,0964, 6 = 3,66. Это дает 7" (х) = 0,0964х+ 3,66.
Первый этап. Величина у выражает среднее душевое потребление в семье, т, е, отношение общего числа литров потребляемого молока к числу членов семьи. Если число детей и, а взрослых о, среднее потребление молока для детей у„, а взрослых у„, то общее душевое потребление составит 75.Ь. Мвтвд наименьших ввад7внпвв 3'27 В частности, если х = 0 (детей нет), получаом показатель для взрослых 3,66. Если же х = 100 (нет взрослых), получаем показатель для детей 0,0964 100+ 3,66 = 13,30. Линейная зависимость характерна также и для других случаев.
Статистические исследования показывают, например, что реальный обьем потребления у (в млрд долларов, 1982 г.) в США в период за 1931.-1990 гг. зависел от численности населения в США х (120 < л < 250 млн чел.) линейно (причем, формула зависимости, найденная методом наименьших квадратов, имеет виЬр у = — 1817,3+ 16,7л). Объем частного потребления у (млрд долларов, 1982 г.) от располагаемого дохода х (млрд долларов, 1600 < х < 2900) в США в 1971 1990 гг, выражался зависимостью у = — 217,6+ 1,007 х.
Гиперболическая зависимость. В ряде случаев теоретический анализ приводит к выводу нелинейной зависимости различных факторов. Рассмотрим, например, зависимость себестоимости единицы продукции у от объема производства этой продукции т. Себестоимость единицы продукции рассчитывается путем деления общей суммы затрат на обьем произведенной продукции. Поэтому общая сумма затрат иа производство равна произведению ху. В то же время затраты на производство (как уже отмечалось выше) можно условно подразделить на две части; 1) затраты, которые возрастают более или менее пропорционально увеличению объема произведенной продукции, условно-нерв менныс расходы (затраты на сырье и материалы, па топливо и электроэнергию для технологических целей, оплата труда основных производственных рабочих и т. п.); 2) затраты, либо совершенно не зависящие от обьема продукции, либо зависящие от пего в незначительной степени, —.
условнопостолнные расходы (оплата труда инженерно-технических работников и служащих, расходы па содержание зданий и сооружений и другие административно-управленческие и общехозяйственные расходы). Обозначим переменные расходы в расчете на единицу продукции через а; тогда их общая сумма составит а х. Общую сумму условно-постоянных расходов обозначим Ь.
Тогда общая себестоимость продукции составит; х у = а х + Ь, откуда себестоимость Ь единицы продукции будет равна: а + —. Уи. ! д. Оииьизьизаииаииые задачи и Я = ~~ (а+ — — у1) . Хь ь=1 Подберем коэффициенты а и 6 так, чтобы функция Я получила возможно меньшее значение. Для этого необходимо, чтобы со- блюдались условия дд — =О, да дд — = О.