ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 42
Текст из файла (страница 42)
3.7.1По виду полученной ломанной линии можно предположить, чтолиния регрессии Y на X является прямой. Оценим ее параметры. Для этогосначала вычислим с учетом группировки данных в таблице все величины,необходимые для использования формул (3.31–3.33):n ( (( (å Х kYk = å=nij X iYj 1 × (1) × 5 + 2 × (-1) × 7 + ¼+ 2 × (-2) × 3 = -53;k =1n(i, j(å X = å=n Xk =1kii(-2) × 18 + (-1) × 15 + 0 × 17 + 1 × 18 + 2 × 12 = –9;i241(2(2X==nXå k åi ink =1n((Y==nYåk å j jk =14 × 18 + 1 × 15 + 1 × 18 + 4 × 12= 153;i(-1) × 12 + 0 × 32 + 1 × 32 + 2 × 4 =28.jТогда80 × (-53) - ( -9) × 28153 × 28 - ( -9) × ( -53)r% = =-0,33,= 0,31.b% =280 × 153 - (-9)80 ×153 - ( -9) 2В новом масштабе оценка линии регрессии имеет вид((Y= -0,33 X + 0,31.
График этой прямой линии изображен на рис. 3.7.1.Для оценки s х по корреляционной таблице можно воспользоватьсяформулой (3.1.3):(åi ( X i - X )2 ni= 1,38.sx =n -1Подобным же образом можно оценить s у величиной s y = 0,75. Тогдаоценкойкоэффициентакорреляцииможетслужить величина1,38r%xy= -0,33=×-0,58.0,75Вернемся к старому масштабу:Y - 17= –0,33( X - 3) + 0,31 или Y = –0,66 Х + 19,6.2Коэффициент корреляции пересчитывать не нужно, так как это величинабезразмерная и от масштаба не зависит.Ответ. r%xy = -0,58; Y = –0,66 Х + 19,6.Пусть некоторые физические величины X и Y связаны неизвестнойнам функциональной зависимостью у= f ( x). Для изучения этойзависимости производят измерения Y при разных значениях X.
Измерениямсопутствуют ошибки и поэтому результат каждого измерения случаен.Если систематической ошибки при измерениях нет, то у = f ( x) играетроль линии регрессии и все свойства линии регрессии приложимы ку = f ( x) . В частности, у = f ( x) обычно находят по методу наименьшихквадратов.Задача 3.26. Результаты наблюдений случайных величин X и Yпредставлены в виде таблицы. Найдите линию регрессии Y на X.
Оценитекоэффициент корреляции. Оцените точность прогноза случайной величиныY по известному значению X. (См. пример 3.26 и исходные данные.)Исходные данные к задаче 3.26.242Вар. 1(8,10)(6,8)(4,6)(2,4)(0,2)nxВар. 2(8,10)(6,8)(4,6)(2,4)(0,2)nxВар. 3(8,10)(6,8)(4,6)(2,4)(0,2)nxВар. 4(6,8)(4,6)(0,2)(–2,0)(–4,–2)nxВар. 5(10,12)(8,10)(6,8)(4,6)(2,4)nxВар. 6(0,2)421––––7(2,4)––312––6(4,6)––143––8(6,8)––12317(8,10)––––1326(10,12)––––––336ny479146=n 40(0,2)422––––8(2,4)––312––6(4,6)––134––8(6,8)––12216(8,10)––––1337(10,12)––––––325ny479146=n 40(0,2)532––––10(2,4)––432––9(4,6)––143––8(6,8)––12418(8,10)––––1348(10,12)––––––347ny5912159=n 50(0,2)––125412(2,4)––364––13(4,6)––255––12(6,8)2531––11(8,10)442––––10(10,12)43––––––7ny101818154=n 65(0,2)––––23510(2,4)––23419(4,6)––352––8(6,8)1421––8(8,10)432––––8(10,12)53––––––7ny101514106=n 65243(0,2)421––––7(2,4)––312––6(4,6)––143––8(6,8)––12317(8,10)––––1326(10,12)––––––325ny479155=n 40(2,4)422––––8(4,6)––312––6(6,8)––134––8(8,10)––12216(10,12)––––1337(12,14)––––––325ny479146n= 40(0,2)532––––10(2,4)––432––9(4,6)––143––8(6,8)––12418(8,10)––––1348(10,12)––––––347ny5912159=n 50(2,4)641––––11(4,6)––441––9(6,8)––233––8(8,10)––13217(10,12)––––1438(12,14)––––––347ny61112138n= 50Вар.
10(0,2)(8,10)3(6,8)2(4,6)1(2,4)––(0,2)––nx6Вар. 11(2,4)––332––8(4,6)––143––8(6,8)––13318(8,10)––––1326(10,12)––––––224ny3712135=n 40(10,12)(8,10)(6,8)(4,6)(2,4)nxВар. 7(8,10)(6,8)(4,6)(2,4)(0,2)nxВар. 8(10,12)(8,10)(6,8)(4,6)(2,4)nxВар. 9(8,10)(6,8)(4,6)(2,4)(0,2)nx244(0,4)(6,8)3(4,6)2(2,4)3(0,2)––(–2,0)––nx8Вар. 12(–2,0)(10,12)4(8,10)3(6,8)2(4,6)––(2,4)––nx9Вар. 13(–2,0)(8,10)4(6,8)2(4,6)3(2,4)––(0,2)––nx9Вар.
14(0,2)(4,6)6(2,4)3(0,2)2(–2,0)––(–4,–2)––nx11Вар. 15(–2,0)(8,10)5(6,8)4(4,6)2(2,4)––(0,2)––nx11Вар. 16(8,12)––143––8(12,16)––12317(0,2)––332––8(2,4)––143––8(4,6)––13318(6,8)––––34310(8,10)––––––347ny4815158=n 50(0,2)––352––10(2,4)––243––9(4,6)––12317(6,8)––––1427(8,10)––––––448ny4815167=n 50(2,4)––441––9(4,6)––233––8(6,8)––12317(8,10)––––2428(10,12)––––––437ny61013156=n 50(0,2)––432––9(2,4)––233––8(4,6)––12317(6,8)––––1348(8,10)––––––347ny51111149=n 50245(16,20) (20, 24)––––––––1––332265ny3711145n= 40(4,8)––312––6(0,2)(8,10)3(6,8)7(4,6)4(2,4)––(0,2)––nx14Вар.
17(0,2)(6,8)3(4,6)4(0,2)1(–2,0)––(–4,–2)––nx8Вар. 18(0,2)(10,12)––(8,10)––(6,8)2(4,6)3(2,4)5nx10Вар. 19(0,2)(4,6)––(2,4)––(0,2)2(–2,0)3(–4,–2)6nx11Вар. 20(–2,0)(8,10)––(6,8)––(4,6)2(2,4)4(0,2)5nx11Вар. 21(2,4)––453––12(4,6)––2103––15(6,8)––163212(8,10)––––1438(10,12)––––––729ny31426207=n 70(2,4)––352––10(4,6)––144––9(6,8)––135110(8,10)––––1438(10,12)––––––325ny3914186=n 50(2,4)––234––9(4,6)––341––8(6,8)1421––8(8,10)431––––8(10,12)43––––––7ny9151295=n 50(2,4)––144––9(4,6)––332––8(6,8)1321––7(8,10)242––––8(10,12)34––––––7ny61513106=n 50(0,2)––234––9(2,4)––332––8(4,6)1321––7(6,8)431––––8(8,10)43––––––7ny51111149=n 50246(0,2)(4,6)––(2,4)––(0,2)3(–2,0)4(–4,–2)6nx13Вар.
22(–2,0)(4,6)––(2,4)––(0,2)2(–2,0)4(–4,-2)5nx11Вар. 23(–2,0)(4,6)––(2,4)––(0,2)1(-2,0)2(-4,-2)4nx7Вар. 24(0,2)(8,10)––(6,8)––(4,6)1(2,4)4(0,2)6nx11Вар. 25(–2,0)(8,10)––(6,8)––(4,6)3(2,4)2(0,2)4nx9Вар. 26(2,4)––154––10(4,6)––342––9(6,8)2341––10(8,10)252––––9(10,12)54––––––9ny91618116=n 60(0,2)––135––9(2,4)––332––8(4,6)1321––7(6,8)242––––8(8,10)34––––––7ny61512125=n 50(0,2)––213––6(2,4)––341––8(4,6)1321––7(6,8)231––––6(8,10)23––––––5ny614974=n 40(2,4)––144––9(4,6)––332––8(6,8)1231––7(8,10)341––––8(10,12)43––––––7ny81312116=n 50(0,2)––253––10(2,4)––342––9(4,6)1321––7(6,8)241––––7(8,10)44––––––8ny7161584=n 50247(0,2)(8,10)––(6,8)––(4,6)4(2,4)7(0,2)3nx14Вар. 27(0,2)(10,12)––(8,10)––(6,8)2(4,6)3(2,4)5nx10Вар. 28(0,2)(4,6)––(2,4)––(0,2)2(–2,0)3(–4,–2)6nx11Вар.
29(–2,0)(10,12)4(8,10)3(6,8)2(4,6)––(2,4)––nx9Вар. 30(0,2)(4,6)––(2,4)––(0,2)2(–2,0)4(–4,–2)6nx12(2,4)––354––12(4,6)––3102––15(6,8)2361––12(8,10)341––––8(10,12)27––––––9ny72026143=n 70(2,4)––234––9(4,6)––341––8(6,8)1421––8(8,10)431––––8(10,12)43––––––7ny9151295=n 50(2,4)––154––10(4,6)––332––8(6,8)1421––8(8,10)252––––9(10,12)441––––9ny71715106=n 55(0,2)––362––11(2,4)––273––12(4,6)––144211(6,8)––165315(8,10)––––25512ny410271910=n 70(2,4)––155112(4,6)––362––11(6,8)2541––12(8,10)372––––12(10,12)74––––––11ny122019127=n 602483.8.
Статистические решающие функцииПусть X –– случайная величина, тип закона распределения которойF ( x, q) –– известен, но неизвестно значение параметра q этого закона. Естьоснования полагатьтолько, что qÎ X –– некоторому множеству значений.rПусть X = { X 1 , X 2 ,K, X n } –– результаты n наблюдений случайнойвеличины X.rУдобно рассматривать выборку X как точку в выборочномпространстве W. Напомним, что W –– совокупность всех возможныхвыборок данного объема из значений случайной величины.По результатам наблюдений необходимо принять решение означении параметра q.Если D –– множество возможных решений (в нашем случае Dсовпадает с X),r то с формальной точки зрения необходимо найтиотображение d ( X ) выборочного пространства W на пространство решенийD (см. рис.
3.8.1).Рис. 3.8.1Такое отображение называют статистическим решающим правиломили стратегией.При каждом q мы можем принять любое решение d Î D. Принятиерешения d, когда истинное значение параметра равно q, приводит к потереL(q, d ).
Величина L(q, d ) может быть и отрицательной –– тогда этовыигрыш.Для того чтобы выбрать оптимальное решающее правило, нуженкритерий, по которому можно их сравнивать. Для этой цели вводится врассмотрение так называемая функция риска, которая определяется каксреднееrзначение функцииr потерь при значении параметра q:R (q, d ( X ))= M {L[q, d ( X )]},rrr=[q,()](, q) для дискретной случайной величины,R (q, d ( X )) åLdXPXrXrrrR (q, d ( X )) ò L=q[ , d ( X )] dP ( X , q) для непрерывной случайной величины.rX ÎW249Функция риска дает возможность сравнивать стратегии между собой.В частности, стратегия d* предпочтительнее стратегии d, еслиR (q, d *) £ R(q, d ) при всех qÎ XиR (q, d *) < R(q, d ) хотя бы при одном qÎ X .Иногда можно говорить о равномерно лучшей решающей функции.Такой, например, является решающая функция d2 на рис.