Оценка размера рабочего набора виртуальной машины исходя из гостевых показателей производительности (1187411), страница 4
Текст из файла (страница 4)
äëÿ ëþáîé ëèíåéíîé ïî yi è íåñìåùåííîé àëüòåðíàòèâíîé îöåíêè β̂ alt :altV ar β̂j |X ≥ V ar β̂j |XV arβ̂jalt ≥ V ar β̂j(e)V ar β̂j |X =25σ2RSSj(3.15)(3.16)(3.17)(f)Cov β̂j , ˆj |X = 0(3.18)E σ̂ 2 |X = σ 2(3.19)E σ̂ 2 = σ 2(3.20)RSSn−k(3.21)(g)σ̂ 2 =2. Àñèìïòîòè÷åñêèå - ñâîéñòâà êîòîðûå âåðíû íà áîëüøèõâûáîðêàõ äàæå áåç ïðåäïîëîæåíèè î íîðìàëüíîñòè ðàñïðåäåëåíèÿ i . Ïðè n → ∞:(a)βˆj → βj(3.22)ïî âåðîÿòíîñòè, ò.å. βˆj ñîñòîÿòåëüíû(b)βˆj − βj ∼ N (0, 1)se βˆj(3.23)(c) Ñõîäèìîñòü ïî âåðîÿòíîñòèσ̂ 2 → σ 2σ̂ 2 =26RSSn−k(3.24)(3.25)3.
Ïðè íîðìàëüíîñòè îøèáîê - ñâîéñòâà âåðíûå äàæå íà ìàëûõ âûáîðêàõ ïðè íîðìàëüíî ðàñïðåäåëåííûõ i . i |X ∼ N 0, σ 2 :(a) Îöåíêè ýôôåêòèâíû ñðåäè íåñìåùåííûõ(b)(c)3.2.3ˆβj − βj X ∼ tn−kse (βj ) (3.26)βˆj − βj∼ tn−kse (βj )(3.27)RSS X ∼ χ2n−k2σ(3.28)RSS∼ χ2n−k2σ(3.29)Îöåíêà êà÷åñòâà ìîäåëåé äàííîì ðàçäåëå ðàññìàòðèâàþòñÿ ìåòîäû îöåíêè êà÷åñòâà ïîëó÷åííûõ ìîäåëåé.Ñóùåñòâóåò òðè êëþ÷åâûå ìåòðèêè îöåíêè ìîäåëè èç êîòîðûõâûâîäÿòñÿ âñå îñòàëüíûå:1. Residuals sum of squares :RSS =nXe2ii=1=nX(yi − ŷi )2(3.30)i=1Ãäå yi - èñòèííîå çíà÷åíèå çàâèñèìîé ïåðåìåííîé â ìîìåíò âðåìåíè i, ŷi - ïðåäñêàçàííîå ïîëó÷åííîé ìîäåëüþ çíà÷åíèå.272.
Explained sum of squares :ESS =nX(ŷi − y)2(3.31)i=1Ãäå ŷi - ïðåäñêàçàííîå ïîëó÷åííîé ìîäåëüþ çíà÷åíèå, overliney- ñðåäíåå çíà÷åíèå y - ñðåäíåå çíà÷åíèå ïî íàáîðó äàííûõ, ïîêîòîðîìó ïîäãîíÿëàñü ìîäåëü.3. Total sum of squares :T SS =nX(yi − y)2(3.32)i=1Ãäå yi - èñòèííîå çíà÷åíèå çàâèñèìîé ïåðåìåííîé â ìîìåíò âðåìåíè i, y - ñðåäíåå çíà÷åíèå çàâèñèìîé ïåðåìåííîé.Ýòè ìåòðèêè ïðèãîäíû äëÿ ñðàâíåíèÿ îäíîé è òîé æå ìîäåëè ñðàçëè÷íûìè ïàðàìåòðàìè.Äëÿ ñðàâíåíèÿ ìîäåëåé èñïîëüçóþòñÿ ñëåäóþùèå ìåòðèêè:1. R squared :ESSRSS=1−T SST SS(3.33)RSSn−1= 1 − n − k = 1 − 1 − R2T SSn−kn−1(3.34)R2 =2.
R squared adjusted :2Radj3. Èíôîðìàöèîííûé Êðèòåðèé Àêàèêå (AIC) :2kESSAIC =+ lnnn28(3.35)4. Áàéåñîâñêèé Èíôîðìàöèîííûé Êðèòåðèé Øâàðöà (BIC) :k ln (n)ESSBIC =+ lnnn(3.36)Îñíîâíàÿ ïðîáëåìà ïðèìåíåíèÿ (âûáîðî÷íîãî) R2 çàêëþ÷àåòñÿ âòîì, ÷òî åãî çíà÷åíèå óâåëè÷èâàåòñÿ (íå óìåíüøàåòñÿ) îò äîáàâëåíèÿ â ìîäåëü íîâûõ ïåðåìåííûõ, äàæå åñëè ýòè ïåðåìåííûå íèêàêîãîîòíîøåíèÿ ê îáúÿñíÿåìîé ïåðåìåííîé íå èìåþ, ïîýòîìó ñðàâíåíèåìîäåëåé ñ ðàçíûì êîëè÷åñòâîì ôàêòîðîâ ñ ïîìîùüþ êîýôôèöèåíòà äåòåðìèíàöèè, âîîáùå ãîâîðÿ, íåêîððåêòíî.
Äëÿ ñðàâíåíèÿ ìî2äåëåé ñ ðàçíûì êîëè÷åñòâîì ôàêòîðîâ èñïîëüçóþò êðèòåðèè Radj,AIC ,BIC .Ïðè ñðàâíåíèè ìîäåëåé ëó÷øåé ÿâëÿåòñÿ òà ìîäåëü ó êîòîðîé2Radjáîëüøå èëè AIC , BIC ìåíüøå.3.2.4Ïðîâåðêà ãèïîòåçû î íåçíà÷èìîñòè ðåãðåññèèÒàê æå ïîìèìî êðèòåðèåâ äëÿ ñðàâíåíèé ìîäåëåé ñóùåñòâóåòêðèòåðèé äëÿ ïðîâåðêè çíà÷èìîñòè ðåãðåññèè. Ò.å. åñëè íàøà ìîäåëü èìååò âèä:yi = β0 + β1 x1 + β2 x2 + · · · + βk xk(3.37)Òî ìû õîòèì ïðîâåðèòü ãèïîòåçó, ÷òî íè îäèí èç ðåãðåññîðîâ íå29âëèÿåò íà çàâèñèìóþ ïåðåìåííóþ:β1 = 0, β = 0,2H0 =...βk = 0.(3.38)Ïðîòèâ ãèïîòåçû H1 ÷òî õîòÿ áû îäèí èç êîýôôèöèåíòîâ íå ðàâåí0.Òî äëÿ ýòîãî èñïîëüçóåòñÿ F -ñòàòèñòèêà, âû÷èñëÿåìàÿ ïî ôîðìóëå:ESS(3.39)F = k − 1 ∼ Fk−1,n−kRSSn−kÃäå n - êîëè÷åñòâî íàáëþäåíèé, k - êîëè÷åñòâî ðåãðåññîðîâ. Åñëèíàáëþäàåìàÿ F -ñòàòèñòèêà áóäåò áîëüøå êðèòè÷åñêîãî çíà÷åíèÿ, H0îòâåðãàåòñÿ.3.2.5Òåñò Ðàìñåÿ, ïðîâåðêà íàëè÷èÿ ïðîïóùåííûõ ïåðåìåííûõ ñâîåé ðàáîòå [27] Ðàìñåé ïðåäëîæèë òåñò, ïðîâåðÿþùèé íàëè÷èå ïðîïóùåííûõ ïåðåìåííûõ â ìîäåëè.Ñòðîèòñÿ äîïîëíèòåëüíàÿ ìîäåëü:yi = xTi β + a2 ŷi2 + a3 ŷi3 + · · · + am ŷim + i(3.40)È ïðè ïîìîùè F -ñòàòèñòèêè ïðîâåðÿåòñÿ ãèïîòåçà H0 : a2 =a3 = · · · = am = 030F -ñòàòèñòèêà èìååò àñèìïòîòè÷åñêîå ðàñïðåäåëåíèå:χ2 =RSSR − RSSU R→ χ2rRSSU Rn − kU R(3.41)Ïî ôîðìóëå ïðè íîðìàëüíîì ðàñïðåäåëåíèè îøèáîê:F =(RSSR − RSSU R ) /r∼ Fr,n−kU RRSSU R / (n − kU R )(3.42)RSSU R - RSS ìîäåëè îïèñàííîé ôîðìóëîé 3.40.RSSR - RSS ìîäåëè ïðè çàíóëåííûõ êîýôôèöèåíòîâ èç H0 .r - êîëè÷åñòâî îãðàíè÷åíèé â H0 .kU R - êîëè÷åñòâî ðåãðåññîðîâ â íåîãðàíè÷åííîé ìîäåëè.Åñëè F -ñòàòèñòèêà áîëüøå ñâîåãî êðèòè÷åñêîãî çíà÷åíèÿ, ãèïîòåçà îá îòñóòñòâèè ïðîïóùåííûõ ïåðåìåííûõ îòâåðãàåòñÿ.3.2.6ÌóëüòèêîëëèíåàíîñòüÌóëüòèêîëëèíåàðíîñòü - íàëè÷èå ëèíåéíîé çàâèñèìîñòè ìåæ-äó ðåãðåññîðàìè[28].Ðàçëè÷àþò äâà òèïà ðåãðåññîðîâ:1.
Ñòðîãàÿ - èäåàëüíàÿ ëèíåéíàÿ çàâèñèìîñòü ìåæäó ðåãðåññîðàìè;2. Íåñòðîãàÿ - çàâèñèìîñòü áëèçêàÿ ê ëèíåéíîé.Ïîñëåäñòâèåì ñòðîãîé ìóëüòèêîëëèíåàðíîñòè ÿâëÿåòñÿ íå åäèíñòâåííîñòü îöåíîê OLS.31Íåñòðîãàÿ ìóëüòèêîëëèíåàðíîñòü íå íàðóøàåò ñòàíäàðòíûõ ïðåäïîñûëîê. Îöåíêè β̂j íåñìåùåííûå, àñèìïòîòè÷åñêè íîðìàëüíî ðàñïðåäåëåííûå, ìîæíî ïðîâåðÿòü ãèïîòåçû è ñòðîèòü äîâåðèòåëüíûéèíòåðâàëû. Ïîñëåäñòâèåì íåñòðîãîéìóëüòèêîëëèíåàðíîñòèÿâëÿþòñÿ âûñîêèå ñòàíäàðòíûå îøèáêè se β̂j .Ïîñëåäñòâèÿ íåñòðîãîé ìóëüòèêîëëèíåàðíîñòè:1. Î÷åíü øèðîêèå äîâåðèòåëüíûå èíòåðâàëû2. Íåçíà÷èìûå êîýôôèöèåíòû3. ×óâñòâèòåëüíîñòü ìîäåëè ê äîáàâëåíèþ/óäàëåíèþ íàáëþäåíèÿÒèïè÷íûå ïðîÿâëåíèÿ íåñòðîãîé ìóëüòèêîëëèíåàðíîñòè:1. Íåñêîëüêî êîýôôèöèåíòîâ íåçíà÷èìû ïî îòäåëüíîñòè, íî ãèïîòåçà îá èõ îäíîâðåìåííîé íåçíà÷èìîñòè îòâåðãàåòñÿÌåòîäû áîðüáû ñ ìóëüòèêîëëèíåàðíîñòüþ:1.
LASSO - ðåãðåññèÿ2. Ridge - ðåãðåññèÿ3. Ââåäåíèå áèíàðíûõ ïåðåìåííûõ4. Ìåòîä ãëàâíûõ êîìïîíåíò (PCA)LASSO è Ridge ðåãðåññè - ýòî ðåãðåññè ñî øòðàôàìè çà ñëèøêîìáîëüøèå êîýôôèöèåíòû. Ðàçëè÷àþòñÿ îíè ÷àñòüþ îòâå÷àþùèé çàâû÷èñëåíèÿ øòðàôà.32Áèíàðíûå ïåðåìåííûå(äàììè-ïåðåìåííûå) - ïåðåìåííûå, êîòîðûå ìîãóò ïðèíèìàòü âñåãî äâà çíà÷åíèÿ, íàïðèìåð 0 èëè 1 â çàâèñèìîñòè îò ïðèçíàêà. Íàïðèìåð â ìîäåëü âêëþ÷åí ïîë ÷åëîâåêàè äàììè-ïåðåìåííàÿ ðàâíà 1 â ñëó÷àå, åñëè ÷åëîâåê æåíùèíà è 0 âñëó÷àå ìóæ÷èíû.Ìåòîä ãëàâíûõ êîìïîíåíò ñòðîèò íîâûå ðåãðåññîðû êàê ëèíåéíóþ êîìáèíàöèþ èñõîäíûõ. Ïîäðîáíåå ðàññìîòðåí â 3.2.7.3.2.7Ìåòîä ãëàâíûõ êîìïîíåíò (PCA)Principal Component Analysis,Ìåòîä ãëàâíûõ êîìïîíåíò (PCA) îäèí èç îñíîâíûõ ñïîñîáîâ óìåíüøèòü ðàçìåðíîñòü äàííûõ,ïîòåðÿâ íàèìåíüøåå êîëè÷åñòâî èíôîðìàöèè[29].
Ôàêòè÷åñêè, ïîçâîëÿåò óìåíüøèòü ÷èñëî ïåðåìåííûõ, âûáèðàÿ ñàìûå èçìåí÷èâûå.Äëÿ ïîíèìàíèÿ ðàññìîòðèì ïðîñòîé ïðèìåð. Ïóñòü ó íàñ åñòü äâåèñõîäíûå ïåðåìåííûå x1 , x2 . P CA ñêîíñòðóèðóåò íîâûå ïåðåìåííûå:√1131x2(3.43)pc1 = √ x1 + √ x2 , pc2 = x1 +2222Ïðè ÷åì pc1 èìååò ìàêñèìàëüíóþ âûáîðî÷íóþ äèñïåðñèþ, pc2èìååò âòîðóþ ïî ìàêñèìàëüíîñòè âûáîðî÷íóþ äèñïåðñèþ. Ïðè ÷åìpc1 è pc2 íåêîððåëèðîâàííû, ñëåäîâàòåëüíî, PCA ìîæåò áûòü èñïîëüçîâàí äëÿ èçáåæàíèÿ ìóëüòèêîëëèíåàðíîñòè.333.2.8ÍîðìèðîâêàÄëÿ òîãî ÷òîáû ìåòîä PCA ðàáîòàë íîðìàëüíî, íåîáõîäèìî îòíîðìèðîâàòü äàííûå.À äàííîé ðàáîòå ìû èñïîëüçîâàëè îáû÷íóþ Z-íîðìèðîâêó, âûïîëíÿþùóþñÿ ïî ôîðìóëå:xinormalize =xi − xse (x)(3.44)Ãäå x - ýòî ìàòåìàòè÷åñêîå îæèäàíèå íîðìèðóåìîé ïîñëåäîâàòåëüíîñòè, se (x) - ñòàíäàðòíàÿ îøèáêà x.3.2.9Ãîìåñêåäàñòè÷íîñòü è ãåòåðîñêåäàñòè÷íîñòüÓñëîâíàÿ ãîìîñêåäàñòè÷íîñòü :V ar (i |X) = E 2i |X = σ 2(3.45)Óñëîâíàÿ ãåòåðîñêåäàñòè÷íîñòüV ar (i |X) = E 2i |X =6 const(3.46)Óñëîâíàÿ ãîìîñêåäàñòè÷íîñòü :V ar (i ) = E 2i = σ 2(3.47)Óñëîâíàÿ ãåòåðîñêåäàñòè÷íîñòü :V ar (i ) = E 2i =6 σ2(3.48)Ïîñëåäñòâèÿ óñëîâíîé ãåòåðîñêåäàñòè÷íîñòè íà ìàëûõ âûáîðêàõáåç ïðåäïîëîæåíèÿ î íîðìàëüíîñòè i :341.
Ñâîéñòâî ëèíåéíîñòè ïî y ñîõðàíÿåòñÿ;2. Ñâîéñòâî íåñìåùåííîñòè îöåíîê: E β̂|X = β, E β̂ = β(3.49)3. Ñâîéñòâî ýôôåêòèâíîñòè ñðåäè ëèíåéíûõ íåñìåùåííûõ îöåíîêíå ñîõðàíÿåòñÿ.Ïîñëåäñòâèÿ óñëîâíîé ãåòåðîñêåäàñòè÷íîñòè íà ìàëûõ âûáîðêàõñ ïðåäïîëîæåíèåì î íîðìàëüíîñòè i :1. Ñâîéñòâî:βˆj − βj X ∼ tn−kse (βj ) (3.50)íå âûïîëíÿåòñÿ, ñëåäîâàòåëüíî, áîëüøå íåëüçÿ ñòðîèòü äîâåðèòåëüíûå èíòåðâàëû è ïðîâåðÿòü ãèïîòåçû î çíà÷èìîñòè îòäåëüíîãî êîýôôèöèåíòà;2. Ñâîéñòâî:RSS X ∼ χ2n−k2σ(3.51)íå âûïîëíÿåòñÿ;3. Ñâîéñòâî:F =(RSSR − RSSU R ) /r∼ Fr,n−kU RRSSU R / (n − kU R )(3.52)Ñíîâà íå âûïîëíÿåòñÿ, ñëåäîâàòåëüíî, ìû áîëüøå íå ìîæåìäåëàòü òåñòû íà çíà÷èìîñòü ðåãðåññèè.35Ïîñëåäñòâèÿ óñëîâíîé ãåòåðîñêåäàñòè÷íîñòè íà âûáîðêàõ â êîòîðûõ n → ∞(Àñèìïòîòè÷åñêèå âûáîðêè):1.
Ñâîéñòâî:β̂ → β(3.53)RSS→ σ2n−k(3.54)βˆj − βj∼ N (0, 1)se (βj )(3.55)âûïîëíÿåòñÿ;2. Ñâîéñòâî:âûïîëíÿåòñÿ;3. Ñâîéñòâî:íå âûïîëíÿåòñÿ, íå ìîæåì òåñòèðîâàòü ãèïîòåçû è ñòðîèòü äîâåðèòåëüíûå èíòåðâàëû íåëüçÿ;4. Ñâîéñòâî:χ2 =RSSR − RSSU R→ χ2rRSSU Rn − kU R(3.56)íå âûïîëíÿåòñÿ, ïðîâåðÿòü ãèïîòåçû ñ íåñêîëüêèìè îãðàíè÷åíèÿìè íåëüçÿ.Äëÿ ïðîâåðêè íà óñëîâíóþ ãåòåðîñêåäàñòè÷íîñòü èñïîëüçóåòñÿäâà òåñòà: òåñò Óaéòà[30] è òåñò Ãîëäôåëüäà-Êâàíäòà[31].363.2.10ÀâòîêîððåëÿöèÿÀâòîêîððåëÿöèÿ - ñòàòèñòè÷åñêàÿ âçàèìîñâÿçü ìåæäó ïîñëå-äîâàòåëüíîñòÿìè âåëè÷èí îäíîãî ðÿäà, âçÿòûìè ñî ñäâèãîì, íàïðèìåð, äëÿ ñëó÷àéíîãî ïðîöåññà ñî ñäâèãîì ïî âðåìåíè.
Íàëè÷èåàâòîêîððåëÿöèè ñëó÷àéíûõ îøèáîê ðåãðåññèîííîé ìîäåëè ïðèâîäèòê óõóäøåíèþ êà÷åñòâà ÌÍÊ-îöåíîê ïàðàìåòðîâ ðåãðåññèè, à òàêæåê çàâûøåíèþ òåñòîâûõ ñòàòèñòèê, ïî êîòîðûì ïðîâåðÿåòñÿ êà÷åñòâîìîäåëè (òî åñòü ñîçäàåòñÿ èñêóññòâåííîå óëó÷øåíèå êà÷åñòâà ìîäåëèîòíîñèòåëüíî å¼ äåéñòâèòåëüíîãî óðîâíÿ òî÷íîñòè). Ïîýòîìó òåñòèðîâàíèå àâòîêîððåëÿöèè ñëó÷àéíûõ îøèáîê ÿâëÿåòñÿ íåîáõîäèìîéïðîöåäóðîé ïîñòðîåíèÿ ðåãðåññèîííîé ìîäåëè.Ïðè àâòîêîððåëÿöèè íàðóøàåòñÿ îñíîâíàÿ ïðåäïîñûëêà òåîðåìûÃàóññà-Ìàðêîâà î íåçàâèñèìîñòè îøèáîê ìîäåëè ìåæäó ñîáîé:Cov (i j |X) 6= 0, i 6= j(3.57)Íàïðèìåð, àâòîêîððåëÿöèÿ ïîðÿäêà p = m ãîâîðèò íàì:t = φ1 t−1 + φ2 t−2 + · · · φm t−m + ut(3.58)Ãäå t - îøèáêà â ìîìåíò âðåìåíè t, t − 1 - îøèáêà â ìîìåíòâðåìåíè t − 1 è ò.ä.φi - êîýôôèöèåíû ëèíåéíîé çàâèñèìîñòè.ut - ñëó÷àéíàÿ âåëè÷èíà, îäèíàêîâî ðàñïðåäåëåííàÿ, íåçàâèñèìàÿîò ðåãðåññîðîâ, E (ut ) = 0, V ar (ut ) = σu2 .Íàðóøàåìûå àâòîêîððåëÿöèå ïðåäïîñûëêè:1.
Íàðóøàåòñÿ ïðåäïîñûëêà î íåçàâèñèìîñòè íàáëþäåíèé;372. ×àñòî íàðóøàåòñÿ ïðåäïîñûëêà î ñòðîãîé ýêçîãåííîñòè, íàïðèìåð, èñïîëüçîàíèå yt−1 íàðóøàåò ïðåäïîñûëêó E (t |X) = 0.Ïîñëåäñòâèÿ àâòîêîððåëÿöèè íà ìàëûõ âûáîðêàõ áåç ïðåäïîëîæåíèÿ î íîðìàëüíîñòè i :1. Ñâîéñòâî ëèíåéíîñòè ïî y ñîõðàíÿåòñÿ;2. Ñâîéñòâî íåñìåùåííîñòè îöåíîê; E β̂|X = β, E β̂ = β(3.59)3. Ñâîéñòâî ýôôåêòèâíîñòè ñðåäè ëèíåéíûõ íåñìåùåííûõ îöåíîêíå ñîõðàíÿåòñÿ.Ïîñëåäñòâèÿ àâòîêîððåëÿöèè íà ìàëûõ âûáîðêàõ ñ ïðåäïîëîæåíèåì î íîðìàëüíîñòè i :1.
Ñâîéñòâî:βˆj − βj X ∼ tn−kse (βj ) (3.60)íå âûïîëíÿåòñÿ, ñëåäîâàòåëüíî, áîëüøå íåëüçÿ ñòðîèòü äîâåðèòåëüíûå èíòåðâàëû è ïðîâåðÿòü ãèïîòåçû î çíà÷èìîñòè îòäåëüíîãî êîýôôèöèåíòà;2. Ñâîéñòâî:RSS X ∼ χ2n−k2σíå âûïîëíÿåòñÿ;38(3.61)3. Ñâîéñòâî:F =(RSSR − RSSU R ) /r∼ Fr,n−kU RRSSU R / (n − kU R )(3.62)Ñíîâà íå âûïîëíÿåòñÿ, ñëåäîâàòåëüíî, ìû áîëüøå íå ìîæåìäåëàòü òåñòû íà çíà÷èìîñòü ðåãðåññèè.Ïîñëåäñòâèÿ àâòîêîððåëÿöèè íà âûáîðêàõ â êîòîðûõ n → ∞(Àñèìïòîòè÷åñêèå âûáîðêè):1. Ñâîéñòâî:β̂ → β(3.63)RSS→ σ2n−k(3.64)âûïîëíÿåòñÿ;2. Ñâîéñòâî:âûïîëíÿåòñÿ;3.