Ekonometrijos paskaitų medžiaga

Turinys

Ekonometrijos vaidmuo
Aprašomoji statistika
Atsitiktiniai dydžiai ir jų tikimybių pasiskirstymo f-jos
Matematinė viltis, dispersija, kovariacija, koreliacija
Normalusis, standartinis normalusis, χ2, stjudento ir f pasiskirstymas
Hipotezių tikrinimo procedūra
Tiesinės porinės regresijos modelis
Tiesinio porinio regresijos modelio sudarymas ir įvertinimas
Tiesinio porinės koreliacijos modelio sudarymas ir įvertinimas
PARAMETRŲ b1 IR b2 INTERPRETACIJA
Tiesinio regresinio modelio įverčių, paskaičiuotų mažiausių kvadratų metodo pagalba, savybės
Daugialypės regresijos lygtis
Bendras dauginės regresijos modelio formulavimas. paprasčiausi pavyzdžiai. modelio parametrų įvertinimas. mažiausių kvadratų metodas
Dauginės regresijos lygties ekonominė interpretacija
Daugialypės regresijos lygties sudarymo technika
Daugialypės regresijos lygties statistinė interpretacija
Lygties likutinė dispersija
Daugialypės determinacijos koeficientas
Daugialypės koreliacijos koeficientas
Porinės koreliacijos koeficientai
Grynosios (dalinės) koreliacijos, determinacijos koeficientai
Veiksnių interkoreliacijos (multikolinearumo) problema ir jos sprendimo metodai
Interkoreliacijos sąvoka, jos priežastys ir pasekmės
Porinė koreliacijos koeficiento panaudojimas multikolinearumo analizei ir eliminavimui
Daugialypės koreliacijos koeficiento panaudojimas multikolinearumo tyrimo galimybėms
Veiksnių interkoreliacijos eliminavimo arba sušvelninimo būdai
Ridge regresija
Netiesinio įvertinimo metodai
Reikšminių ekonometrinio modelio veiksnių atrinkimo problema ir jos sprendimo būdai
Bendriausi šios problemos sprendimo principai ir praktinės taisyklės
Visų įmanomų regresijų metodas
Stjudento kriterijaus panaudojimas reikšminių veiksnių atrinkimui
T kriterijaus panaudojimas strategijoje forward
T kriterijaus panaudojimas strategijoje backward
Stepviser strategijos realizavimas f-kriterijaus pagalba
Kelios pastabos dėl veiksnių atrinkimo
Modelio likutinių dydžių autokoreliacija
Matematiniai statistiniai kriterijai

Ekonometrijos vaidmuo

Ekonominė teorija Ekonominiai

Ekonominiai duomenys sprendimai

Ekonometrija – tai ekonominės analizės priemonė, kuri pajungia ekonomikos teoriją ir ekonominius duomenis.

Ekonometrinio modelio sudarymo etapai:

1. Ekonominis modelis

2. Statistinis modelis

3. Ekonometrinis modelis

Ekonominis modelis. Pirma ir svarbiausia ekonometrinio modelio sudarymo sąlyga. Jam reikia sutelkti visas ekonomines žinias.

1. qD priklauso nuo kainos, stipendijos, polinkio gerti, oro

2. qS priklauso nuo kainos, qD, savikaina, gamintojų skaičiaus

Esmė – kokius veiksnius analizuosime.

Statistinis modelis. Kuris veiksnys veikia stipriau? Čia pereinama prie statininio modelio. Jo tikslas – įvertinti daugelio individų, AB ir t.t. elgesio dėsningumus. Kaip konkretus rezultatas keičiasi pakitus vienu vienetu veiksniui.

Konkrečių atsakymų nebūna. Tik dėsningumai, nes kai kurie veiksniai yra atsitiktiniai. Statistinių modelių tikslas – atskirti dėsningumus nuo atsitiktinumų.

Statistinis modelis

Faktinė reikšmė = sisteminė dalis + atsitiktinė dalis

Pvz.: vartojimas – c, pajamų funkcija f(i) su paklausa e, tuomet:

c = f(i) + e kur f(i) – sisteminė dalis, e – atsitiktinė dalis.

Sisteminė dalis f(i) nusako dėsningumus, tačiau faktinės reikšmės nukrypsta dėl atsitikininės dalies e.

Vartojimo statistinis modelis:

c = f(i) + e

Būtina konkreti f(i). Tarkime vartojimas c yra tiesinė pajamų i funkcija:

f(i) = b1 + b2i

Tuomet statistinis vartojimo modelis bus:

c = b1 + b2i + e

Jis persipina ir toliau.

Ekonometrinis modelis. Čia įjungiami duomenys.

Ekonominis modelis (ekonominiai veiksniai ir jų tarpusavio ryšys)

Statistinis modelis (kintamieji parametrai ir jų ryšio forma) Ekonometrinis modelis

Duomenys (kintamųjų konkrečios reikšmės)

Tai statistinis modelis su labai konkrečiomis reikšmėmis.

cA = b1 + b2i + e, cA – alaus vartojimas

cA =…………… i = ……………………

cA = 1.5 + 0.3i + e – ekonometrinis modelis (rezultatas)

Ekonometrinio modelio sudarymas:

ü formuojama problema (klausimas)

ü ekonominis modelis (išvardijami veiksniai)

ü statistinis modelis (kokia funkcija, kintamieji)

ü naudojimasis kompiuteriniu paketu (Excel)

ü ar tai statistiškai patikimas modelis?

ü ekonominė analizė

II paskaita (00 02 21)

Aprašomoji statistika

Atsitiktiniai dydžiai ir jų tikimybių pasiskirstymo f-jos

Atsitiktiniai dydžiai – dydžiai, kurių reikšmes galime sužinoti tik po to, kai jie įvyksta. Kol įvykis neįvykęs, nieko negalime pasakyti apie konkrečią reikšmę.

y = b1 + b2x1 + e, b1, b2 – atsitiktiniai dydžiai.

Visi atsitiktiniai dydžiai skirstomi į tolydinius ir diskretinius.

Diskretiniai – kurie gali įgauti tik baigtinį reikšmių skaičių. (Kauliuko akučių skaičius) Diskretiniai dydžiai gali būti ir fiktyvūs atsitiktiniai dydžiai, kai jais išreiškiamos kokybinės charakteristikos.

Tolydieji atsitiktiniai dydžiai gali įgauti bet kokias reikšmes iš intervalo. (Pvz.: BVP)

Atsitiktinių dydžių pasiskirstymas

I. Diskrečiųjų dydžių

1. Lentelių pavidalas

Pvz. A – pro duris įėjo mergina (M)

B – pro duris įėjo vaikinas (V)

M = 1

V = 2, tai P(x = 1) = 0,53, P(x = 2) = 0,47

2. Grafinis pavidalas

II. Tolydžiųjų dydžių pasiskirstymas išreiškiamas kreive.

Grupė 5 6 7 8 9 10 11 12

Moterų sk. 13 11 8 14 12 9 8 14

Vyrų sk. 7 12 11 5 9 13 12 10

Grupė 5 6 7 8 9 10 11 12

P(M) 0,077 0,065 0,048 0,083 0,071 0,048 0,083 0,053

P(V) 0,042 0,071 0,065 0,030 0,054 0,077 0,071 0,047

Matematinė viltis, dispersija, kovariacija, koreliacija

Matematinė viltis (vidurkis) – atsitiktinio dydžio reikšmė, kai įvykis kartojasi daugybę kartų, žymima E(x)

M=1, V=2, tai E(x)=1*1,53+2*0,47=1,47

– tolydiesiems dydžiams

, – vidutinis kvadratinis nuokrypis

III paskaita (00 02 28)

Kovariacija – vienas iš koeficientų, reikalingas įvertinti, ar 2 kintamieji tarpusavyje yra susiję, ar ne.

Kai cov(x, y) = 0, ryšio tarp dviejų kintamųjų nėra.

Kai cov(x, y) £ 0, susiję priešinga priklausomybe (vienam didėjant, kitas mažėja)

Kai cov(x, y) > 0, abu kintamieji kinta ta pačia kryptimi.

Koreliacijos koeficientas

– jeigu naudojame neatsitiktinius dydžius

Normalusis, standartinis normalusis, χ2, stjudento ir f pasiskirstymas

Normalusis skirstinys yra dažniausiai sutinkamas skirstinys, pakankamai gerai pažįstamas.

x – atsitiktinis dydis m – vidurkis s2 – dispersija x1 < x < x2

x~N(m, s2)

Normuotas normalusis skirstinys – m = 0, s2 = 1, x~N(0, 1).

Bet kurį normalųjį skirstinį galima perversti į normuotą normalųjį skirstinį.

– tokios matematinės operacijos būdu pereinama prie normuoto normaliojo skirstinio.

f(x-s, x+s) = 0,682

f(x-2s, x+2s) = 0,95

f(x-3s, x+3s) = 0,99

χ2 skirstinys (atsitiktinių dydžių kvadratų suma)

Tarkime turime z1, z2, z3 … zm atsitiktinių dydžių, kurių kiekvienas turi normalųjį normuotą tikimybių skirstinį, t.y. Z~N(0,1). Tuomet V=z12+z22+…+zm2 turės χ2 skirstinį su m laisvės laipsnių.

Studento skirstinys (t)

Fišerio skirstinys

, V1 ir V2 turi χ2 pasiskirstymą, o m1 ir m2 – laisvės laipsnių skaičius.

Hipotezių tikrinimo procedūra

1. Formuojame nulinę hipotezę, pvz.: m=a

2. Formuojame alternatyvią hipotezę, pvz.: m<>a arba m>a

3. Parenkama statistika, pagal kurią tikrinsime hipotezę

4. Pasirenkame reikšmingumo lygmenį, kokiu patikimumu teigiame, kad hipotezė priimama arba atmetama.

Tiesinės porinės regresijos modelis

Tiesinio porinio regresijos modelio sudarymas ir įvertinimas

Modelio sudarymas susideda iš 3 etapų:

1. Ekonominis modelis

2. Statistinis modelis

3. Ekonometrinis modelis y = f(x) – porinės regresijos modelis y = f(x1, x2, …, xn) – dauginės regresijos modelis y – priklausomas kintamasis x – nepriklausomas kintamasis

Sudarę modelį, galėsime atsakyti į tokius klausimus:

1. Kaip pasikeis y, x padidėjus Dx?

2. Kokia bus priklausomojo dydžio reikšmė y, esant konkrečiai reikšmei x?

3. Jei įsivardijame y, tai kokia bus x reikšmė?

y = b1 + b2x + e

Ekonominis modelis – mus domina konkrečių produktų paklausa konkrečioje vietoje y1 = f(x1)

y = f(x)

y = b1 + b2x + e

Iš pradžių reikia surinkti duomenis apie pajamas ir išlaidas (yi ir xi)

Kad suskaičiuoti b1 ir b2 reikia priimti tam tikras prielaidas:

1. y ir x yra tiesiškai susiję, t.y. E(y) = y = b1 + b2x

2. Kiekvienai x reikšmei y reikšmės yra išsibarstę apie vidutinę y reikšmę su pastovia s2

3. y reikšmės tarpusavyje nėra susijusios cov(yi, yj) = 0

4. Kad galėtume apskaičiuoti priklausomybę tarp x ir y, x neturi būti konstanta.

Penkios svarbios prielaidos kiekvienai paskaitai:

1. b1 + b2x + e

2. E(e) = 0

3. var(y) = var (ei) = s2

4. cov(yi, yj) = 0 => cov(ei, ej) = 0

IV paskaita (00 03 06 Siga)

Tiesinio porinės koreliacijos modelio sudarymas ir įvertinimas

Prielaidos:

1. E(yi) – matematinė viltis, ei – paklaidos.

PVZ.: yi – išlaidos maistui, xi –i-tojo namų ūkio pajamos, n – n.ū.skaičius.

Kai xi lygios, ekonometrinis modelis duoda vidutinę reikšmę.

Turime tokius duomenis:

Nr. yi xi

5 81 147

6 85 147 E(yi), var(yi) **

7 79 147

J 186 350

J+1 190 350 E(yi), var(yi) **

J+2 174 350

K 369 1000 E(yi), var(yi) **

K+1 370 1000

3. Esant xi = const, yi išsibarstę apie vidurkį ( ) su pastovia dispersija.

Ši prielaida reikalauja, kad visos grupelių, kuriose xi = const, dispersijos būtų tarpusavyje lygios(žr. lentelę**).

4. j-toji reikšmė nepriklauso nuo i-tosios reikšmės, t.y.

, iš čia .

5. xi įgyja bent 2 skirtingas reikšmes (tik tuomet bus galima apskaičiuoti ekonometrinį modelį).

6. Paklaidos turi normalųjį pasiskirstymą, su vidurkiu 0 ir dispersija s2 : .

Jei bent viena iš pirmų 5 prielaidų, tai ekonometrinis modelis yra nepatikimas. Jei neatitinka:

ü Antra (2.), tuomet mūsų sisteminė dalis neišima visų dėsningų faktorių požymių.

ü Trečia (3.), tai – heteroskedastiškumas;

ü Ketvirta (4.), tai – autokoreliacija.

Parametrų b1 ir b2 apskaičiavimas yi – tikroji reikšmė (mūsų duomenų), ŷi – apskaičiuota reikšmė, kuri lygi , o tai tiesė. Šiai tiesei pavaizduoti yra keli būdai:

ü Brėžti per žemiausią ir aukščiausią tašką.

ü Brėžti taip, kad eitų per kuo daugiau taškų.

ü Brėžti taip, kad nuo mūsų tiesės būtų kuo mažesni atstumai iki taškų, t.y. .

Pastarojo būdo tikslas – nukrypimų minimizavimas. Tai mažiausių kvadratų metodas.

b1, b2 apskaičiavimui reikia konkrečių formulių. Diferencijuojama kvadratų suma (iš pradžių pagal b1, po to pagal b2).

Sudarome lygčių sistemą, kurioje nežinomieji yra ieškomi parametrai.

Ši formulė rodo pajamų ir išlaidų maistui priklausomybę.

PARAMETRŲ b1 IR b2 INTERPRETACIJA

1. b2 – šis parametras vertingiausias. Jis rodo, kokiu dydžiu pasikeis išlaidos maistui, jei gyventojų pajamos padidės 1 piniginiu vienetu. Kokiu dydžiu pasikeis apskaičiuota ŷi reikšmė, priklausomajam dydžiui pakitus 1 vienetu.

b1 – jo interpretacija sunki, tai gali būti pradinė padėtis, reikšmė, kuri yra kai xi = 0.

2. Jų pagalba galima apskaičiuoti elastingumą.

Tiesinio modelio atveju ; skaičiuojamas vidutinėms reikšmėms taip: . = 0.68. Tai reiškia, kad pajamoms padidėjus 1%, išlaidos maistui padidėja 0.68 %.

3. Šiuo atveju mes turime tokį modelį: yi = b1+b2xi+ei . Bet jis gali būti sudėtingesnis. Kai sakoma tiesinis modelis, turima omenyje tiesinis parametrų atžvilgiu.

Šis modelis irgi priklauso tiesinių porinės regresijos modelių grupei. Šiuo atveju kis tik parametrų interpretacija.

V paskaita (00 03 13 Siga )

Tiesinio regresinio modelio įverčių, paskaičiuotų mažiausių kvadratų metodo pagalba, savybės

1. Mažiausių kvadratų įverčiai – atsitiktiniai dydžiai.

2. Mažiausių kvadratų įverčių statistinės charakteristikos.

2.1. matematinė viltis

2.2. kovariacija

2.3. dispersija

2.4. įverčių tikimybių pasiskirstymas

3. Gauso-Markovo teorema

4. Prognozavimas, remiantis mažiausių kvadratų įverčiais.

1. Mažiausių kvadratų įverčiai – atsitiktiniai dydžiai.

Jei tenkinamos prielaidos:

1. yi = b1 + b2xi + ei (tiesinis modelis)

2. E(ei) = 0 (matematinė viltis)

3. var(yi) = var (ei) = s2

4. cov(yi, yj) = 0 => cov(ei, ej) = 0

5. xi ≠ const

6. ei `~ N (0;σ2)

tai mažiausių kvadratų įverčiai – atsitiktiniai įvykiai.

2. Mažiausių kvadratų įverčių statistinės charakteristikos a) Matematinė viltis b1, b2 – tikrosios reikšmės

– mažiausių kvadratų metodo pagalba gauti įverčiai.

b) Dispersija. Pageidaujama, kad būtų kuo mažesnė. Remiamasi **. Nežinoma var apskaičiuojama sekančiai:

c) Kovariacija. Tai priklausomybė:

Kuo reikšmės plačiau išsibarsčiusios, tuo dispersija didesnė. Kuo platesnė, tuo tyrimas tikslesnis. Kuo mažesnė s2, tuo variacija bus mažesnė.

b1 ir b2 priklausomybė yra atvirkštinė, jei , tai Æ, esant teigiamam d) Įverčių tikimybių pasiskirstymas. Viskas, kas su tuo susiję, galioja tik tada, kai galioja (6) prielaida.

VI paskaita (00 03 27 Jurga)

Daugialypės regresijos lygtis

Bendras dauginės regresijos modelio formulavimas. paprasčiausi pavyzdžiai. modelio parametrų įvertinimas. mažiausių kvadratų metodas

Realioje ekonomikoje priklausomąjį kintamąjį veikia keli veiksniai. Priklausomybės gali būti labai įvairios. Tokius procesus, kurie priklauso nuo daugelio veiksnių apibūdina dauginės regresijos modelis.

Y = (x1, x2, x3, …, xn) + e – pats bendriausias atvejis

Kiekvienas tokio tipo modelis turi tam tikrą parametrų skaičių, todėl jį galima užrašyti ir taip:

Y = (x1, x2, x3, …, xn, a0, a1, …, ak) + e (1)

a0, a1, …, ak – yra tam tikri šio modelio parametrai. i – veiksnio indeksas, i = 1, 2, …, n. k nebūtinai lygu n. Labai dažnai k = n+1 arba k = 2n+1 arba bet koks kitas skaičius.

Tam kad įvertinti teorinius modelio parametrus reikalingi tam tikri stebėjimai. Stebėjimai gali būti atrenkami iš generalinės aibės arba iš dinaminės eilutės. Tai gali būti duomenys apie proceso vystymąsi.

Tarkime, kad j – stebėjimo indeksas, j = 1, 2, …, m.

Matematiškai modelio (1) forma gali būti pati įvairiausia. Tokių formų matematiškai gali būti labai daug, tačiau ekonometriniuose tyrimuose naudojamas tam tikras fiksuotas analitinių formų sąrašas.

Pvz.: Y = a0 + a1x1 + a2x2 + … anxn – tiesinė lygtis (2)

Y = a0x1a1x2a2…xnan – laipsninė funkcija (3)

Y = a0 + a1x1 + a2x22 + a3x1x2 (4)

Y = a0 + a1x1 + a2x2 + a3x22 (5)

Kalbant apie ekonometrinio modelio analitinės formos pasirinkimą reikėtų remtis:

1) pasirinkta modelio forma turi būti gana paprastai ir aiškiai interpretuojama

2) modelio parametrų įvertinimo metodas ir procesas nebūtų per daug sudėtingas

Ekonometriniuose tyrimuose parametrams įvertinti naudojamas mažiausių kvadratų metodas. Taikant MKM, būtina pabrėžti, kad yra nesvarbu, kokia yra funkcija. Svarbu, kad ji būtų tiesinė vertinamų parametrų atžvilgiu.

Q = a0 + a1v1 + … + anvn + e (6), kur Q – tai arba dydis Y, arba bet kokia kita dydžio Y algebrinė transformacija, pvz., lnY, 1/Y ir pan. vi (i = 1, 2, …, n) – arba xi arba bet kokia kita dydžio xi algebrinė transformacija.

(6) vadinamas apibendrintu tiesiniu modeliu. Vertinant modelio (6) parametrus, gauname teorinį parametrų a0, a1, …, ak įvertinimus, kuriuos pažymime a0, a1, …, an. Statydami į modelį (6) realių kintamųjų vi reikšmes, gauname teorinę arba apskaičiuotą dydžio Q reikšmę. Qj = Y = a0 + a1v1j + a2v2 + … anvnj. Kai gauname Qj torinę reikšmę, galime ją palyginti su faktine reikšme Qjfaktinė – Qjapskaičiuota = ej. Dydis ej gaunamas tik tada, kai jau yra įvertinti tam tikro modelio parametrai, todėl ej yra teorinio dydžio ej įvertinimas. ej nebūtinai tenkina teorines ej savybes.

Jeigu taikome modelio parametrų įvertinimui MKM, vadinasi turime minimizuoti faktinių ir apskaičiuotų pagal modelį reikšmių nuokrypių kvadratų sumą.

Sudarome F kriterijų:

( dalinės išvestinės pagal aj turi būti lygios 0)

(taip reikia padaryti su visais parametrais)

j = 1…m

Šių normalinių lygčių sistemos sprendinys yra parametrų vektorius A

A = (vTv)-1vTQ, kur , Q – priklausomojo dydžio Q stebėjimo vektorius , matrica v – nepriklausomųjų kintamųjų matrica , kur stebėjimai yra išdėstomi stulpeliais.

Tarkime, kad norime įvertinti tiesinės funkcijos (2) parametrus, šiuo atveju, kai mes ruošiame duomenis algoritmui, Q bus lygu Y, V atitiks x.

, tuomet parametrų įvertinimo vektorius A = (xTx)-1xTY

Tarkime, turime (3) funkciją. Tarkime, kad ši funkcija netiesinė parametrų atžvilgiu, todėl norint ją padaryti tiesine, ją logaritmuojame:

bnY = lna0 + a1lnx1 + … + anlnxn

Pasižymime, kad lny = Q, o vi = lnxi. Vadinasi sudarydami dydžių vektorius ir matricas į reikiamas vietas statome dydžius v ir Q. Tik tuomet

Po parametrų įvertinimo, pirmą parametrą antilogaritmuojame. Paimkime (5) modelį

Q = y;

v1 = x1

v2 = x21

v3 = x22

Įvesdami tokius pažymėjimus, mes veiksnį x22 pasižymime, kaip naują veiksnį ir gauname 3 veiksnių modelį. Visa kitą atliekame pagal tą pačią schemą.

Dauginės regresijos lygties ekonominė interpretacija

Tikslas – gauti analitinę informaciją. Taigi po modelio įvertinimo būtina atlikti interpretaciją. Interpretuojant modelį reikia atsižvelgti į analizuojamo proceso specifiką. Dauginės regresijos lygtis turi žymiai didesnes galimybes nei porinės. Bet kokiam regresijos modeliui interpretuoti gali būti naudojamos ir dalinės išvestinės ir elastingumo koeficientai.

1. Dalinės išvestinės

, visiems i, , visiems i.

Jos parodo kiek vnt. pasikeis rezultatinis kintamasis, veiksniui pakitus 1 vnt. ir esant visom kitom fiksuotoms sąlygoms.

Jei analizuojam tam tikrą gamybos modelį, t.y. produkcijos priklausomybę nuo jį apsprendžiančių veiksnių. Šiuo atveju dalinės išvestinės vadinamos ribiniais našumais ir parodo tam tikro gamybos veiksnio poveikį gamybos rezultatui. Jei analizuojam vartojimo modelį, dalinės išvestinės – ribinis vartojimas. Šiuo atveju ribiniai rodikliai pilnai atitinka fizikinę dalinės išvestinės prasmę, t.y. parodo rezultatinio kintamojo kitimo greitį priklausomai nuo tam tikro veiksnio.

Trūkumai:

1) siejamas tik rezultatinio ir vieno veiksnio kitimas, o visi kiti veiksniai – konstantos

2) šių rodiklių dydis priklauso nuo dimensijų, t.y. nuo matavimo vienetų, kuriais matuojami rodikliai

2. Tam, kad pašalinti paskutinį trūkumą, yra naudojami elastingumo koeficientai.

Elastingumo koeficientai parodo, kiek % pasikeis rezultatinis veiksnys, kai vienas iš veiksnių pasikeis 1 %, esant kitoms fiksuotoms sąlygoms.

Tarkime, kad gamybos procese šie rodikliai vadinami gamybos veiksnių elastingumo rodikliais.

– veiksnio ribinis našumas, – veiksnio vidutinis našumas.

Vadinasi, gamybos proceso ekonominiuose modeliuose kiekvieno veiksnio elastingumo koeficientas yra jo ribinio našumo ir jo vidutinio našumo santykis. Kadangi čia elastingumo koeficientai turi vienodus matavimo vienetus (%), galime rasti bendrą veiksnių elastingumą. , kuris lygus dalini7 elastingum7 sumai, ir kuris parodo kiek % pasikeis rezultatinis rodiklis, visiems veiksniams pasikeitus po 1 %.

Gamybos proceso ekonometriniuose modeliuose ši charakteristika parodo efektą dėl gamybos masto pasikeitimo. Šio rodiklio pagrindu galima analizuoti gamybos koncentracijos įtaką gamybos rezultatams. Reikia pažymėti, kad šis rodiklis lygus funkcijos homogeniškumo laipsniui.

Funkcijos F(x1, x2) pakeičiam kiekvieną iš veiksnių l kartų: F(lx1, lx2). Jei F(lx1, lx2) = l F(x1, x2) =lY, tai turime 1 laipsnio homogeninę lygtį. Tačiau tai nėra reali ekonominė prielaida.

Turime g laipsnio homogeninė funkciją F(lx1, lx2) =lg F(x1, x2). Tarkime g>1. Vadinasi pakeitus gamybos resursus l kartų, y pasikeičia mažiau. Jeigu l<1, t.y. gamybos resursai auga, ir tegu g>1, t.y. augant resursams, gamybos rezultatas pasikeičia daugiau nei gamybos veiksniai, t.y. turime teigiamą koncentracijos įtaką ir ekonominei teorijoje tai vadiname augančiu efektu dėl gamybos masto.

Jei g<1 turime neigiamą efektą dėl gamybos masto.

Dauginės regresijos lygtyje atsiranda tam tikros galimybės analizuoti veiksnių patikimumą. Resursų pakeičiamumui tirti naudojame ribinių rodiklių santykius, t.y. dalinių išvestinių santykius. Jų pagrindu yra skaičiuojama ribinė pakeičiamumo norma arba ribinė substitucijos norma.

, y – pastovus

Jei norime analizuoti veiksnių pakeičiamumą, y turi būti pastovus. Ribinė pakeitimo norma parodo, kiek vienetų tam tikro veiksnio gali pakeisti 1 papildomas vienetas kito veiksnio esant pastoviam rezultatiniam rodikliui.

Visi šie rodikliai yra nelabai geri, nes fiksuoja visas sąlygas, išskyrus dvi, t.y. visos kitos sąlygos nekinta. Ekonominei interpretacijai dažnai yra vartojami aproksimaciniai metodai, kurių pavyzdys – pilno diferencialo aproksimacijos metodai.

VII paskaita (00 04 03 Siga)

Ekonometrinėje literatūroje naudojami įvairūs aproksimacijos metodai, kurie leidžia sušvelninti rodiklių interpretacijos trūkumus y = f(x1, x2, a1, a2) + u

Tegu mes nagrinėjame dinaminį procesą. Turime 2 periodus 0-t1ir t1-t2.

Pereinant iš I laikotarpio į II laikotarpį, y įgauna pokytį Dy, x1®D x1, x2® Dx2. Aišku, jog per t1®t2 laikotarpį tam tikru mastu pasikeičia ir rodiklių tarpusavio sąveika, t.y. lygties parametrai a1 ir a2. Jeigu funkcija turi dalines išvestines ne tik tam tikrame taške, bet ir jo aplinkoje, tai funkcijos pilnas diferencialas yra

Jį galima aproksimuoti diskretinių pokyčių verte y, x1, x2, a1, a2. Pagal pilno diferencialo apibrėžimą žinome, kad aproksimacija bus tuo tikslesnė, kuo pokyčiai bus mažesni.

– y pokyčio dalis dėl kintamojo x1 bendrojo pasikeitimo.

– Dx

– ribinis našumas

– fizinės apimties pasikeitimas padaugintas iš našumo

* – efektas dėl gamybos masto

Reikia aproksimuoti dalines išvestines.

Daugialypės regresijos lygties sudarymo technika

Grįžtant prie apibendrinto tiesinio pavidalo, tokių lygčių galima sukonstruoti begalybę. Kaip pasirinkti konkrečią lygtį? Daugialypės regresijos lygties pasirinkimas reiškia tam tikros teorinės hipotezės dėl ryšių tarp kintamųjų iškėlimą ir praktinį tos hipotezės patvirtinimą/atmetimą. Jeigu turime informaciją dėl ryšių formos, galime įsivaizduoti ryšio formą tarp analizuojamų rodiklių. Iškeliame teorinę hipotezę, po teorinio samprotavimo reikia praktiškai įsitikinti. Bet dažnai nepakanka žinių. Todėl daugialypės lygties konstravime yra daug metodų. Visus juos galima išskirstyti į 2 grupes:

1. Viena remiasi tam tikrų populiariausių regresijos lygčių sąrašo sudarymu. Po to seka tų lygčių parametrų įvertinimas, statistinės interpretacijos rodiklių apskaičiavimas ir vieno ar kelių konkrečių rodiklių pasirinkimas.

2. Antra grupė remiasi funkcijų generatoriaus idėja.

Kiekvienoje metodų grupėje būtina turėti lygčių įvertinimo algoritmą ir statistinės interpretacijos charakteristikų apskaičiavimo algoritmą.

I grupė. Gan plati ekonometrinių tyrimų patirtis regresinio modelio pagrindu suformavo tam tikrą funkcijų, kurios tiktų labai įvairiems uždaviniams spręsti ir kurios turi pakankamai geras aprašomasias savybes, sąrašą. Tas sąrašas gali būti įvairus.

I sąrašas.

tai bazinės funkcijos. Numetus sandaugas ir sumas nuo bazinių funkcijų gaunamos vieno veiksnio funkcijos:

II sąrašas. Jam priklausančiose funkcijose parametrai (ai ir ci) yra prie antrojo nario.

tai yra bazinės funkcijos, labai priimtos ir populiarios.

III sąrašas. Specialios funkcijos. Jų bendras bruožas – jos tinka procesams, kuriems būdingas prisisotinimo taškas/asimptotė. Elgiasi panašiai kaip logistinė funkcija.

* norint įvertinti jų parametrus jų logaritmavimą. K2 – gaunasi logaritminė.

IV sąrašas. Kombinuotos funkcijos, kurias sudarant dažniausiai derinamos tiesinės, logaritminės, hiperbolinės ir logaritminės-hiperbolinės funkcijos. Pavyzdžiui, tiesinė + logaritminė funkcija. Dažniausiai naudojamos kombinuotos funkcijos:

Šiame sąraše esančios funkcijos turi daug galimybių. Ši grupė – labai lanksčių funkcijų, kurios įgalina aprašyti labai įvairius procesus.

Tarkime turime tam tikrą funkcijų sąrašą. Visos jame esančios funkcijos gali būti transformuotos į apibendrintą tiesinį pavidalą.

6 modelio pasirinkimui šiuo atveju patogu naudoti likutinę dispersiją arba daugialypės determinacijos koeficientą (indeksą) ir tas modelis, kuris turi mažiausią likutinę dispersiją (didžiausią determinacijos koeficientą) laikomas statistiškai geriausiu. Tačiau ne visada reiškia, jog pasirinkome geriausią modelį. Todėl statistinio modelio įvertinimas visada turi būti ekonomine interpretacija, kurios metu įsitikinama, kad gauti modelio parametrai ir jų pagrindu apskaičiuotos charakteristikos yra logiškai nepriekaištingi.

II grupė. Funkcijų generatorius.tegu turime rezultatinį kintamąjį y ir tam tikrų veiksnių skaičių x1, …,xn. Šiuo atveju naudojami 2 metodai:

ü Skaičiuojamos porinės priklausomybės ü Nustatoma ryšio forma

Gautas formas sustatome į daugialypės regresijos lygtį, kurią vertiname iš naujo.

I-ame metodo etape apskaičiuojamos įvairios porinės priklausomybės tarp y ir xi.

y = fl(xi) l reiškia, kad naudojam keletą porinių priklausomybių. Iš tų porinių priklausomybių pasirenkame y = f*(xi) su visomis i. Tarkime I veiksniui labiausiai tinka lnx1, II veiksniui – 1/x2, III – x3. Kiekvienam iš veiksnių galima nustatyti sąveikavimo su y geriausią formą. Daugialypėje regresinėje lygtyje išlieka panašus veiksnių ir y ryšys. Šiuo atveju gauna tokia daugialypė lygtis:

y = a0 + a1lnx1 + a2/x2 + a3x3.

Funkcijų generatoriaus trūkumai:

1. Šis metodas reikalauja daug vargo

2. Negalima įsikišti į patį procesą.

Daugialypės regresijos lygties pasirinkimui esminės įtakos turi modelio statistinė interpretacija.

Daugialypės regresijos lygties statistinė interpretacija

Statistinei interpretacijai gali būti naudojami šie rodikliai:

1. Lygties likutinė dispersija

Lygties standartinė paklaida

Santykinė standartinė paklaida

2. Daugialypės determinacijos koeficientas (indeksas)

Daugialypės koreliacijos koeficientas (indeksas)

3. Porinės koreliacijos koeficientai (indeksai)

Porinės determinacijos koeficientai

4. Grynosios (dalinės) koreliacijos koeficientai

Grynosios (dalinės) determinacijos koeficientai

5. Fišerio santykiai (žr. temą “Reikšminių veiksnių atrinkimai”)

Parametro patikimumo intervalai ir jų standartinės paklaidos (žr. ten pat)

6. Lygties likutinių dydžių autokoreliacijos rodikliai (žr. temą “Paklaidų autokoreliacija”)

Lygties likutinė dispersija

Standartinė lygties paklaida = . Santykinė standartinė paklaida =

Visi šie rodikliai priklauso nuo kintamojo y matavimo vieneto ir mastelio, todėl gali būti naudojami tik modelių tarpusavio palyginimui ir geriausio modelio pasirinkimui.

Daugialypės determinacijos koeficientas

Jo reikšmės svyruoja intervale [0,1]. D rodo kokią dalį (%) rezultatinio kintamojo y variacijos (išsibarstymo) apsprendžia veiksnių x1, …,xn variacija (išsibarstymas). Tarkime D = 0.6, tai reiškia, kad 60 % priklausomojo dydžio variacijos apsprendžia veiksnių (kintamųjų) variacija. Likusią dalį apsprendžia neįtraukti veiksniai.

Daugialypės koreliacijos koeficientas

R = ÖD. Ir R, ir D yra teigiami ir svyruoja [0,1].

Pastaba. Esant tiesinei lygčiai, naudojamas pavadinime koeficientas, o jei ne – indeksas

Jei s2lik > s2y, tai D yra neigiamas. Praktiškai reiškia, kad modelis yra žymiai geresnis už mūsų daugialypės regresijos lygtį. Modelis netinkamas, tai reiškia negauname R. Jeigu D neigiamas, reikia naujo modelio.

Porinės koreliacijos koeficientai

Šiuo atveju y veikia tik vienas veiksnys. Porinio tiesinio ryšio atveju porinės koreliacijos koeficientas yra lygus: . Netiesinio ryšio atveju tai porinės koreliacijos koeficientas skaičiuojamas analogiškai kaip ir daugialypės koreliacijos koeficientas, tik reikia atsiminti, jog skaičiuojant slik turime tik vieną veiksnį.

Grynosios (dalinės) koreliacijos, determinacijos koeficientai

Jei ryšys tiesinis, tai koeficientas, jei ryšys netiesinis – indeksas. Šie koeficientai rodo, koks yra veiksnio i poveikis rezultatiniam kintamajam, kai šalia jo rezultatinį kintamąjį veikia ir kiti veiksniai (poveikis veiksnių komplekte). Tarkime turime modelį Q = a0 + a1v1 + a2v2 + …+anvn ir norime rasti I-tojo veiksnio grynosios koreliacijos koeficientą. Įvertiname modelio (6) parametrus ir randame slik2 = s2y.1,2,3,…n visam modeliui. Iš modelio pašaliname v1: Q`= a0 + a2v2 + …+anvn. Įvertiname šio modelio parametrus ir apskaičiuojame s`lik2 = s2y.2,3,…n.

– grynosios koreliacijos koeficientas. Šis rodiklis iš esmės yra teigiamas.

dy.1,2,…n = r2y.1,2,3,…n – grynosios determinacijos koeficientas, kuris parodo kiek % y variacijos apsprendžia veiksnio i variacija, kai šalia y veikia ir kiti veiksniai.

Pastaba. Nustatant koeficientų ženklą, imama dalinė išvestinė dQ pagal dvi ir jos ženklas yra suteikiamas grynosios koreliacijos koeficiento dydžiui.taigi potencialiai r ir d rodikliai gali kisti [-1,1] ribose.

Bendra koeficientų apskaičiavimo schema tokia: imamas visas modelis ir apskaičiuojamas jo slik2, sudaromas modelis be to veiksnio, kurio grynosios koreliacijos koeficientą norime apskaičiuoti ir randama nauja slik2 ir apskaičiuojamas ry.1,2,3…n.

VIII paskaita(00 04 10 Siga)

Duomenų standartizavimas. Modelio parametrų įvertinimas bei porinės koreliacijos koeficientų apskaičiavimas, esant standartizuotiems kintamiesiems

Q = a0 + a1v1 + a2v2 + … + anvn (6)

(6) atvejis yra tiesinė lygtis: y = a0 + a1x1 + a2x2 + … + anxn. (2)

Modelio dalinės išvestinės parodo, kiek vienetų pasikeis rezultatinis kintamasis, kai 1 iš veiksnių pasikeis 1 vienetu, esant ceteris paribus. Tarkime, kad analizuojame sekantį tarpsnį. Gamybos apimčių priklausomybę nuo pagrindinio kapitalo sąnaudų, užimtųjų skaičiaus, elektros energijos sąnaudų ir, tarkime, technologinio vandens.

Įvertinus tokio modelio parametrus teisinės lygties pagrindu, dalinės išvestinės pagal kiekvieną kintamąjį bus lygios atitinkamiems parametrams ai prie kintamųjų.

Koeficientas ai parodo, kiek 1 vienetu atitinkamo veiksnio pasikeitimas duoda gamybos rezultatų pasikeitimą. ai = 0.6, tai reiškia, kad jei kapitalas matuojamas mln. Lt, produkcija taip pat mln. Lt, tai 1 mln. Lt kapitalo prieaugio duos 0.6 mln. Lt produkcijos prieaugio. Tarkime a4 – technologinio vandens sąnaudos (tūkst. m3) yra 1.2. Pasikeitus 1 tūkst. m3, produkcijos išauga 1.2 mln. Lt.

ai taip pat veikia ne tik matavimo vienetai, bet ir duomenų mastelis. Tai yra viena iš (6) modelio silpnybių. Daugialypės regresijos lygtims vertinti naudojamas mažiausių kvadratų metodas, kurio pagalba gaunamas sprendinys, parametro vektorius a.

A = (VTV)-1VTQ (7)

Norint apskaičiuoti atvirkštinę matricą, reikia apskaičiuoti matricos determinantą. Turime labai didelius matavimo duomenis (labai mažus), atsiranda pavojus gauti mašininį papildymą arba eilės išnykimą, kai skaičiai pasidaro ypač maži.

Tam, kad išvengti matavimo, skaičiavimo problemų, naudojami standartizuoti kintamieji, t.y. vietoje modelio (6) yra naudojamas modelis (8):

ZQ = b1ZV1 + b2ZV2 + …bnZVn (8)

ZQ – priklausomojo kintamojo standartizuotų reikšmių vektorius.

ZVi – veiksnio Vi standartizuotų reikšmių vektorius.

bi – (i – 1, 2, …n) modelio parametrai, kuriuos reikia įvertinti ir kurie statistinėje ir ekonometrinėje literatūroje vadinami b koeficientais.

Duomenų standartizavimas atliekamas tokiu būdu:

visiems indeksams i ir visiems indeksams j. Čia SVi – šio veiksnio vidutinis kvadratinis nuokrypis.

visiems indeksams j.

Šie standartizuoti duomenys turi tokias savybes:

1. Matematinė viltis M(Z) = 0

2. Dispersija sZ = 1

Iš standartizuotų veiksnių vektorių sudaroma matrica Z, kurioje duomenys išdėstyti stulpeliais, ir vektorius-stulpelis ZQ, kuriame yra išdėstytos standartizuotos dydžio Q reikšmės. Standartiniai dydžiai kinta intervale [-5,5]. Modelio (8) parametrų įvertinimas atliekamas pagal schemą (9):

Šios schemos pagalba gauname b koeficientus, kurie nepriklauso nuo matavimo vienetų, ir, kaip tarpinį rezultatą, visus įmanomus porinės koreliacijos koeficientus. Koeficientai b gali būti tarpusavyje palyginami ir iš jų dydžio galima spręsti, kuris iš veiksnių stipriau veikia rezultatinį kintamąjį.

Modelyje (8) neturime laisvojo nario. Apskaičiavus (8) parametrus b, būtina pereiti atgal prie modelio (6) parametrų. Tai vykdoma šių formulių pagalba:

Matrica KV turi šias savybes:

1. Ji yra kvadratinė (kiek stulpelių tiek, ir eilučių)

2. Stulpelių ir eilučių skaičius atitinka veiksnių skaičių

3. Šios matricos pagrindinėje įstrižainėje yra 1, tai reiškia, kad koreliacijos koeficientas su savimi palyginus yra = 1).

4. Matrica yra simetrinė, pagrindinės įstrižainės atžvilgiu, t.y. rKL yra lygus rLK. Analizuojant šią matricą, pakanka apsiriboti jos segmentu.

Gali būti 2 ekstremalūs šios matricos atvejai:

1) Tai reiškia, kad į modelį įtraukti veiksniai yra pilnai tarpusavyje nepriklausomi ir jie vadinami ortogonaliais.

Viena iš pagrindinių korektiško regresijos ryšio prielaidų yra tai, kad veiksniai yra tiesiškai nepriklausomi, t.y. ortogonalūs.

2) Visi veiksniai pilnai tiesiškai priklausomi vienas nuo kito

Visi tarpiniai variantai duoda tam tikrą determinanto reikšmę tarp 0 ir 1.

Pavyzdys. ZQ = b1ZV1 + b2ZV2 (10)

Veiksniai v1 ir v2 yra ortogonalūs. iš schemos (9) .

Idealiu atveju, kai veiksniai yra ortogonalūs, koeficientai b sutampa su porinės koreliacijos koeficientais tarp y ir vi. Kitas atvejis: v1 ir v2 tarpusavyje koreliuoja. Tada:

b1-r1 ir b2-r2 dydžiai priklauso nuo porinės koreliacijos koeficiento r1. Kuo didesnis šis koeficientas, tuo nuokrypiai didesni.

Veiksnių tarpusavio priklausomybės problema yra viena iš ….. regresinės analizės pasekmių.

Veiksnių interkoreliacijos (multikolinearumo) problema ir jos sprendimo metodai

Interkoreliacijos sąvoka, jos priežastys ir pasekmės

Vartojami 3 terminai: interkoreliacija, kolinearumas (tarp 2 veiksnių), multikolinearumas (tarp daugiau nei 2 veiksnių).

Interkoreliacijos priežastys įvairios. Viena jų – veiksniai turi panašiais arba artimas kitimo tendencijas. Yra aktuali dinaminių procesų nagrinėjime. Kai naudojam teritorines atrankas, interkolinearumą gali iššaukti bendros globalinės priežastys, apsprendžiančios pačių veiksnių vystymąsi, arba problemos. Pavyzdžiui, prekybos apimtis tenkanti 1 m2 projektinio ploto nuo gyventojų skaičiaus ir bendros prekybos ploto apimties. Pilnai realu, kad bendras prekybos plotas gali koreliuoti su bendru gyventojų skaičiumi.

Interkoreliacija yra daugiau duomenų problema, o ne modelio specifikacijos. Kita šios problemos pusė susijusi su tam tikrų parametrų vertinimu, t.y. skaičiavimo procesu ir gautų rezultatų ekonomine interpretacija. Svarbiausia interkoreliacijos pasekmė yra gautų parametrų įvertinimų nepatikimumas (jei nepatikimi, tai kam interpretuoti).

Tarkime turime modelį:

yi = b1 + b2 x2j + b3x3j + uj (11)

x3j = ax2j (12)

Iš (12) seka, kad x3j suteikia tą pačią informaciją kaip ir x2j tam tikro daugiklio tikslumu. Reikia įvertinti modelį:

yj = γ1 + γ2x2j (13)

γ2 – parodytų abiejų veiksnių x2j ir x3j sumarinį poveikį.

Statome (12) į (11):

yi = b1 + (b2 + ab3)x2j + uj (14)

Iš čia yj = γ1 + γ2x2j + uj (15)

γ1 = b1, γ2 = b2 + ab2 (16)

b = (b1, b2, b3)T = (XT.X)-1XTY

Esant grynai interkoreliacijai normalinė lygčių sistema neturi vienintelio sprendinio.

Tarkime, kad įvertinome modelio (15) parametrus. Parametras γ2 parodys sumarinį abiejų veiksnių poveikį. Žinodami γ2 ir teisinės priklausomybės parametrą a (žr. 16) negalime nieko pasakyti apie parametrų b2 ir b3. Galime parinkti b2 ir b3 kombinacijas. Tegu mes neturime grynos interkoreliacijos atvejo. Tada normalinių lygčių sistema turės vienintelį sprendinį.

Aukštas koreliacinės atsakomybės tarp veiksnių atvejis – dažniausiai pasitaikantis ekonominiuose tyrimuose. Aukšta koreliacinė priklausomybę nevirsta funkcija. Skaitoma, kad interkoreliacijos nėra, kai porinės koreliacijos koeficientas neviršija 0.8. Tai labai stiprios tarpusavio koreliacinės priklausomybės žemutinė riba.

Jeigu koreliacinėje matricoje KV yra elementų, viršijančių šį dydį, tai ir esant labai aukštam daugialypės koreliacijos koeficientui, gauti parametrų įvertinimai yra statistiškai nepatikimi.

Kiekvienas ekonominis rodiklis yra matuojamas su t.t. paklaidom. Šiuo atveju normalinių lygčių sistema gali turėti vienintelį sprendinį, bet jo dydį apsprendžia ne ryšiai tarp kintamųjų, o ryšiai tarp jų matavimo klaidų.

Modelis (11) ir jo kiekvieno parametro paklaida:

cii – matricos KV-1 pagrindinės įstrižainės elementas (rodo įstrižainės indeksą)

Kuo didesnis r1,2 , tuo didesnė atitinkamo parametro standartinė paklaida, t.y. tuo labiau šis parametras yra statistiškai nepatikimas.

IX paskaita (00 04 17 Jurga)

Gsdfgsasdkfjhsajkdshfaksdjfhjakjdshf

Ų Modelio parametrai iš esmės keičiasi tada, kai arba stebėjimo duomenys transformuojami, arba panaudojami papildomi duomenys.

Ų Modelio parametrų įvertinimui prie tam tikrų veiksnių įgauna nelogiškus, nepagrįstus realia, laukiama situacija ženklus.

Ų Modelio parametrai prie esminių veiksnių turi l. dideles standartines paklaidas, kurios l. dažnai viršija patį parametrą

Porinė koreliacijos koeficiento panaudojimas multikolinearumo analizei ir eliminavimui

Yra naudojami visi įmanomi porinės koreliacijos koeficientai (žr. duomenų standartizacija). Visi porinės koreliacijos elementai gali būti išdalinti į Kv ir KQ. Šie 2 matriciniai dariniai gali būti apskaičiuojami įvairiais būdais tačiau rekomenduotina juos apskaičiuoti pagal 9 schemą.

Kadangi 9 schemos naudojimo rezultate gauname informacija apie z ir hjh

Ši matrica yra simetrinė pagrindinės įstrižainės atžvilgiu ir todėl analizuojamas tik trikampis segmentas arba po arba virš įstrižainės

Tam, kad eliminuoti multikolinearumą šiuo būdu, naudojamas sekantis algoritmas. Laisvai pasirenkama rkritinė=0,8. Kadangi koreliacijos koeficientai rkl gali būti tiek neigiami, teik teigiami, tolesnei analizei naudojami absoliutiniai dydžiai arba moduliai. Randame rkl = max |rkl| (didžiausią dydį savo moduliu). Jei rkl³ rkrit.. sakoma, kad veiksniai vk ir vl yra koreliuoti, vadinasi jų suteikiama informacija informaciniu požiūriu viena kitą dubliuoja, todėl vieną iš jų reikėtų eliminuoti iš modelio. Iš principo būtų galimą eliminuoti abi, tačiau paprastai išmetamas tas, kuris mažiau veikia rezultatinį rodiklį.

Analizuojant vektorių rkq, kur rk ir rl randami porinės koreliacijos koeficientai, jei rk>rl, iš modelio eliminuojamas veiksnys vl.

Kai kada rekomenduojama naudoti vadinamą griežtą taisyklą. Jos esmė – tai, kad jeigu porinės koreliacijos koeficientas tarp veiksnių aukštesnis nei šių veiksnių porinės koreliacijos koeficientai su rezultatiniu kintamuoju, tai išmetami iš modelio abu veiksniai. Tai tikrai griežta taisyklė.

Tarkime, išmetame veiksnį vl. Iš matricos Kv reikia išbraukti l-tąją eilutę ir l-tąjį stulpelį, o iš vektoriaus KQ elementą rl, iš matricos Z (standartinės duomenų reikšmės) išbraukti stulpelį l, tam kad veiksnio eliminavimas visur atsispindėtų..

Po to vėl ieškomas matricos Kv elementas, jei jis > rkrit., algoritmas kartojamas taip, kaip jau buvo aprašytas. Jei jis < už rkrit., procesas baigiasi.

Kv determinantas įgauna reikšmes nuo 0 iki1 priklausomai nuo veiksnių interkoreliacijos lygio. Kuo veiksniai labiau koreliuoti, tuo determinanto reikšmė artimesnė 0. Vadinasi iš pricipo determinantas Kv yra tam tikra skaitinių reikšmių multikolinearumo charakteristika. Šiuo pastebėjimu remiasi 2 autorių Farrar ir Slauber metodas interkoreliacijai tirti.

Šie autoriai nustatė, kad charakteristika asimptotiškai pasiskirsčiusi pagal χ2 dėsnį, esant g laisvės laipsnių skaičiui.

g = 1/2q(q-1) esant reikšmingumo lygmeniui a. Ši charakteristika apskaičiuojama turint det Kv. Iš χ2 pasiskirstymo lentelės randam χ2a su g laisvės laipsnių. Tikrinama H0, kuri teigia, kad veiksniai yra tiesiškai nepriklausomi (ortodonalūs).

H1 – veiksniai ne ortodonalūs. Tuomet jei χ2 > χ2a, tuomet H0 atmetama, t.y. priimama H1.

Jei χ2 £ χ2a atmetama H1, priimama H0, t.y. veiksniai ortodonalūs. Šio metodo kritikai pažymi, kad pagal šį metodą taip pat vartojami tik porinės koreliacijos koeficientai ir naudojant šį metodą negauname informacijos apie tai, kurie veiksniai konkrečiai yra koreliuoti ir kokie ryšiai tarp jų yra pagrįsti.

Apibendrinant reikia pasakyti, kad aukštos porinės koreliacijos reikšmės, viršijančios kritinę, vienareikšmiai liudija, kad yra interkoreliacija tarp veiksnių, tačiau atvirkštinis teiginys negalioja, nes labai dažnai esant aukštiems porinės koreliacijos koeficientams, iš kitos pusės ir aukštam daugialypės koreliacijos koeficientui, susiduriama su kitokia interkoreliacija. T.y. tarp veiksnių yra ne tik porinės koreliacijos ryšys, bet ir daugialypės koreliacijos ryšiai, taigi turime firminį multikolinearumo reiškinį.

Daugialypės koreliacijos koeficiento panaudojimas multikolinearumo tyrimo galimybėms

Tegu modelyje yra 4 veiksniai v1, v2, v3 ir v4 ir sudarome 4 priklausomybes kiekvieno veiksnio nuo visų likusių v1 = c01 + c21v2 + c31v3 + c41v4

v2 = c02 + c12v1 + c32v3 + c42v4

v3 = c03 + c13v1 + c23v2 + c43v4

v4 = c04 + c14v1 + c24v2 + c34v3

Taigi sudarius šios daugialypės regresijos lygtis yra įvertinami visi parametrai, apskaičiuojamos kiekvienoje lygtyje teorinės vi reikšmės, tarkime . Kiekvienai lygčiai apskaičiuojami si2 ir slig.i2, po to apskaičiuojame daugialypės determinacijos koeficientą (Di) lygčiai i, kuris lygus Ri2. Jo pagrindu apskaičiuojamas VIF (Variance Inflation Factor),

, kur cii apibrėžtinis Kv matricos pagrindinės įstrižainės elementas su indeksu ii. Jeigu tam tikras veiksnys yra stipriai koreliuojantis su kitais, t.y. Ri2 yra artimas 1, tai VIF įgauna labai didleles reikšmes. Jeigu veiksnys yra ortodonalus kitų atžvilgiu, t.y. Ri2 artimas 0, tai VIF praktiškai taip pat lygus 1. Taigi pagal šį VIFi rodiklį galima nustatyti veiksnių ortodonalumą visų kitų veiksnių atžvilgiu. Laikoma, kad turime esminę interkoreliaciją, kai VIFi > 10.

Tegu mes įvertinome modelio (6) arba (8) arba parametrus aI arba parametrus bi. Šių parametrų standartinės paklaidos yra tiesiai proporcingos modelio likutinės dispersijos dydžiui, o proporcingumo konstanta yra atitinkamas rodiklis VIFi.

Tam, kad įvertinti visų parametrų nuokrypį (parametrai gauti MKM metodu) nuo tikrųjų parametrų reikšmių (kai veiksniai ortodonalūs), naudojamas tam tikras nuokrypio kvadrato rodiklis .

Taigi šis L2 parodo, kiek gauti parametrai nukrypsta nuo realių, kurie iš tikrųjų turėtų būti esant ortodonaliems veiksniams L2=nSlik2.

Lygindami realią situaciją, kuri susidaro ryšium su interkoreliacija ir pilną veiksnių ortodonalumo situaciją galime rasti santykį Ml, kuris taip pat parodo bendrą visų veiksnių interkoliacijos pokytį.

Daugialypės koreliacijos koeficientų naudojimas ne kiek neprieštarautų porinės koreliacijos koeficientų naudojimui ir jų apjungimas duoda visų įmanomų interkoreliacinių priklausomybių metodą.

Tegu turime 4 veiksnius v1, v2, v3 ir v4 ir kiekvienam iš veiksnių sudarome visas įmanomas priklausomybes nuo kitų veiksnių. Pvz. veiksniui v1:

v1 = f(v2); v1 = f(v3); v1 = f(v4);

v1 = f(v2, v3); v1 = f(v2, v4); v1 = f(v3, v4);

v1 = f(v2, v3, v4)

Kiekvienam veiksniui sudarome po 7 priklausomybes, kurių iš viso gaunasi 28. Po kiekvienos iš šių lygčių parametrų įvertinimo porinėms priklausomybėms randame porinės koreliacijos koeficientus, likutines dispersijas, determinacijos koeficientus. Daugialypėms priklausomybėms apskaičiuojame daugialypės koreliacijos koeficientus, charakteristikas VIF ir ML, po to visus rezultatus surašome į analizei patogias lenteles. Analizuojant tokias lenteles galima gana nesunkiai pastebėti kokios veiksnių kombinacijos yra ‘kritinės’ interkoreliacijos atžvilgiu.

Šis metodas iš tiesų duoda pilną informaciją apie veiksnių multikolinearumą, tačiau tai iš tiesų nelabai imlus darbui metodas. Kai kada, ypač kai veiksnių skaičius didesnis už 4, šio darbo sąnaudos skaičiuojant ir analizuojant pasidaro per didelės.

Veiksnių interkoreliacijos eliminavimo arba sušvelninimo būdai

Interkoreliacija – informacijos problema ir MKM panaudojimo ir rezultatų interpretacijos problema. Vienas iš jos sprendimo būdų – tai yra tam tikro veiksnio (kelių veiksnių) eliminavimas iš modelio. Kiti būdai yra susiję su papildomos informacijos apie tiriamą reiškinį gavimu arba jau turimos informacijos tam tikra transformacija.

Renkant papildomą informaciją galvojama, kad tiktai turimi stebėjimai iššaukia interkoreliaciją ir jeigu mes turėtume papildomus stebėjimus, realu, kad šios papildomos interkoreliacijos nebūtų. T.y. reikia surinkti papildomą informaciją. Tačiau jis gali būti pakankamai komplikuotas tiek darbo sąnaudų, tiek organizavimo prasme.

Be to, gana dažnai net ir papildomos informacijos surinkimas gali nepateisinti informacijos lūkesčių. Vienas iš pagrindinių ir pigiausių interkoreliacijos įveikimo būdų yra tam tikrų transformacijų atlikimas. Labai veiksmingas gali būti vietoj absoliučių reikšmių Qj (j = 1, 2, …, m); vij (j = 1, 2, …, m, i = 1, 2, …, r), skirtuminių dydžių formulavimas:

Absoliutus prieaugis Qj+1 – Qj; vij+1 – vij

Santykinis prieaugis ;

Tačiau tokių skirtuminių dydžių nagrinėjimas yra vertinamas dvejopa prasme. Pastebėsime, kad I eilės skirtuminių dydžių panaudojimas praktiškai eliminuoja iš dinaminių eilučių tiesinę tendenciją.

Kitas dalykas – skirtuminių dydžių panaudojimas vietoj absoliučių dydžių suteikia analizuojamiems procesams daugiau stochastinių savybių.

Interkoreliacija labai trukdo MKM realizacijai.

Dar viena interkoreliacijos neigiamo pobūdžio eliminavimo arba bent jau sušvelninimo metodų grupė remiasi alternatyvių parametrų įvertinimo metodais (kurie vartojami vietoj MKM), tarp jų išskirtini pagrindinių komponenčių regresija, RYGE regresija ir netiesinio įvertinimo metodas.

Naudojant pagrindinių komponenčių regresiją yra atliekami veiksnių perdirbimai, kurie duoda veiksnių matricos ortogo, t.y. pradiniai veiksniai yra pakeičiami pagrindinėmis komponentėmis tam tikslui vartojant pradinių duomenų matricas, nuosavas reikšmes.

X paskaita (00 05 01 Siga)

Ridge regresija

Iteracinis procesas, kaip sprendimas, gaunamas žingsnis po žingsnio, kai varijuojant vienu specifiniu parametru gaunami robust įvertinimai, kurie pasižymi žymiai stabilesne elgsena keičiantis pradiniams duomenims. Grįžtant prie tam tikrų veiksnių eliminavimo reikia pastebėti, kad bet koks veiksnių pašalinimas iš modelio vis gi veikia to modelio formą ir jo turiningumo laipsnį. Makro ekonominiuose tyrimuose, kur tarp veiksnių labai dažnai pasireiškia esminė interkoreliacija, kaip taisyklė, modelyje turi būti nedaug veiksnių (2-3), todėl vieno iš jų pašalinimas iš modelio yra labai nepageidautinas.

Netiesinio įvertinimo metodai

Ekonometrinių tyrimų praktikoje šiuo atveju taikomi netiesinio parametrų įvertinimo metodai, kurie gali būti pritaikyti negrynai interkoreliacijai ir apibendrintam tiesiniui modeliui įvertinti. Šie metodai realizuoja netiesinio programavimo uždavinių sprendimą leistinoje parametrų kitimo erdvėje. Jie taip pat yra realizuojami kaip iteracinės procedūros. Kitaip tariant užsidavus pradinį vektorių, kiekviename žingsnyje gaunamas kitų parametrų vektorius, užtikrinantis funkcijos kriterijaus sumažėjimą. Kadangi procesas yra interacinis, kintamųjų interkoreliacija šiuo atveju gali veikti parametrų įvertinimą, paieškos kryptį, pats procesas gali būti neefektyvus, bet ta interkoreliacija neveikia sprendinio dydžio ir formos.

Yra dar vienas metodas, kurio esmė – dinaminių procesų analizės ir momentinių teritorinių tyrimų derinimas. Esmė tame, kad esant tampriai koreliacijai tarp veiksnių (tai labai dažnas reiškinys dinaminiuose procesuose), tam tikrų parametrų įvertinimai gaunami ne šitame, o kitame modelyje. Formaliai tai galiam užrašyti taip: Yy = b1 + b2x2j + b3x3j + uj (čia x2j ir x3j yra esminiai koreliuoti). Todėl tam tikrų momentinių atrankinių tyrimų rezultate gauname iš priklausomybės Y= f(x3) įvertį . Taip gauname . Čia – užduotas naujas įvertis. Keičiasi ir atsitiktinė modelio komponentė iš uj ® u`j.

Pavyzdys. Tegu Yj yra tam tikros namų ūkių grupės išlaidos tam tikram produktui įsigyti.

j – (1, m),

X2j – šito produkto kainų dinaminė eilutė.

X3j – tam tikros namų ūkių grupės vidutinės pajamos.

Kainos ir pajamos dažnai yra tampriai koreliuotos. Todėl pasinaudodami tam tikrais momentiniais (tam tikro mėnesio, ketvirčio) duomenimis yra įvertinama porinė regresija tarp Y ir X3. po to įstačius į bazinį modelį, galima įvertinti parametrus b1 ir b2. Galima laukti, kad parametrų standartinės paklaidos šiuo atveju yra žymiai mažesnės nei tada, jeigu būtų vertinami bazinio modelio parametrai iš karto. Taip yra todėl, kad papildomos informacijos pagalba sugebėjome eliminuoti interkoreliaciją. Tačiau paklaidos gali atsirasti vertinant porinę priklausomybę atrankinių duomenų pagrindu. Ir tos paklaidos gali persiduoti parametrams b1 ir b2.

Viskas priklauso nuo to, ar yra dinamiškumas tarp dinaminio proceso duomenų ir atrankinių stebėjimų. Daug kas priklauso nuo atrankinių stebėjimų agregacijos laipsnio. Jei bazinio modelio pagrindu analizuojame vartojimo lygį visos šalies mastu, o atrankiniai tyrimai buvo atlikti namų ūkių pjūvyje, negalima tikėtis didelio proceso tikslumo. Bet jei atrankiniai stebėjimai buvo atlikti apskričių/rajonų pjūvyje, jie gali būti panaudoti visos šalies tyrimams, o taip tyrimams namų ūkių pjūvyje. Visgi ekonometrinio modeliavimo praktika pateisina šių 2 tyrimo rūšių derinimą, nes dažnai tai pasiteisina.

Yra dar vienas šio metodo modifikavimas. Šiuo atveju kaip žinomi dydžiai į bazinį modelį įtraukiami parametrų įvertinimai, kurie buvo gauti ankstesniuose tyrimuose, kitų tyrinėtojų atliktuose tyrimuose ar net kitų šalių analogiškų procesų parametrų įvertinimai. Tokiais metodais gauti parametrų įvertinimai vadinami robust įverčiai.

Reikšminių ekonometrinio modelio veiksnių atrinkimo problema ir jos sprendimo būdai

Bendriausi šios problemos sprendimo principai ir praktinės taisyklės

Ši problema aktuali bet kokiam ekonometriniam modeliui. Įtraukti į modelį visus įmanomus veiksnius ne tik neįmanoma, bet ir netikslinga, nes kai kurių jų poveikis gali būti labai silpnas. Sprendžiant šią problemą galimi 2 keliai:

1. Veiksnių kiekį ir jų sąrašą apibrėžia arba ekonominė teorija, arba konkretūs tyrimo tikslai.

2. Kai tiriamo proceso veiksnių sąrašas yra visiškai neaiškus ir jo tikslumas taip pat. Šiuo atveju nuo pat pradžių reikia naudotis visomis įmanomomis loginėmis ir matematinėmis priemonėmis. Galiam galvoti, kad modelio turiningumo laipsnis labai ženkliai priklauso nuo veiksnių skaičiaus. Tačiau jei įtrauksime daug veiksnių, gali būti 2 neigiamos pasekmės:

Ų Kai n (veiksnų skaičius) priartėja prie m (stebėjimų skaičiaus) labai sumažėja modelio laisvės laipsnių skaičius, o tai labai smarkiai išplečia pasikliautinus intervalus. Parametrų įvertinimai tampa nepatikimi. Kai n = m, ryšys tampa funkcija.

Ų Padidėjus veiksnių skaičiui taip pat labai padidina tikimybė atsirasti tarp jų multikolinearumui. Tai smarkiai veikia parametrų įvertinimo patikimumą.

Todėl trumpai šio proceso tikslą galima apibrėžti taip – reikia atrinkti nedidelį skaičių esminiai veikiantį rezultatinį rodiklį veiksnių, kuriems būdingas neaukštas multikolinearumo lygis.

Veiksnių sąrašo sudarymas visada pradedamas nuo tam tikros mokslinės/darbinės hipotezės suformulavimo. Šiame procese panaudojami visi įmanomi moksliniai šaltiniai, patyrimas ir specialistų apklausų rezultatai. Šiame etape suformuluojamas maksimalus veiksnių sąrašas. Tada turime įsitikinti ar šiems veiksniams galima gauti pakankamą kiekį statistiškai patikimų duomenų. Po informacinio etapo visada veiksnių skaičius sumažėja. Kai sumažėja, atliekama papildoma loginė analizė, siekiant išvengti melagingos koreliacijos. Taip gauname sumažintą veiksnių skaičių. Šiame procese laikomasi tokių taisyklių:

1. Turimų duomenų keikis (atrankos kiekis) labai smarkiai įtakoja potencialiai įmanomų veiksnių skaičių. Jei duomenų nedaug, tai ir veiksnių turi būti nedaug. Veiksnių ir duomenų kiekių santykis turi bent tenkinti minimalaus santykio reikalavimus (veiksnių sk. * 4(6 – optimaliausia) = duomenys)

2. Vieną veiksnį modelyje gali atspindėti tik vienas rodiklis. Iš alternatyvių atrenkamas tas, kuris labiau koreliuoja su rezultatiniu kintamuoju.

3. Jeigu naudojami dinamiką atspindintys rodikliai, tikslinga nustatyti jų dinamikos dėsningumus. Jei naudojami atrankos stebėjimai, tikslinga nustatyti jų pasiskirstymo dėsnį.

4. Į modelį negalima įtraukti vienu metu suminių rodiklių ir juos sudarančių dėmenų

5. Analizuojant veiksnių reikšmingumą, visada tikslinga įsitikinti ar nėra anomalijų, iškraipančių dinamiką ar veiksnių pasiskirstymą. Joms esant, būtina jas transformuoti.

Toliau veiksnių rūšiavimas į pagrindinius ir antraeilius vyksta tam tikro modelio rėmuose. Logiškai turėtume iš modelio išmesti tą veiksnį, kuris nemažina modelio likutinės dispersijos arba daro tai neženkliai. Šia nuostata remiasi visi formalūs matematiniai statistikos metodai, skirti šiai problemai spręsti. Kaip formalūs veiksnių atrinkimo kriterijai dažniausiai naudojami 2 – Stjudento t kriterijus ir F Fišerio-Snedakoro kriterijus.

Visi metodai remiasi arba laipsnišku veiksnių įtraukimu arba eliminavimu.

Visų įmanomų regresijų metodas

Daugelyje šaltinių sakoma, kad šis metodas gali būti pritaikytas tiek nekolineariems, tiek ir kolineariems veiksniams. Tačiau reikia taikyti jį po to, kai yra detaliai išnagrinėta veiksnių interkoreliacija ir reikalui esant iš modelio pašalintas 1 ar keli veiksniai, nes tai labai svariai sumažina skaičiavimų apimtį, kas šiam metodui labai aktualu. Tarkime mes naudosime modelį (6) arba tiesinę variaciją (2).

Q = a0 + a1v1 + a2v2 + …+anvn (6)

Y = a0 + a1x1 + a2x2 + …+anxn (2)

Visų įmanomų regresijų skaičius 2n (kai n = 6, regresijų skaičius 64). Visada į tą skaičių įeina lygtis y = y vidurkiui. Todėl eilėje mokslinių darbų (Šatanjė) siūloma tokia schema: sudaryti atskiras modelių subaibes. I subaibė – 1 kintamojo (porinės) priklausomybės, II subaibė – 2 kintamųjų priklausomybės ir t.t. Kiekvienoje subaibėje turime modelius su spec. kintamųjų skaičiumi. Taigi siūloma racionalizuoti šį procesą, sumažinant analizuojamų lygčių skaičių.

Iš kiekvienų modelių subaibės atrenkame geriausią, pasinaudojant arba likutinių dispersijų rodikliu, arba daugialypės determinacijos rodikliu. Taigi išrinkti geriausi subaibių modeliai toliau lyginami tarpusavyje ir išrenkamas totaliai geriausias. Tai racionalizuoja skaičiavimus ir apriboja duodamos informacijos kiekį. Bet dažnai sunku išrinkti geriausią modelį vienos subaibės rėmuose, nes jų charakteristikos gali skirtis labai nedaug.

Todėl be jau minėtų d ir s2lik charakteristikų reiktų naudoti ir kitas – interkoreliaciją, likutinių dydžių autokoreliaciją, apibrėžiančius dydžius. Išrenkant geriausią modelį būtina atlikti ir visų konkurencinių modelių galutinę ekonominę interpretaciją.

Pavyzdys. Tegu Y = f(x1, x2, x3, x4). Turime 24 = 16 lygčių.

I subaibė II subaibė III subaibė IV subaibė f(x1)f(x2)f(x3) ® R2 = 60 %f(x4) f(x1,x2)f(x1,x3) ® R2 = 83 %f(x1,x4)f(x2,x3)f(x2,x4)f(x3,x4) f(x1,x2,x3)f(x1,x2,x4) f(x1,x3,x4) ® R2 = 98 %f(x2,x3, x4) f(x1,x2,x3,x4) ® R2 = 98.25 %

f(x1,x3,x4) – geriausias modelis tarp subaibių, pilnos veiksnių koreliacijos galima ir neskaičiuoti (kai R2l – R2l-1 ≤ ε (ε – maža teigiama konstanta, l – subaibė), tai procesas nutraukiamas).

X2 – menkas veiksnys, jo prisijungimas tik 0.25 % padidina R2. Tai galima paaiškinti jo koreliacija su kitais kintamaisiais.

XI – XII paskaitos (Jusčius)

Stjudento kriterijaus panaudojimas reikšminių veiksnių atrinkimui

Vieno žingsnio procedūrose realizuojamos trys strategijos:

1. FORWARDS -laipsniško veiksnių įtraukimo į modelį strategija.

2. BACKWARDS – laipsniško veiksnių eliminavimo iš modelio strategija.

3. STEPVISER – kombinuota strategija.

T kriterijaus panaudojimas strategijoje forward

Stjudento kriterijus remiasi apskaičiuotos reikšmės ti = ai / Sa(i) , (kur aI – parametras, o Sa(i) – to parametro standartinė paklaida), palyginamu su lenteline (kritine) reikšme. ta, kuri randama iš Stjudento pasiskirstymo lentelių, esant patikimumo lygmeniui a ir tam tikram modelio laisvės laipsnių skaičiui. Realizuojant strategiją Forward, daroma prielaida, kad modelyje nėra nei vieno veiksnio.

Reiškia, pirmu veiksniu gali būti bet kuris iš turimo rinkinio v1, v2, . ….vn, kuris labiausiai koreliuoja su rezultatiniu kintamuoju Q ir kurio parametras ai iš esmės skiriasi nuo 0, t.y. ti>ta. Jeigu veiksnys smarkiausiai koreliuoja su dydžiu Q, jis turi ir didžiausią santykinį dydį (ti). Taigi pirmas įtraukimas tas, kuris turi maksimalų ti.

Sudaromos visos porinės regresijos Q=f(vi) visiems i. Įvertinami šių porinių priklausomybių visi parametrai, standartinės paklaidos, apskaičiuojami visi dydžiai ti. Išrenkame max tk*=max[ti]. Patikriname ar veiksnys reikšminis. Iš Stjudento pasiskirstymo lentelių randame ta su m-2 (m stebėjimų skaičius) laisvės laipsniais.

Jeigu tk*>ta, vadinasi vk veiksnys gali būti laikomas reikšminiu ir jis gali būti įtrauktas į modelį Nr.1. Jeigu tkta, vadinasi startinė kito žingsnio padėtis yra modelis Q=f(vk). toliau realizuojant šią strategiją, galimi du alternatyvūs keliai:

1. ir toliau nagrinėti tik porines priklausomybes;

2. pereiti prie daugialypių priklausomybių nagrinėjimo.

1. Nustatome modelio likutinius dydžius Q–f(vk)=f(vi) ir sudarome visas porines regresijas, kur ? Q=f(vk) (yra kiekvienam i , i¹k o likutinis dydis). Vėl įvertiname priklausomybių parametrus, apskaičiuojame naujas parametrų standartines paklaidas. Ir vėl nustatome naujus dydžius ti, iš kurių išrenkamas max tl*=max[ti].

Šiuo atveju labiausiai rezultatinį kintamąjį veikia (i¹k) dydis tl*. Vadinasi jis gali būti potencialiai įtrauktas į modelį. Bet įtraukiame tik tuomet, jei jis reikšminis tl*>ta. Jei taip, tai kiekvienas vl įtraukiamas į modelį Nr.2. Jei ne, tai įtraukti vl beprasmiška. Veiksnių įtraukimo į modelį procesas yra baigiamas.

Nelygybės prasmės pasikeitimas yra vienas proceso pabaigos kriterijų. Proceso rezultatas yra priešpaskutinio žingsnio veiksnių rinkinys. Tarkim tl>ta. Tada nustatome sekantį naują likutinį dydį Q–f (vk)–f(vl) ir vėl sudarome visas likusias porines regresijas – f(vi), i¹l, i¹k ir t.t. Procesas tęsiamas tol, kol paskutinis analizuojamas veiksnys tampa nereikšminiu, t.y. ti£ta arba į modelį jau įtraukti visi veiksniai iš sąrašo.

Ši sistema yra taikytina tada, kai tarp veiksnių nėra esminės koreliacijos. Kodėl? Esant veiksnių esminei interkoreliacijai naudojamas antras kelias, t.y. pereinama prie daugialypių priklausomybių nagrinėjimo.

2. Pirmo veiksnio įtraukimas į modelį analogiškas. Sudaromos dviejų veiksnių funkcinės priklausomybės Q=f(vk,vi). Visiems i įvertinami šių lygčių parametrai, jų standartinės paklaidos. Tikriname tik antrojo veiksnio reikšmingumą. Tam išrenkame max santykį, tarkime tl (max). Tikriname toliau tl reikšmingumą: jei tl>ta, tai veiksnys vl gali būti laikomas reikšminiu ir gali būti įtrauktas į modelį.

Laisvės laipsnių skaičius keičiasi (m-2-1). Taigi antras žingsnis vl veiksnio įtraukimas. Turime modelį Q=f(vl,vk). Sekančiame žingsnyje tikriname priklausomybes Q(vk,vl,vi) visiems i, i¹k, i¹l. Sudarome trijų veiksnių priklausomybes. Toliau – pagal minėtą schemą tikriname tik trečio veiksnio reikšmingumą(parametrai, standartinė paklaida, ti, ti>ta ir t.t.).

Taigi pagrindinė Forward strategijos nuostata yra ta, kad veiksnys įtrauktas į modelį, jame lieka visą laiką (iki proceso pabaigos). Procesas baigiamas, kai paskutinis analizuojamas veiksnys tampa nereikšminiu, nelygybė keičia savo pobūdį, arba į modelį įtraukti visi veiksniai. Arba veiksnių įtraukimo į modelį procesas tampa mažai efektyvus .

h – žingsnio indeksas.

Kokybinės modelio charakteristikos pasikeičia nežymiai (e mano užduota labai maža konstanta).

Pereinant iš vieno žingsnio į kitą (įtraukiant naują veiksnį) tam tikrais atvejais gali būti stebimas ir likutinės dispersijos padidėjimas (R2 sumažėjimas). Tai gali atsitikti dėl to, kad likutinių dydžių kvadratų sumos mažėjimas neatsveria modelio laisvės laipsnių skaičiaus pasikeitimų.

Antroji strategijos Forward realizavimo schema turi ir tą pliusą, kad jis be pakeitimų gali būti naudojamas kaip strategijos Stepviser dalis.

T kriterijaus panaudojimas strategijoje backward

Startinė padėtis – modelyje yra visi veiksniai. Ir iš šios Q=f(v1,v2, ….vn) padėties mes pradedame veiksnių atmetimo procesą. Reikia išmesti nereikšmingiausią veiksnį iš modelio.

Tam sudaromos visos įmanomos porinės regresijos, įvertinami jų parametrai (ai), randamos jų standartinės paklaidos ir apskaičiuojami ti (remiantis porinėmis regresijomis). Randamas kažkoks tk*=min[ti], taip vk – potencialiai nereikšmingas veiksnys. Jeigu tk>ta, vadinasi vk yra reikšminis veiksnys ir jis paliekamas modelyje. Kadangi tk – min reikšmė, vadinasi modelyje paliekami ir visi kiti veiksniai. Vk išmetamas tik tuomet, kada tk£ta.

Tarkime taip atsitiko. Vadinasi veiksnių atmetimo procesas prasidėjo. Rekomenduojama visus veiksnius suranguoti atvirkštine tvarka, pagal tai, kaip jie veikia rezultatinį kintamąjį. Išmetę vk iš modelio, įvertiname modelio Q=f(v1, v2, ….vn-1) visiems i ir i¹k. Vėl apskaičiuojame parametrus – Sa ir ti.

Pagal Dtl*=mini[ti]i¹k surangavimo skalę min dydis turi būti tl. Tikriname ar tl>ta. Jei taip iš modelio eliminuojamas vl ir t.t. Procesas tęsiamas kol baigiasi veiksniai (lieka 1), arba nelygybė būna “ne”. Kai lieka vienas veiksnys – dažna situacija.

Todėl veiksnių eliminavimo procesą galima apriboti tam tikra daugialypės determinacijos koeficiento min reikšme, kuri negalėtų būti peržengta veiksnių atmetimo procese. Kai kada literatūroje siūloma visų veiksnių atmetimą atlikti vieno žingsnio metu, t.y. po porinių regresijų nagrinėjimo ir visų ti apskaičiavimų, šių regresijų pagrindu.

Jie lyginami su ta ir iš modelio vieno žingsnio metu atmetami visi veiksniai, kuriems tiFa priimama hipotezė H0, teigianti, kad modelis ir jį atitinkantis veiksnių rinkinys yra reikšminis.

– jei FaFa ®vk įtraukiamas į modelį ir atsiranda modelio forma Q=f(vk,vi).

Kaip ir t-kriterijaus atveju galimos dvi alternatyvos :

1. ir toliau nagrinėti tiktai porines priklausomybes;

2. pereiti prie daugialypių regresijų nagrinėjimo.

Pirmoji gali būti panaudota tada, kai tarp veiksnių praktiškai neturime interkoreliacijos. Šios alternatyvos nagrinėjimas pagal t-kriterijaus analogiją. Reikia patiems išsinagrinėti.

Antroji reiškia, kad tarp veiksnių yra interkoreliacija, t.y. prijungus sekantį(-čius) veiksnį(-ius), kiekviename žingsnyje keičiasi modelio parametrų įvertinimai (prie visų veiksnių), ir tie pasikeitimai yra tuo didesni, kuo yra stipresnė interkoreliacija.

Antras žingsnis.

Nagrinėjamos priklausomybės Q=f(vk, vi) kiekvienam i , i¹k. Įvertinami šių funkcijų parametrai, apskaičiuojamos Slik2 ir randami santykiai Fa(k)iz , kur z- veiksnių skaičius. Išrenkame max santykį, kuris pažymėtas Fa(k)lz=maxFa(k)i . Šiuo atveju geriausias rezultatas pasiektas kombinacijai vk,vl. Ir į modelį įtraukiamas veiksnys vl ir t.t.

Procesas tęsiamas iki:

1. visi veiksniai įtraukti į modelį.

2. Jeigu porinių priklausomybių nagrinėjimo metu buvo atmesti visi veiksniai, kuriems Fa(i)1Fla;n-1 tai skaitome, kad veiksnio vk išmetimas buvo dėsningas, nes modelio rinkinys yra reikšminis. Tada imamas sekantis veiksnys pagal blogumą. Tegu tai bus (l) veiksnys. Jis bus išmestas sekantis ir t.t.

Leiskime, kad Fan-1£Fla;n-1 . Tai reiškia, kad vk veiksnio išmetimas sumažino modelio reikšmingumą žemiau kritinės ribos. Todėl vk išmesti negalima. Taigi nelygybės ženklo pasikeitimas procedūroje Backward yra vienas iš proceso pabaigos kriterijų.

Šiuo atveju kaip proceso rezultatas yra priešpaskutinio žingsnio veiksnių rinkinys. Tačiau nagrinėtoje situacijoje lentelės reikšmė Fla yra kritinė reikšmė, todėl dažnai vietoj jos yra vartojama reikšmė Fla+A, kur A – tam tikra teigiama atsargos konstanta, kurią užduoda pats tyrėjas.

Procedūroje Backward taip pat numatomas sustojimas, kai lieka 1 veiksnys. Čia išlaikoma pagrindinė Backward strategijos nuostata – išmestas veiksnys negrąžinamas.

Stepviser strategijos realizavimas f-kriterijaus pagalba

Taip organizuota procedūra Backward su f-kriterijaus pagalba negali būti realizuota strategijoje Stepviser, nes naudojant F yra įvertinamas viso modelio rinkinio reikšmingumas, o ne tam tikro atskiro veiksnio reikšmingumas. Todėl gerai išvystytuose TPP būna Stepviser strategijos modifikacija. Joje Forward atliekama F-kriterijaus pagalba, o Backward atliekama t-kriterijaus pagalba.

Kelios pastabos dėl veiksnių atrinkimo

1. Atrinkti veiksniai turi suteikti modeliui aukštą adekvatumo laipsnį, t.y. pasižymėti geromis aproksimacijos savybėmis.

2. Reikšminių veiksnių atrinkimas turi būti siejamas su veiksnių interkoreliacijos tyrimu ir multikoliniarių veiksnių eliminavimu.

3. Kadangi tai darbo imlūs procesai – tikslinga didesnį lyginamąjį svorį suteikti pradiniams kokybiniams veiksnių atrinkimo etapams ir naudotis pateiktomis praktinėmis taisyklėmis.

4. Analizuojamų procesų galimybes visada riboja duomenų skaičius.

5. Analizuodami visus metodus naudojam apibendrintą tiesinį pavidalą ir susidaro įspūdis, kad ryšio tarp kintamųjų pasirinkimo problema išspręsta, tačiau vietoj vi ir Q gali būti įvairios Y ir Xi – algebrinės transformacijos. Nevisada aišku kaip apjungti porines priklausomybes į apibendrintą modelį. Gana dažnai ekonometriniuose tyrimuose turi būti panaudotos netiesinės (nelinearizuojamos) funkcijos.

Autonominės ryšio formos ir esminių veiksnių klausimų nagrinėjimas gali būti pateisinamas tik tuo, kad abi problemos yra labai sudėtingos, jų praktiniam sprendimui labai dažnai ieškoma kompromisinių sprendimų.

6. Geriausiai ryšio formas ir reikšminių ryšių atrinkimo problemas galima spręsti pasinaudojant visų galimų regresijų metodu ir funkcijų generatoriaus principais, kurie išdėstyti atskiru klausimu “Dėl ryšio formos pasirinkimo…”. Funkcijų generatoriaus principą galima panaudoti ir strategijose Forward ir Backward porinių priklausomybių nustatymo žingsnyje. Tada skaičiavimų apimtis didėja.

7. Visų procedūrų vykdymo rezultate negalima gauti optimalaus veiksnių rinkinio. Galima kalbėti tik apie gerai tyrinėtojo poreikius tenkinantį, neprieštaraujantį ekonomikos teorijai, suformuotą moduline hipoteze, veiksnių rinkinį.

Modelio likutinių dydžių autokoreliacija

Problemos apibūdinimas ir pagrindinės sąvokos.

Q=f(v)+e , kur v-veiksnių matrica.

Qf=Qa+e

Qjf=Qja+e kur j=1…m ej=Qjf-Qja kitaip tariant ej (j=1..m), kuri yra modelio likutinių dydžių paklaida. Ji gali būti nustatyta tik apskaičiavus tam tikro modelio parametrus ir Q reikšmes.

Viena iš pagrindinių koreliacinio-regresinio ryšio prielaidų yra formuluojama taip: ej yra nepriklausomi atsitiktiniai dydžiai pasiskirstę pagal normalųjį pasiskirstymo dėsnį, kurių matematinė viltis lygi 0, o dispersija – konstanta, nepriklausanti nuo stebėjimo skaičiaus ir jų sutvarkymo eilės.

Jei ši prielaida nepatenkinta, vadinasi modelis sudarytas nepakankamai korektiškai. Ir atvirkščiai, jei modelis yra nekorektiškas tai ši prielaida negali būti tenkinama t.y. ej tarpusavyje priklausomi.

Priežastys:

1. Į modelį neįtraukti tam tikri veiksniai. Jei neįtraukti vienas ar keli esminiai veiksniai, tai jų poveikis rezultatiniam kintamajam persiduoda ej.

2. Nepagrįsta, neteisinga ryšio tarp kintamųjų forma. Dažnai vien dėl to, kad supaprastinti parametrus, procedūras vietoj netiesinės formos naudojama tiesinė arba pasirenkama mažiau sudėtinga netiesinė forma.

3. ej dažnai atsiranda dėl neteisingo nepagrįsto modelio parametrų įvertinimų metodo pasirinkimo ar dėl metodinių programinių klaidų, kurias tyrinėtojas padaro parametrų įvertinimo procese.

Kiekvienas rodiklis turi tam tikras paklaidas, kurios susidaro fiksuojant sustambintą pradinę informaciją. Kai kada informacija iškreipta tyčia. Tai reiškia, kad mes negalime palyginti rodiklių tarpusavyje per dvi ideologijas.

XIII paskaita (00 05 21 Jurga)

Autokoreliacija bendru atveju suprantama kaip tam tikro rodiklio lygių priklausomybė nuo buvusių šio rodiklio reikšmių. Tegu turim rodiklį zt t=1, 2, …, m, kuris apibūdina tam tikrą dinaminį procesą. Jeigu modelio funkcionalinę dalį (sisteminę) galime užrašyti kaip funkciją zt = f(zt-1, zt-2, …, zt-t) arba zt = f(zt-t), sakome, kad turime t eil4s autokoreliaciją, o t yra autokoreliacijos lagas. Pati stipriausia būna I eilės autokoreliacija, t.y. autokoreliacijos lagas t = 1., ir tada modelį pateikiame kaip zt = f(zt-1) + ut.

Autokoreliacija gali būti stebima tiek rodiklio yt, tiek ir likutinio dydžio atžvilgiu, tačiau šių autokoreliacijų prigimtis ir reikšmė yra visiškai skirtingos.

Rodiklio y autokoreliacija dažniausiai seka iš pačios jo prigimties, ir tai ypač aišku, kai yt atspindi dinaminį procesą, kuris vyksta pagal taip vadinamą gyvenimo šabloną (gimimas – gyvenimas – mirtis).

Tarkime, analizuojame pagrindinio kapitalo augimo dinamiką. Yra 3 rodikliai, kurie tai apsprendžia:

1. naujų renginių įdiegimas

2. veikiančio kapitalo eksploatacija

3. išėmimas iš gamybos

Net ir labai esant intensyviems pagrindinio kapitalo atnaujinimo tempams, 80-90% t metų pagrindinio kapitalo apimties apsprendžia t-1 metų pagrindinio kapitalo apimtis.

Įvedimo koeficientas yra daugiausiai 10 – 15 %, amortizacijos periodas – 10 – 15 metų.

Dar ryškesnė tokio tipo priklausomybė būdinga gyventojų skaičiaus rodikliui. Jo pasikeitimus apsprendžia gimusių, mirusių skaičius ir migracija. Lietuvoje palyginus nemažas mirtingumo slenkstis, mažas gimimų skaičius, migracija.

Pagrindinio kapitalo atveju pasireiškia paties rodiklio labai ryški autokoreliacinė priklausomybė. Rodiklių autokoreliacinė priklausomybė gali persiduoti modelio likutinių dydžių kitimui, jeigu modelio sudarymo, informacijos surinkimo ir jos apdorojimo procesai atlikti nepakankamai korektiškai.

Iš čia seka, kad jeigu dydžiai ej yra autokoreliuoti, tai modelis yra sudarytas nepakankamai korektiškai. Galioja ir atvirkštinis teiginys – jeigu modelis nekorektiškas, ej gali autokoreliuoti.

ej autokoreliacija gali būti stebima ne tik dinaminių procesų analizėje, bet ir atrankiniuose, teritoriniuose tyrimuose. Tai gali būti tada, kai procesą apibūdinančius rodiklius y ir xi veikia tam tikros stiprios ir vienodos priežastys, kurios yra neįtrauktos į modelį.

Sudarius tam tikrą modelį ir įvertinus jo parametrus labai svarbu išanalizuoti likutinių dydžių autokoreliaciją ir imties priemones jų pašalinimui.

Paprasčiausi modelio likutinių dydžių autokoreliacijos tyrimo metodai ej gali būti ir teigiami ir neigiami. Labai dažnai juos galime pateikti kaip tam tikrą + ir – seką. Tokių sekų nagrinėjimu remiasi paprasčiausi (vizualiniai) tyrimo metodai. Analizuojant likučių autokoreliaciją, daug informacijos gali suteikti įvairių grafinių vaizdų nagrinėjimas. Tarkime turime tokią ženklų seką:

Vienodų ženklų seka – ženklų serija

Perėjimas iš pliuso į minusą – ženklų inversija

Šiuo atveju: 8 ženklų serijos,

7 ženklų inversijos,

14 likučių.

Tarkim, kad mūsų modelis – tiesė. Jeigu rodo faktines reikšmes, matome, kad faktinės reikšmės išsidėsčiusios tolygiai, + reguliariai keičia -. Vizualinė analizė sako, kad modelis geras.

Kitas pavyzdys:

Faktinės reikšmės sudaro parabolę, o mes pasirinkome tiesinį modelį. Turime tik 2 ženklų inversijas. Akivaizdu, kad modelis pasirinktas nesėkmingai:

Visiškai blogas modelis : + + + + + + – – – – –; – – – – – + + + + + +. Dažnai sakoma, kad modelis yra geras, kai ženklų serijų inversijų skaičius santykyje su bendru stebėjimų skaičiumi ³ 0,5.

I atveju 7 inversijos, 14 stebėjimų, tai . Tai nevisada teisinga. Visada šią skaitinę charakteristiką reiktų analizuoti su paskutinių serijų tyrimu. Jei paskutinės ar pirmos serijos yra labai ilgos, turime blogų aproksimacinių savybių modelio galuose iliustraciją. Tokiu atveju galima galvoti, kad vyskta esminiai pasikeitimai priklausomybėje tarp modelio rodiklių.

Paveikslas rodo, kaip kinta likutiniai dydžiai priklausomai nuo Y. Šiuo atveju galima pasakyti, ar įvertinimo metodas korektiškas.

Analogišką grafiką galima sudaryti ir kiekvienam xi, t.y. ej priklausomybę nuo xi. ej turi nepriklausyti nuo xi.

Tegu turime tokias serijas:

Iš viso: 20 likučių, 12 pliusų (+), 8 minusai (-), 4 inversijos. 4/20 = 0,2 < 0,5, t.y. modelis blogas. Be to, paskutinės + ir – serijos yra labai ilgos, o ilgos serijos yra negeras požymis.

Daugelyje tyrimų galima rasti tokią neparametrinę tyrimų metodiką:

Tikrinama hipotezė, ar ženklų pasikeitimas yra atsitiktinis procesas. Tam yra apskaičiuojamas serijų vidurkis , dispersija

Kai n1 = 12 (teigiami), o n2 = 8 (neigiami), tokiu atveju m = 10,6, s = 2,08. T.y. jeigu procesas būtų atsitiktinis, jis turėtų tokius parametrus. O turime 5 serijas, vidurkis 10,6, tuomet 10,6 – 5 = 5,6. O tai beveik 3 kartus viršija standartinę paklaidą. Hipotezė dėl atsitiktinumo negali būti priimta. Ekonometrinėje literatūroje galima rasti daug panašių testų, ypač neparametrinėje statistikoje.

Matematiniai statistiniai kriterijai

Tikslesnį įvertinimą dėl autokoreliacijos buvimo duoda matematiniai statistiniai kriterijai, kurių žymiausi yra Andersono, Fon Neimano ir Durbin-Watson Test kriterijus.

R.L. Andersono kriterijaus panaudojimas autokoreliacijos tyrimuose. Šis kriterijus yra naudojamas I laipsnio autokoreliacijai analizuoti, jo pagalba yra nustatoma autokoreliacija tiek dydžiams y, tiek ir ej. Šio testo panaudojimas remiasi porinės koreliacijos koeficiento tarp eilučių y1, y2, …, ym-1

y2, y3, …, ym apskaičiavimui. Vietoj y gali būti likutiniai dydžiai ej. Porinės koreliacijos koeficientai, esant koreliacijos lagui t, apskaičiuojamas pagal formulę:

Jei tikrinam I eilės autokoreliaciją, vietoj t statome 1.

Taigi apskaičiuojame šį parametrą, iš kurio galima padaryti tam tikrą išvadą apie autokoreliacijos buvimą, tačiau šio dydžio teorinis paskirstymas atrankoms iš generalinės visumos, pasiskirsčiusios pagal normalųjį dėsnį. Yra nežinomas, todėl tenka naudotis taip vadinamu ciklinio autokoreliacijos koeficiento pasiskirstymu, kurio nustatymo prioritetas priklauso R.L. Andersonui. Ciklinis autokoreliacijos koeficientas – koreliacijos koeficientas tarp eilučių y1, y2, …, ym-1; y2, y3, …, ym, y1.

Andersonas sudarė šių eilučių pasiskirstymo lenteles, kuriose reikšmės priklauso nuo patikimumo lygmens a ir laisvės laipsnių skaičiaus m-t. Šiuo atveju m-1. Lygindami su lenteline reikšme (kritine reikšme) darome išvadą apie autokoreliacijos buvimą. Jeigu apskaičiuota reikšmė didesnė už kritinę – turime esminę autokoreliaciją. Reikia pasakyti, kad šį testą sėkmingai taikyti galime tada, kai duomenų skaičius pakankamai didelis. Kuo yra didesnis duomenų skaičius, tuo mažesnį lyginamąjį svorį turi cikliniai nariai. Matematiškai įrodoma, kad kai m®µ, ciklinės ir neciklinės koreliacijos koeficientai praktiškai suartėja.

Analogiška metodika remiasi fon Naimano autokoreliacijos patikrinimo schema, tačiau fon Naimanas siūlo naudoti paprastesnę autokoreliacijos koeficientų apskaičiavimo schemą, taigi siūlomi 2 variantai:

Šiuo atveju vietoj likutinio dydžio e, kuris yra teorinio dydžio e įvertis gali būti vartojamas ir y.

Durbin Watson Test panaudojimas likutinių dydžių autokoreliacijai tirti. Šitas testas yra skirtas tiktai likutinių dydžių autokoreliacijai tirti ir tai yra vienas iš plačiausiai naudojamų statistinių testų.

Tegu turime

Yt = f(vt) + ut, kur ut likutinis šio modelio dydis, kurio kitimui yra būdinga I eilės autokoreliacija, t.y. ut = rut-1 + et.

Šio modelio dydis, kurio kitimui yra būdinga I eilės autokoreliacija, t.y. ut = rut-1 + et

Savo ruožtu et pagal prielaidą yra nepriklausomi atsitiktiniai dydžiai, pasiskirstę pagal normalųjį pasiskirstymo dėsnį, kurių matematinė viltis = 0, o dispersija – konstanta.

Toliau naudosimės dydžių r likutinių dydžių įverčiais. Vadinasi, tolesnėse formulėse naudosime et = ytf – yta

DW testinė charakteristika d1 yra apskaičiuojama:

čia yra pagrindinė šio testo charakteristika.

Dydžio r įverčiu laikome autokoreliacijos koeficientą, kuris yra apskaičiuotas empyriniams duomenims pagal pačią paprasčiausią fon Neimano formulę. Tarp dydžio d1 ir r yra apytikrė priklausomybė:

d1»2(1-r)

r – koreliacijos koeficientas. R gali įgauti visas reikšmes intervale (-1; 1). Autokoreliacija gali būti >0 ir <0, todėl kai r = 0 (r = 0), tai d1»2. Tai reiškia, kai autokoreliacijos nėra – r = 0, di = 2.

Kai r(r)=1, d1»0

Kai r=-1, d1»4

Kitaip tariant charakteristikos d1 kitimo ribos (0; 4). Jų reikšmių pasiskirstymas – dvipusis ir šio pasiskirstymo vidurkis lygus 2. Taigi kuo yra apskaičiuota d1 reikšmė artimesnė 2 reikšmei, tuo pagrįstesnis teiginys, kad autokoreliacijos nėra (H0 – autokoreliacijos nėra).

d1 nuokrypis nuo 2 parodo autokoreliacijos stiprumą, kitaip tariant yra modelio nekorektiškumo identifikavimas. Durbin ir Watson yra sudarę charakteristikos d1 pasiskirstymo lenteles, kuriose priklausomai nuo patikimumo lygmens a ir laisvės laipsnių skaičiaus (jis priklauso nuo stebėjimų bei kintamųjų skaičiaus) pateikiamos 2 teorinės dydžio d reikšmės dl (apatinė) ir dn (viršutinė).

Lygindami apskaičiuotą d1 reikšmę su du ir dl, priimama arba H0 ir H1, kuri reiškia, kad r absoliutiniu dydžiu yra < 1.

t.a. – teigiama autokoreliacija n.a. – neigiama autokoreliacija n.r. – neapibrėžtas rezultatas

Teigiamai autokoreliacijai nustatyti gali būti naudojama tokia taisyklė: autokoreliacijos nėra, kai d1 yra tarp du ir 2. Kai d