Turinys
Įvadas 3Aprašomoji statistika 6Diagramos 8Namų ūkio dydis 8Namų ūkio disponuojamos pajamos vienam namų ūkio nariui 8Namų ūkio vartojimo išlaidos vienam namų ūkio nariu 9Namų ūkių pajamų ir išlaidų palyginimas 9Vieno namų ūkio nario vidutinių išlaidų pasiskirstymo įvertinimas 11Hipotezių tikrinimas 11Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste 13Ar namų ūkio santaupos didėja 13Regresinės analizės 14Regresinė analizė Nr. 1 14Determinacijos koeficiento įvertis 19Regresijos koeficiento reikšmingumo patikrini 20Regresinė analizė Nr. 2 20Skurdo rodiklių įvertinimas 23Skurstančiųjų gyventojų lygis šalyje 24Žemų pajamų nuokrypis 25Žemų pajamų indeksas 25Kvadratinis skurdo nuokrypis 25Išvados 26Įvadas Terminas „ūkio statistika“ naudojamas vietoj termino „ekonominė statistika“.Ūkio statistika: tiria ūkinių procesų ir reiškinių kiekybę; pateikia matų sistema konkretiems reiškiniams ir procesams apibūdinti, kompleksinės ūkinių reiškinių analizės būdais; pateikia statistinių tyrimų atlikimo metodiką; supažindina su statistinių metodų ir ekonometrinių modelių taikymo ūkiniams procesams analizuoti metodika.Ekonometrija apjungia teoriniu rezultatus, metodus, modelius skirtus suteikti konkrečias skaitines reikšmes ekonominiams reiškiniams naudojantis: ekonomikos teorija, ekonometrine statistika, matematiniais statistiniais metodais.Ekonometrijos tikslai: ekonominių ir socialinių rodiklių analizė; rodiklių prognozė; šalies socialinio-ekonominio vystymosi imitavimas.Ūkio statistikos ir ekonometrijos kursinio darbo tikslai ir uždaviniai:• aprašyti duomenų statistiką;• įvertinti vieno namų ūkio nario vidutinių išlaidų pasiskirstymą;• patikrinti hipotezes;• apskaičiuoti skurdo rodiklius;• atlikti regresinę analizę;• įvertinti determinacijos koeficientą;• patikrinti regresijos koeficiento reikšmingumą.Naudojamos sąvokosNamų ūkiu laikomas atskirai gyvenantis vienas asmuo ar asmenų grupė, gyvenanti viename bute (name), turinti bendrą biudžetą ir kartu maitinasi. Namų ūkiu gali būti:• šeima, susidedanti iš sutuoktinių ir vaikų ar be jų arba vieno sutuoktinio su vaikais;• kartu gyvenantys ir bendrą biudžetą turintys giminaičiai;• kartu gyvenantys ir bendru biudžetu susiję asmenys, neturintys giminystės ryšio• vieniši asmenys, gyvenantys iš savo pajamų;
• šeimos, susidedančios iš kelių kartu gyvenančių sutuoktinių porų, turinčių bendrą biudžetą.Asmenys, gyvenantys instituciniuose namų ūkiuose (senelių namuose, įkalinimo įstaigose, tarnaujantys armijoje ir pan.) nėra tiriami.Namų ūkio galva – tai asmuo, turintis didžiausias pajamas. Asmuo, kuris, ūkio narių nuomone, per metus gauna didžiausias pajamas. Kai didžiausias pajamas gaunančio asmens išskirti negalima (pvz., visa šeima ūkininkauja ir pajamų negalima priskirti kuriam nors ūkio nariui), namų ūkio galva laikomas asmuo, kurį nurodo šeima.Namų ūkių socialinės ekonominės grupės:• žemdirbiai (namų ūkio galvos pagrindinis pajamų šaltinis yra asmeninis žemės ūkis);• samdomieji darbuotojai (namų ūkio galvos pagrindinis pajamų šaltinis yra samdomas darbas visuomeniniame arba privačiame sektoriuje);• verslininkai (namų ūkio galvos pajamos yra iš verslo, amatų, laisvos profesinės veiklos);• pensininkai (namų ūkio galvos pajamos yra pensija);• kiti (namų ūkio galvos pagrindinis pajamų šaltinis yra įvairios pašalpos, stipendija, pajamos iš turto, bei kiti pajamų šaltiniai).Namų ūkio tipas – nustatomas pagal namų ūkio demografinę sudėtį. Yra išskiriami šie tipai:• vienišas asmuo;• vienas suaugęs su vaikais iki 18 m.;• sutuoktinių pora su vaikais iki 18 m.;• kiti namų ūkiai su vaikais iki 18 m. Šiam tipui priklauso namų ūkiai, kuriuos sudaro tėvai su vaikais iki 18 metų ir vyresniais, kelių kartų namų ūkiai su vaikais iki 18 metų, seneliai su anūkais iki 18 metų ir pan.;• sutuoktinių pora be vaikų;• kiti namų ūkiai be vaikų.Visi šalies namų ūkiai yra suskirstyti į 3 grupes:• didieji miestai (Vilnius, Kaunas, Klaipėda, Šiauliai, Panevėžys);• kiti miestai;• kaimas.Namų ūkio disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios yra gautos už darbą iš ūkininkavimo, verslo, amatų, laisvos profesinės veiklos, taip pat pensijos, įvairios pašalpos, stipendijos, pajamos iš turto, renta ir kt.Namų ūkio vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkių vartojimo poreikiams patenkinti: tai išlaidos maistui, drabužiams, avalynei, būstui, sveikatos priežiūrai, kultūros ir poilsio reikmėms ir kt.Europos Konsiliume 1984 m. lapkričio 19 dieną buvo priimtas toks skurdo apibrėžimas: „skurdžiais vadinami asmenys, šeimos, asmenų grupės, kurių ištekliai (materialiniai, kultūrinia…i ir socialiniai) yra nepakankami savo šalyje susiklosčiusiam minimaliam gyvenimo būdui užtikrinti“.Skurdo riba – tai kriterijus, kurio pagalba politikai ar tyrinėtojai suskirsto individus, šeimas ar namų ūkius į skurstančius ir neskurstančius. Yra trys pagrindiniai skurdo ribų tipai: absoliuti, santykinė, subjektyvi.Skurdo rodikliai:• skurstančiųjų gyventojų lygis šalyje – tai rodiklis, parodantis šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos.• žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos.• žemų pajamų indeksas – tai rodiklis, kuris parodo, kiek reikia lėšų panaikinti skurdą šalyje.• kvadratinis skurdo nuokrypis – skurdo intensyvumo rodiklis, atspindintis pajamų pasiskirstymą tarp skurstančiųjų.Aprašomoji statistikaPradiniai duomenys Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Pajamos vienam gyventojui (Lt) Išlaidos vienam gyventojui (Lt)1 1 170,00 498,00 170,00 498,00 2 3 1206,00 898,00 402,00 299,33 3 5 446,00 842,00 89,20 168,40 4 2 655,00 739,00 327,50 369,50 5 3 887,00 791,00 295,67 263,67 6 3 1119,00 1041,00 373,00 347,00 7 1 335,00 427,00 335,00 427,00 8 4 872,00 859,00 218,00 214,75 9 3 636,00 612,00 212,00 204,00 10 4 847,00 863,00 211,75 215,75 11 2 603,00 804,00 301,50 402,00 12 1 346,00 321,00 346,00 321,00 13 5 1977,00 2238,00 395,40 447,60 14 4 1730,00 1797,00 432,50 449,25 15 4 1346,00 1179,00 336,50 294,75 16 4 1681,00 1653,00 420,25 413,25 17 4 1123,00 1003,00 280,75 250,75 18 3 1134,00 1220,00 378,00 406,67 19 4 708,00 932,00 177,00 233,00 20 3 2036,00 2037,00 678,67 679,00 21 2 781,00 1169,00 390,50 584,50 22 2 1038,00 757,00 519,00 378,50 23 2 895,00 1011,00 447,50 505,50 24 4 1015,00 618,00 253,75 154,50 25 3 1190,00 675,00 396,67 225,00 26 3 1096,00 1624,00 365,33 541,33 27 2 1552,00 1059,00 776,00 529,50 28 3 1691,00 2003,00 563,67 667,67 29 2 906,00 1340,00 453,00 670,00 30 2 1154,00 1560,00 577,00 780,00 Iš viso: 88 31175,00 32570,00 11.123,10 11.941,17Vidurkis – tai visų stebėtų skaitinių duomenų suma, padalinta iš duomenų skaičiaus. Jis rodo vidutinę atsitiktinio dydžio reikšmę.Mediana – tai skaičius, perskirstantis variacinę eilutę į dvi maždaug lygias dalis.Moda – tai dažniausiai duomenų aibėje pasikartojanti reikšmė.Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.Dispersija – tai matas, aprašantis atsitiktinio dydžio sklaidą apie vidurkį.Eksceso koeficientas – tai lėkštumo matas. Kai šis koeficientas:• >0, tai sklaida apie vidurkį yra didesnė už normaliąją kreivę;• =0, tai duomenų sklaida apie vidurkį yra tokia pati kaip ir normalios kreivės;• <0, tai duomenų sklaida apie vidurkį yra mažesnė už normalios kreivės.Asimetrijos koeficientas – tai simetrijos matas. Kai šis koeficientas:• >0, tai asimetrija yra teigiama (dešinioji asimetrija);• =0, tai rodo, kad yra simetrija;• <0, tai asimetrija yra neigiama (kairioji asimetrija).
Duomenų plotis – tai maksimalios ir minimalios stebėjimų sekos duomenų reikšmių skirtumas, kuris parodo stebimų duomenų reikšmių diapazoną.Minimali reikšmė – tai stebimų duomenų sekoje esanti mažiausia reikšmė.Maksimali reikšmė – tai stebimų duomenų sekoje esanti didžiausia reikšmė.GAVOM:Charakteristikos N.Ū. Dydis N.Ū. Disponuojamos pajamos (Lt) Pajamos vienam n. ū. nariui Namų ūkio vartojimo išlaidos Išlaidos vienam n. ū. nariui
Vidurkis 2,93333333 1039,166667 370,77 1085,66667 398,03889Standartinė paklaida 0,203042 86,57787782 27,3442819 90,4631929 30,615447Mediana 3 1026,5 369,166667 967,5 390,25Moda 3 Vidutinis kvadratinis nuokrypis 1,11210683 474,2065666 149,7708 495,487314 167,68771Dispersija 1,23678161 224871,8678 22431,2926 245507,678 28119,168Duomenų plotis 4 1866 686,8 1917 625,5Minimali reikšmė 1 170 89,2 321 154,5Maksimali reikšmė 5 2036 776 2238 780Suma 88 31175 11123,1 32570 11941,167Duomenų skaičius 30 30 30 30 30Diagramos Namų ūkio dydisNamų ūkio dydis Namų ūkio skaičius1 32 83 94 85 2
Didžiausią dalį visų namų ūkių užima šeimos po 3 (29%), mažiausiai po 5 (7%) žmones.Namų ūkio disponuojamos pajamos vienam namų ūkio nariuiN.Ū. Disponuojamos pajamos vienam n. ū. nariui (Lt) Namų ūkių skaičiusiki 500 Lt 25virš 500 Lt 5
Daugiausia yra namų ūkių, kurių disponuojamos pajamos vienam namų ūkio nariui yra iki 500Lt (83%). Namų ūkių vartojimo išlaidos vienam namų ūkio nariuiNamų ūkio vartojimo išlaidos vienam n. ū. nariui Namų ūkių skaičiusiki 500 Lt 22virš 500 Lt 8
Daugiausia yra namų ūkių, kurių išlaidos vienam namų ūkio nariui yra iki 500 Lt (73%), mažiausiai – kurių išlaidos yra virš 500 Lt (po 27%).Namų ūkių pajamų ir išlaidų palyginimasNamų ūkio eilės nr. Pajamos vienam n.ū. nariui (Lt) Išlaidos vienam n.ū. nariui (Lt)1 170,00 498,00 2 402,00 299,33 3 89,20 168,40 4 327,50 369,50 5 295,67 263,67 6 373,00 347,00 7 335,00 427,00 8 218,00 214,75 9 212,00 204,00 10 211,75 215,75 11 301,50 402,00 12 346,00 321,00 13 395,40 447,60 14 432,50 449,25 15 336,50 294,75 16 420,25 413,25 17 280,75 250,75 18 378,00 406,67 19 177,00 233,00 20 678,67 679,00 21 390,50 584,50 22 519,00 378,50 23 447,50 505,50 24 253,75 154,50 25 396,67 225,00 26 365,33 541,33 27 776,00 529,50 28 563,67 667,67 29 453,00 670,00 30 577,00 780,00
Iš grafiko matyti, kad beveik pusės visų namų ūkių išlaidos vienam gyventojui viršija pajamas vienam gyventojui.Vieno namų ūkio nario vidutinių išlaidų pasiskirstymo įvertinimasBin Frequency Cumulative %119,75 0 0,00%189,25 2 6,67%258,75 6 26,67%328,25 4 40,00%397,75 3 50,00%467,25 6 70,00%536,75 3 80,00%606,25 2 86,67%675,75 2 93,33%745,25 1 96,67%814,75 1 100,00%More 0 100,00%
Daugiausia yra namų ūkių, kurių išlaidos vienam ūkio nariui yra mažos ir vidutiniškos.Hipotezių tikrinimasBet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes vadinamas statistine hipoteze. Pradinę hipotezę paprastai vadiname nuline hipoteze arba pagrindine (žymima H0), konkuruojančią hipotezę arba alternatyvą, vadiname hipotezę H1, priešingą nulinei hipotezei H0.
Statistiniais metodais tikrindami hipotezės H0 teisingumą, galime padaryti dviejų rūšių klaidas.Pirmosios rūšies klaidą padarome tada, kai atmetame hipotezę H0, kai ji yra teisinga.Jei priimame hipotezę H0, nors ji yra klaidinga padarome antros rūšies klaidą.Hipotezė Teisinga KlaidingaAtmetama Pirmos rūšies klaida Teisingas sprendimasPriimama Teisingas sprendimas Antros rūšies klaidaTaisyklę, pagal kurią iš imties duomenų darome išvadą apie hipotezės teisingumą ar klaidingumą vadiname statistiniu kriterijumi arba tiesiog kriterijumi. Hipotezės apie dviejų vidurkių lygybę tikrinimasTarkime, kad X ir Y yra normalieji atsitiktiniai dydžiai. Sprendžiant praktinius uždavinius, dažnai tenka atsakyti į klausimą: ar iš esmės skiriasi nagrinėjamųjų atsitiktinių dydžių vidurkiai EX ir EY?Tegu x1, x2,…, xm ir y1, y2,…, yn yra šių atsitiktinių dydžių nepriklausomos imtys. Į suformuluotąjį klausimą galima atsakyti patikrinus hipotezę H0: EX = EY su alternatyva H1: EX ≠ EY (esant reikšmingumo lygmeniui a).Jei imtys yra mažos ir vidutiniai kvadratiniai nuokrypiai s1 ir s2 nėra žinomi, hipotezei H0 su alternatyva H1 tikrinti taikomas Stjudento kriterijus. Tačiau šiuo atveju prireikia papildomos sąlygos: s1 = s2. Tada naudojamasi statistikat = kuri, galiojant hipotezei H0, yra Stjudento skirstinys. Pagal reikšmingumo lygmenį a ir laisvės laipsnių skaičių k = m + n – 1.Panašus priklausomų imčių kriterijus naudojamas ekonominiams skaičiavimams nustatant ekonominių rodiklių kitimo pobūdį. Tuo tikslu imtis x1, x2,…, xn padalijama į dvi dalis x1, x2,…, xm ir xm+1,…, xn. Apskaičiavus šių imčių vidurkius ir , tikrinama hipotezė H0: = Jei ji teisinga, galima tvirtinti, kad nagrinėjamasis rodiklis nekinta.Nežinant, ar imčių x1, x2,…, xm ir y1, y2,…, yn dispersijos lygios, natūralu pirmiau tikrinti hipotezę apie dispersijų lygybę: H0 . Šiai hipotezei tikrinti taikomas Fišerio kriterijus. Randama statistikos F = reikšmė, iš Fišerio skirstinio lentelės pagal pasirinktąjį reikšmingumo lygmenį nustatoma kritinė sritis. Jei statistikos reikšmė patenka į kritinę sritį, hipotezė H0 atmetama; priešingu atveju – priimama.Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste
F-Test Two-Sample for VariancesMiestas KaimasMean 427,600833 338,915Variance 28057,0267 25548,65Observations 20 10df 19 9F 1,0981804 P(F<=f) one-tail 0,46380901 F Critical one-tail 2,94765205 FAr namų ūkio santaupos didėjaNamų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)Mean 1039,166667 1085,666667Variance 224871,8678 245507,6782Observations 30 30Pearson Correlation 0,841095513 Hypothesized Mean Difference 0 df 29 t Stat -0,929217757 P(T<=t) one-tail 0,18022341 t Critical one-tail 1,699126996 P(T<=t) two-tail 0,36044682 t Critical two-tail 2,045229611 Išvados: t Stat < t Critical, todėl H0 yra teisinga. Namų ūkio santaupos nedidėja.Regresinės analizėsRegresinė analizė – tai vieno kintamojo priklausomybės tyrimas nuo kitų kintamųjų. Regresinės analizės kintamieji skirstomi į:• Priklausomus kintamuosius, kurie charakterizuoja rezultatą. Jų reikšmė formuojasi nagrinėjamo reiškinio viduje priklausomai nuo daugelio kitų kintamųjų reikšmių;• Nepriklausomus kintamuosius, kurie aprašo nagrinėjamo reiškinio funkcionavimą, savybes, apsprendžia rezultatą.Regresijos lygtis:Y = θ0 + θ1X1 + θ2X2 + … + θnXn + εi, kur:Y – priklausomas kintamasis;X1, X2, …, Xn – nepriklausomieji kintamieji;θ1, θ2, …, θn – nežinomieji kintamieji;ε – atsitiktinis dydis, parodantis nukrypimus nuo taško iki tiesės.
Regresinė analizė Nr. 1Šioje kursinio projekto dalyje ištirsiu namų ūkio vienam nariui tenkančių išlaidų priklausomybę nuo įvairių faktorių. Regresinėje analizėje Y – namų ūkio vieno nario išlaidos, o jas įtakojančių veiksnių priklausomybei ištirti pasirenku šiuos faktorius:X2 – disponuojamos pajamos vienam namų ūkio nariui;X1 – namų ūkio dydis;X3 – namų ūkio galvos lytis:– moteris „0“– vyras „1“X4 – namų ūkio gyvenamoji vieta:– miestas „1“– kaimas „0“X5 – namų ūkis– su vaikais „1“– be vaikų „0“.
Duomenys, reikalingi regresinei analizei atlikti.Y X1 X2 X3 X4 X5Išlaidos vienam gyventojui (Lt) Pajamos vienam gyventojui (Lt) Namų ūkio dydis Namų ūkio galvos lytis Miestas – Kaimas Namų ūkiai su vaikais ir be vaikų498,00 170,00 1 0 0 0299,33 402,00 3 0 1 0168,40 89,20 5 1 0 1369,50 327,50 2 0 1 0263,67 295,67 3 1 1 0347,00 373,00 3 0 1 0427,00 335,00 1 0 1 0214,75 218,00 4 0 1 0204,00 212,00 3 0 1 0215,75 211,75 4 0 0 1402,00 301,50 2 1 0 0321,00 346,00 1 0 1 0447,60 395,40 5 1 1 1449,25 432,50 4 1 1 1294,75 336,50 4 1 1 1413,25 420,25 4 0 1 0250,75 280,75 4 0 1 1406,67 378,00 3 0 1 1233,00 177,00 4 1 0 1679,00 678,67 3 0 1 0584,50 390,50 2 1 0 0378,50 519,00 2 0 0 0505,50 447,50 2 1 1 0154,50 253,75 4 1 0 1225,00 396,67 3 0 0 1541,33 365,33 3 0 1 0529,50 776,00 2 1 0 0667,67 563,67 3 1 1 1670,00 453,00 2 1 1 0780,00 577,00 2 0 1 0
Tikrinam koreliaciją: X1 X2 X3 X4 X5X1 1 X2 -0,30076 1 X3 0,042106 0,237879 1 X4 0,202803 0,021557 -0,23783 1 X5 -0,2646 0,679011 0,311749 -0,19565 1Patikrinus koreliaciją gavom, kad koreliacija tarp regresorių neviršija 0,85. Iš čia seka, kad ryšys tarp iksų nestiprus ir regresoriai parinkti gerai.
Tikrinam regresiją:SUMMARY OUTPUT
Regression StatisticsMultiple R 0,78658798R Square 0,61872065Adjusted R Square 0,53928745Standard Error 113,81939Observations 30
ANOVA df SS MS F Significance FRegression 5 504539,4 100907,9 7,789195 0,000178694Residual 24 310916,5 12954,85 Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 236,025892 96,98714 2,433579 0,022768 35,85427459 436,1975 35,85427 436,1975X1 0,63699142 0,154657 4,118744 0,00039 0,317795658 0,956187 0,317796 0,956187X2 -48,224097 27,3334 -1,76429 0,090409 -104,6374567 8,189263 -104,637 8,189263X3 60,169243 45,97585 1,308714 0,203025 -34,72025519 155,0587 -34,7203 155,0587X4 64,7309053 48,42275 1,336787 0,193827 -35,20874334 164,6706 -35,2087 164,6706X5 -5,2751869 62,10318 -0,08494 0,933012 -133,4498451 122,8995 -133,45 122,8995Significance F < 0,05. Taigi, bent vienas regresorius yra reikšmingas. X5 išmetame, nes jo P-value lygi 0,933012, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,78651511R Square 0,61860603Adjusted R Square 0,55758299Standard Error 111,536533Observations 30
ANOVA df SS MS F Significance FRegression 4 504445,9 126111,5 10,13725 5,10876E-05Residual 25 311010 12440,4 Total… 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 237,847311 92,68989 2,566054 0,016664 46,94890259 428,7457 46,9489 428,7457X1 0,63771057 0,151328 4,214108 0,000285 0,326045694 0,949375 0,326046 0,949375X2 -49,715981 20,52363 -2,42238 0,023 -91,9851839 -7,44678 -91,9852 -7,44678X3 59,5545478 44,49212 1,338541 0,192767 -32,07869385 151,1878 -32,0787 151,1878X4 65,6613049 46,22162 1,420575 0,167793 -29,53391013 160,8565 -29,5339 160,8565Significance F < 0,05 (5,10876E-05). Taigi, bent vienas regresorius yra reikšmingas. X3 išmetame, nes jo P-value lygi 0,192767, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,76894238R Square 0,59127239Adjusted R Square 0,54411151Standard Error 113,221928Observations 30
ANOVA df SS MS F Significance FRegression 3 482156,5 160718,8 12,53735 2,92781E-05Residual 26 333299,3 12819,21 Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 237,497229 94,09013 2,524146 0,018042 44,092202 430,9023 44,0922 430,9023X1 0,67579683 0,150874 4,479204 0,000133 0,36567021 0,985923 0,36567 0,985923X2 -41,588368 19,9011 -2,08975 0,046567 -82,495654 -0,68108 -82,4957 -0,68108X4 47,9535226 44,95723 1,066648 0,295936 -44,45739 140,3644 -44,4574 140,3644Significance F < 0,05 (2,92781E-05). Taigi, bent vienas regresorius yra reikšmingas. X4 išmetame, nes jo P-value lygi 0,295936, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,7572231R Square 0,57338683Adjusted R Square 0,54178585Standard Error 113,510354Observations 30
ANOVA df SS MS F Significance FRegression 2 467571,7 233785,8 18,14459 1,0127E-05Residual 27 347884,2 12884,6 Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 250,86504 93,4893 2,683356 0,012293 59,040848 442,6892 59,04085 442,6892X1 0,7111206 0,14757 4,818873 4,96E-05 0,40833216 1,013909 0,408332 1,013909X2 -39,711933 19,87369 -1,99822 0,055857 -80,489372 1,065506 -80,4894 1,065506Significance F < 0,05 (1,0127E-05). Taigi, bent vienas regresorius yra reikšmingas. X2 išmetame, nes jo P-value lygi 0,055857, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,71435R Square 0,5103Adjusted R Square 0,49281Standard Error 119,423Observations 30
ANOVA df SS MS F Significance FRegression 1 416125,1 416125,1 29,17758 9,2606E-06Residual 28 399330,7 14261,81 Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 101,49402 59,07041 1,718187 0,096803 -19,506216 222,4943 -19,5062 222,4943X1 0,7998081 0,148068 5,401627 9,26E-06 0,4965046 1,103112 0,496505 1,103112Significance F<0,05 (9,2606E-06). Regresorių su reikšmėm P-value >0,05 daugiau nėra. Iš čia seka, kad namų ūkio vartojimo išlaidos priklauso tik nuo disponuojamų pajamų.
Šią priklausomybę aprašo lygtis:Y = 101,49402+0,7998081*X1Y – išlaidos vienam ūkio nariui;X1- namų ūkio disponuojamos pajamos vienam gyventojui.Didžiausios išlaidos, tenkančios vienam ūkio nariui, kai jis gaus didžiausias pajamas. Užrašius regresijos lygtį galima apskaičiuoti, kokios bus išlaidos esant atitinkamoms pajamoms. Taigi didžiausias išlaidas namų ūkio narys patirs tada, kai jis gaus didžiausias pajamas, t.y. 776,- Lt.Y = 101,49402+0,7998081*776,00 = 722,15 LtTaip pat ir mažiausiai pinigų vartojimo išlaidoms namų ūkio narys išleis tada, kai gaus mažiausias pajamas 89,20 Lt.Y = 101,49402+0,7998081*89,20 = 173,84 Lt.
RESIDUAL OUTPUT
Observation Predicted išlaidos vienam gyventojui Residuals 1 237,4614079 260,5385921 2 423,0168972 -123,6835639 …3 172,8369099 -4,43690989 4 363,4311905 6,068809486
5 337,9706313 -74,30396461
6 399,822461 -52,82246105 7 369,4297516 57,57024841 8 275,8521988 -61,10219879 9 271,0533499 -67,05334993 10 270,8533979 -55,10339789 11 342,6361788 59,36382122 12 378,2276412 -57,22764117 13 417,7381635 29,86183653 14 447,4110456 1,838954405 15 370,6294638 -75,87946381 16 437,6133958 -24,36339584 17 326,0401598 -75,2901598 18 403,8215018 2,845164899 19 243,0600649 -10,0600649 20 644,2971503 34,70284972 21 413,8191036 170,6808964 22 516,59445 -138,09445 23 459,4081677 46,09183225 24 304,4453399 -149,9453399 25 418,7512538 -193,7512538 26 393,6905986 147,6427347 27 722,1451429 -192,6451429 28 552,3192138 115,3474529 29 463,8071125 206,1928875 30 562,9833223 217,0166777
Iš grafiko matyti, kad prognozuojamos išlaidos vienam ūkio nariui beveik visada sutampa su pajamomis vienam ūkio nariui.Determinacijos koeficiento įvertisDeterminacijos koeficientas – tai daugiamačio koreliacijos koeficiento kvadratas (R2).Jis turi patekti į intervalą: 0 ≤ R2 ≥ 1.Jis atspindi parinkto modelio tikslumą, t.y. kuo R2 artimesnis 1, tuo parinktas modelis geriau aprašo duomenis.Gavau R2 0,9561. Pagal šį rezultatą galiu spręsti, kad mano pasirinktas modelis gerai aprašo duomenis, kadangi namų ūkio išlaidos 95,61% priklauso nuo namų ūkio pajamų, ir tik 4,39% – nuo kitų faktorių, kurie nebuvo nagrinėti.Regresijos koeficiento reikšmingumo patikrinimas
• Regresijos koeficiento reikšmę (Significance F) reikia palyginti su a = 0,05.• Significance F turi būti mažesnė už 0,05. Tai rodo, kad bent vienas iš tiriamų regresorių yra reikšmingas.
• Reikia atsižvelgti ir į kiekvieno regresoriaus P-value reikšmes. Jei P-value reikšmė didesnė už 0,05, tuomet regresorių galima laikyti nereikšmingu. Tačiau tik tą regresorių, kurio P-value yra didžiausia.• Nereikšmingus regresorius reikia išmetinėti po vieną iš lentelės.• Po to atlikti visas operacijas iš naujo, tol kol Significance F < 0,05 ir kada visos regresorių P-value bus mažesnės už 0,05. Tokiu atveju visi likę regresoriai bus reikšmingi.• Tyrimo metu Significance F buvo visada mažesnė už 0,05 ir toliau atlikinėjant veiksmus jis nuolat mažėjo. O tyrimą atlikinėjau tol, kol X1 (pajamos vienam namų ūkio nariui) P-value reikšmė buvo mažesnė už 0,05. Todėl tik šis regresorius buvo reikšmingas.Regresinė analizė Nr. 2
Šioje kursinio projekto dalyje ištirsiu kuri namų ūkio charakteristika geriausiai nusako šeimos pajamas.Regresinėje analizėje:Y – namų ūkio disponuojamos pajamos;X1 – gyvenamoji vieta:– miestas „1“;– kaimas „2“.X2 – namų ūkio galvos išsimokslinimas:– tik su viduriniu „1“;– kitas išsilavinimas „2“.X3 – pajamų šaltinis:– pajamos susijusios su darbu „1“;– pašalpos, stipendijos ir kt.
Duomenys, reikalingi regresinei analizei atliktiY X1 X2 X3Namų ūkio disponuojamos pajamos Gyvenamoji vieta Pajamų šaltinis Namų ūkio galvos išsimokslinimas170 2 1 21206 1 1 1446 2 2 2655 1 2 2887 1 1 21119 1 2 2335 1 2 2872 1 1 2636 1 2 2847 2 2 2603 2 2 2346 1 2 11977 1 1 11730 1 1 21346 1 1 21681 1 1 21123 1 1 11134 1 1 2708 2 1 22036 1 1 1781 2 2 21038 2 1 2895 1 2 21015 2 1 21190 2 1 11096 1 1 21552 2 2 21691 1 1 2906 1 2 21154 1 1 1
Tikrinam koreliaciją: X1 X2 X3X1 1 X2 0,144338 1 X3 0,222911 0,28957 1Patikrinus koreliaciją gavom, kad koreliacija tarp regresorių neviršija 0,85. Iš čia seka, kad ryšys tarp iksų nestiprus ir regresoriai parinkti gerai.
Tikrinam regresiją:
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,557955R Square 0,311314Adjusted R Square 0,23185Standard Error 415,6145Observations 30
ANOVA df SS MS F Significance FRegression 3 2030164 676721,5 3,917677 0,019659362Residual 26 4491120 172735,4 Total 29 6521284
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 2136,19449 376,9118 5,667624 5,83E-06 1361,441218 2910,948 1361,441 2910,948X1 -218,42432 165,7285 -1,31796 0,19901 -559,084108 122,2355 -559,084 122,2355X2 -400,0247 162,4183 -2,46293 0,02072 -733,880335 -66,1691 -733,88 -66,1691X3 -139,1099 190,9609 -0,72847 0,472835 -531,635668 253,4159 -531,636 253,4159Significance F < 0,05 (0,019659362). Taigi, bent vienas regresorius yra reikšmingas. X3 išmetame, nes jo P-value lygi 0,472835, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,54521294R Square 0,29725715Adjusted R Square 0,24520213Standard Error 411,986416Observations 30
ANOVA df SS MS F Significance FRegression 2 1938498 969249,2 5,710441 0,008545783Residual 27 4582786 169732,8 Total 29 6521284
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 1965,41489 292,5554 6,718094 3,27…E-07 1365,140772 2565,689 1365,141 2565,689X1 -241,51064 161,2502 -1,49774 0,145802 -572,368681 89,3474 -572,369 89,3474X2 -431,59574 155,1631 -2,78156 0,009744 -749,964045 -113,227 -749,964 -113,227Significance F < 0,05 (0,008545783). Taigi, bent vienas regresorius yra reikšmingas. X1 išmetame, nes jo P-value lygi 0,145802, yra didžiausia iš visų reikšmių ir didesnė už 0,05.SUMMARY OUTPUT
Regression StatisticsMultiple R 0,48874501R Square 0,23887169Adjusted R Square 0,21168853Standard Error 421,033339Observations 30
ANOVA df SS MS F Significance FRegression 1 1557750 1557750 8,78749 0,006133847Residual 28 4963534 177269,1 Total 29 6521284
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 1690,3611 232,7349 7,263031 6,6E-08 1213,625215 2167,097 1213,625 2167,097X2 -465,13889 156,9099 -2,96437 0,006134 -786,554165 -143,724 -786,554 -143,724Significance F<0,05 (0,006133847). Regresorių su reikšmėm P-value >0,05 daugiau nėra. Iš čia seka, kad namų ūkio vartojimo išlaidos priklauso tik pajamų šaltinio.
Šią priklausomybę aprašo lygtis:Y = 1690,3611-465,13889*X2Y – namų ūkio disponuojamos pajamos;X2- pajamų šaltinis.Didžiausias pajamas namų ūkiai gauna, kai jų pajamos susijusios su darbu. Užrašius regresijos lygtį galima apskaičiuoti, kokios bus pajamos, kai pajamų šaltinis yra darbas.Y = 1690,3611-465,13889*1 = 1225,22 LtMažiausias pajamas namų ūkiai gauna, kai jų pajamos yra pašalpos, stipendijos ir kt.Y = 1690,3611-465,13889*2 = 760,08 Lt.Skurdo rodiklių įvertinimasApskaičiuojam tokius skurdo rodiklius:• Skurstančiųjų gyventojų lygį šalyje;• Žemų pajamų nuokrypį• Žemų pajamų indeksą;• Kvadratinį skurdo nuokrypį.Tam, kad apskaičiuoti ir įvertinti šiuos pasirinktus rodiklius, reikia rasti pajamas, tenkančias vienam namų ūkio nariui. Namų ūkio dydį vertinsiu pagal paprastąją skalę.
Duomenys, skurdo rodikliams apskaičiuotiNamų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Pajamos vienam namų ūkio nariui (Lt)1 1 170,00 170,00 2 3 1206,00 402,00 3 5 446,00 89,20 4 2 655,00 327,50 5 3 887,00 295,67 6 3 1119,00 373,00 7 1 335,00 335,00 8 4 872,00 218,00 9 3 636,00 212,00 10 4 847,00 211,75 11 2 603,00 301,50 12 1 346,00 346,00 13 5 1977,00 395,40 14 4 1730,00 432,50 15 4 1346,00 336,50 16 4 1681,00 420,25 17 4 1123,00 280,75 18 3 1134,00 378,00 19 4 708,00 177,00 20 3 2036,00 678,67 21 2 781,00 390,50 22 2 1038,00 519,00 23 2 895,00 447,50 24 4 1015,00 253,75 25 3 1190,00 396,67 26 3 1096,00 365,33 27 2 1552,00 776,00 28 3 1691,00 563,67 29 2 906,00 453,00 30 2 1154,00 577,00 Iš viso: 88 31175,00 11.123,10
Vidutinės pajamos vienam namų ūkio nariui gaunamos visas namų ūkių pajamas padalinus iš visų namų ūkių narių sumos, t.y. 31175,00/88 = 354,26Lt.
Skurdo riba nėra duota, todėl ją pasirenku kaip 62 % nuo vidutinių pajamų vienam namų ūkio nariui, t.y. z = 354,26*0.62 = 219,64 Lt.Galima teigti, kad namų ūkiai, kuriuose vienam nariui tenka mažiau nei 219,64 Lt disponuojamų pajamų, yra žemiau skurdo ribos, ir tokių namų ūkių yra 6.Skurstančiųjų gyventojų lygis šalyjeŠį rodiklį, kuris parodo šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos. Jis apskaičiuojamas:L = kur: q – skurstančiųjų gyventojų skaičius; p – visų tiriamų gyventojų skaičius.L = 21/88 = 0,2386Apskaičiavus matyti, kad 23,86% stebimų gyventojų yra skurstantys, jie gyvena žemiau skurdo ribos.Žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo skurdo gilumą.Šį skurdo rodiklį apskaičiuoju pagal formulę:N = = 0,0940kur: yi – i-tojo skurstančiojo pajamos; q – skurstančių tiriamųjų gyventojų skaičius; z – skurdo riba.Vidutiniškai 9.4 % skurstančiųjų pajamos nukrypsta nuo skurdo ribos.Žemų pajamų indeksas – parodo kiek reikia lėšų eliminuoti skurdą šalyje.Šį skurdo rodiklį apskaičiuosime:I = L*N = 0,2386*0,0940 = 0,0224Šis indeksas rodo, kad papildomai reikia 2.24% lėšų, kad panaikinti skurdą stebimuose namų ūkiuose.Kvadratinis skurdo nuokrypis – atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra ypatingai skurstančiųjų žmonių, tuo didesnis bus šis rodiklis.Paskutinįjį skurdą įvertinantį rodiklį apskaičiuoju pagal formulę:Q = ;kur: n – stebimų gyventojų skaičius; z – skurdo riba.Atlikus skaičiavimus gaunu Q = 0.0224Taigi skurdo intensyvumo rodiklis yra 2,24 %. Tai rodo, kad pajamos tarp skurstančiųjų yra pasiskirstę šiuo procentu.Išvados Didžiausią dalį visų namų ūkių užima šeimos po 3 (29%), mažiausiai po 5 (7%) žmones. Daugiausia yra namų ūkių, kurių disponuojamos pajamos vienam namų ūkio nariui yra iki 500Lt (83%). Daugiausia yra namų ūkių, kurių išlaidos vienam namų ūkio nariui yra iki 500 Lt (73%), mažiausiai – kurių išlaidos yra virš 500 Lt (po 27%). Iš grafiko matyti, kad beveik pusės visų namų ūkių išlaidos vienam gyventojui viršija pajamas vienam gyventojui. Daugiausia yra namų ūkių, kurių išlaidos vienam ūkio nariui yra mažos ir vidutiniškos. Patikrinau hipotezes:Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste F