- Įvadas
- 1. Bendra namų ūkio charakteristika – aprašomoji statistika
- 1. Namų ūkio dydis
- 2. Namų ūkio disponuojamos pajamos
- 3. Namų ūkio vartojimo išlaidos
- 2. Skurdo rodiklių įvertinimas
- 3. Išlaidų priklausomybės nuo įvairių faktorių tyrimas (regresinė analizė
- 4. Determinacijos koeficiento įvertis
- 5. Regresijos koeficiento reikšmingumo patikrinimas
- Išvados
Įvadas
Šio kursinio darbo tikslai yra:
1) Aprašyti naudojamus duomenis: namų ūkio dydį, disponuojamas pajamas vienam namų ūkio nariui ir namų ūkio vartojimo išlaidas;
2) Įvertinti skurdo ir nelygybės rodiklius;
3) Atlikti regresinę analizę, ištirti nuo kokių veiksnių priklauso namų ūkių išlaidos, t.y. išsiaiškinti kaip namų ūkio vartojimo išlaidos priklauso nuo pasirinktų veiksnių: gyvenamosios vietos, vaikų iki 18
metų skaičiaus, namų ūkio galvos išsimokslinimo, namų ūkio galvos lyties, namų ūkio socialinės-ekonominės grupės.
4) Nustatyti determinacijos koeficientą;
5) Patikrinti regresijos koeficiento reikšmingumą.
SĄVOKOS, NAUDOJAMOS DARBE
Namų ūkis – tai atskirai gyvenantis vienas asmuo, arba asmenų grupė, kuri gyvena viename name arba bute, turi bendrą biudžetą ir kartu maitinasi. Jei bent vienos iš šių nurodytų sąlygų trūksta, toks asmuo nepriskiriamas prie namų ūkio. Namų ūkiu gali būti:
✓ šeima, susidedanti iš sutuoktinių su vaikais, ar be vaikų; arba vienas iš tėvų su vaikais;
✓ kartu gyvenantys ir bendrą biudžetą turintys giminės;
✓ kartu gyvenantys ir bendrą biudžetą turintys asmenys, kurių nesieja giminystės ryšys.
✓ vieniši asmenys gyvenantys iš savo pajamų;
✓ šeimos, susidedančios iš kelių kartu gyvenančių sutuoktinių porų, turinčių bendrą biudžetą.
Namų ūkio galva – tai asmuo, gaunantis didžiausias pajamas. Kadangi šeimos ūkio narių pajamos gali svyruoti, namų ūkio galva laikomas asmuo, per metus gaunantis didžiausias pajamas. Jei didžiausias pajamas gaunančio asmens išskirti negalima, namų ūkio galva laikomas asmuo, kurį nurodo šeima.
Disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios gautos už darbą, iš ūkininkavimo, verslo, amatų, laisvos profesinės veiklos, o taip pat pensijos, įvairios pašalpos, stipendijos, pajamos iš turto, renta ir kt.
Vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkio poreikiams patenkinti: tai išlaidos maistui, drabužiams, avalynei, būstui, sveikatos priežiūrai, kultūros, poilsio reikmėms ir t.t.
Statistinė hipotezė – bet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes. Išskiriamos parametrinės ar neparametrinės hipotezės.
Skurdo riba – kriterijus, kurio pagalba politikai arba tyrinėtojai suskirsto individus, šeimas arba namų ūkius į skurstančius ir ne.
Pagrindiniai skurdo rodikliai – skurstančiųjų lygis šalyje, žemų pajamų nuokrypis, žemų pajamų indeksas, kvadratinis skurdo nuokrypis.
Determinacijos koeficientas – parodo regresinės lygties adekvatumą, kuris tikrinamas pagal Fišerio kriterijų, reikšmingumas vertinamas pagal
Stjudento kriterijų.
Gyvenimo lygio sąvoka – asmenų ar grupės asmenų gyvenimo lygio sąvoka yra siejama su daugybe įvairių faktorių. Kai kuriuos iš jų lengva išmatuoti, kai kuriuos – ne.
Skurdo sąvoka – daugiaprasmė, ji kinta vystantis visuomenei. Ji skirtingai suprantama atskirose šalyse.
Skurdo riba – kriterijus, kurio pagalba politikai ar tyrinėtojai suskirsto individus, šeimas ir namų ūkius į skurstančius ir neskurstančius.
3 skurdo ribų tipai:
1) Absoliuti. Absoliuti skurdo riba – tai minimalus pajamų ar išlaidų dydis būtinoms vartojimo reikmėms patenkinti.
2) Santykinė . Skurdo riba vadinama santykine, jei skurdo “slenkstis” yra apibrėžiamas siejant su tam tikrais, dažniausiai su pajamų arba išlaidų, šalies vidutiniais rodikliais ir priklauso nuo jų. Iš anksto apibrėžiamas procentas namų ūkių, kuriuos mes norime klasifikuoti kaip skurdžius.
Atitinkamas procentinis pajamų pasiskirstyme ir bus skurdo riba.
3) Subjektyvi (priklauso nuo žmonių nuomonės).
Skaičiuojant namų ūkio rodiklius namų ūkio dydis gali būti vertinamas pagal paprastą ir ekvivalentinę (ODEC) skales.
Ekvivalentinė skalė apibrėžiama taip:
Pirmas suaugęs namų ūkyje – 1,0
Kiekvienas kitas suaugęs namų ūkyje – 0.7
Kiekvienas vaikas (iki 14 metų) – 0.5
Skurstančiųjų gyventojų lygis šalyje – tai rodiklis, parodantis šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos. q – skurstančiųjų gyventojų skaičius. L = q / n
Žemų pajamų nuokrypis – rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo skurdo gilumą. N = 1 / q * ( ((z – yi) / z)
Žemų pajamų indeksas – jis parodo, kiek reikia lėšų norint eliminuoti skurdą šalyje. I = L * N
Kvadratinis skurdo nuokrypis – atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra ypatingai skurstančių žmonių, tuo didesnis bus tas rodiklis.
Duomenys, kurie buvo panaudoti kursiniame projekte:
➢ Gyvenamoji vieta: 1 – 5 didieji miestai (Vilnius, Kaunas,
Klaipėda, Šiauliai, Panevėžys), 2 – kiti mestai, 3 – kaimas.
Miestas-kaimas: 1 – miestas, 2 – kaimas.
➢ Namų ūkiai su skirtingu skaičiumi vaikų: 1 – namų ūkis su 1 vaiku iki 18 metų, 2 – namų ūkis su 2 vaikais iki 18 metų, 3 – namų ūkis be vaikų.
➢ Namų ūkio galvos išsimokslinimas: 1 – neturi pradinio, 2 –
pradinis, 3 – pagrindinis, 4 – bendras vidurinis, 5 – aukštesnysis,
6 – aukštasis.
➢ Namų ūkio galvos socialinė – ekonominė grupė: 1 – ūkininkai, 2 –
samdomieji darbuotojai, 3 – verslininkai, 4 – pensininkai, 5 –
kita.
➢ Namų ūkio galvos lytis: 1 – vyras, 2 – moteris.
1. Bendra namų ūkio charakteristika – aprašomoji statistika
|Namų ūkio |Namų ūkio |Namų ūkio |Namų ūkio |
|eilės Nr. |dydis |disponuojamos |vartojimo išlaidos|
| | |pajamos | |
|1476 |1 |700 |675,76 |
|1477 |3 |768,25 |731,87 |
|1478 |1 |407,74 |458,77 |
|1479 |3 |265,14 |436,23 |
|1480 |2 |868,91 |875,04 |
|1481 |3 |1406,92 |1050,97 |
|1482 |1 |433,1 |458,51 |
|1483 |1 |2798,4 |2185,27 |
|1484 |3 |1126,3 |592,49 |
|1485 |6 |1780 |908,91 |
|1486 |2 |700 |701,4 |
|1487 |1 |553,44 |615,22 |
|1488 |3 |1070,66 |805,9 |
|1489 |1 |397,37 |680,15 |
|1490 |2 |1052 |1274,51 |
|1491 |2 |867,44 |1429,84 |
|1492 |3 |770,99 |379,18 |
|1493 |3 |1019,21 |2089,66 |
|1494 |2 |1052,26 |837,24 |
|1495 |3 |715,42 |823,48 |
|1496 |2 |3952,02 |774,62 |
|1497 |5 |766,85 |988,92 |
|1498 |1 |439,01 |468,78 |
|1499 |3 |1588,63 |812,57 |
|1500 |3 |1902,79 |1425,47 |
|iš viso |60 |27402,85 |22480,76 |
Kiekybinės namų ūkio charakteristikos: namų ūkio dydis, namų ūkio disponuojamos pajamos ir vartojimo išlaidos. Duomenys išdėstyti trim stulpeliais.
Tam, kad atlikti duomenų aprašomąją charakteristiką, reikia naudoti MS
Excel programoje esantį posistemį Tools – Data Analysis ir pasirenkame
Descriptive statistics – aprašomoji statistika, atsidariusiame lange pažymime summary statistic – “statistikos suvestinė”. Gauname lentelę su šių trijų dydžių pagrindinėmis statistinėmis charakteristikomis:
| |Namų ūkio |Namų ūkio |Namų ūkio |
| |dydis |disponuojamos|vartojimo |
| | |pajamos |išlaidos |
|Vidurkis |2,64 |968,554 |970,0936 |
|Standartinė paklaida |0,190438 |136,3377902 |104,18779 |
|Mediana |3 |837,21 |965,73 |
|Moda |3 |negalima |negalima |
|Vidutinis kvadratinis |0,95219 |681,6889508 |520,93893 |
|nuokrypis | | | |
|Dispersija |0,906667 |464699,8256 |271377,37 |
|Eksceso koeficientas |-0,79102 |7,999375094 |0,0446104 |
|Asimetrijos |-0,12238 |2,474248948 |0,6927811 |
|koeficientas | | | |
|Duomenų plotis |3 |3262,44 |1955,62 |
|Minimali reikšmė |1 |277,34 |296,24 |
|Maksimali reikšmė |4 |3539,78 |2251,86 |
|Suma |66 |24213,85 |24252,34 |
|Duomenų skaičius |25 |25 |25 |
Labiausiai statistikoje vartojamos šios charakteristikos:
• Vidurkis – tai visų skaitinių duomenų suma, padalinta iš duomenų skaičiaus.
• Dispersija – tai išsibarstymo apie vidurkį matas. Tai skirtumų tarp stebėtų duomenų reikšmių ir vidurkio kvadratų vidurkis.
• Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.
• Mediana – tai vidurinis duomuo stebėjimų sekoje, išdėstytoje didėjimo tvarka. Medianos numeris skaičiuojamas pagal formulę: (n+1)/2, kur n –
duomenų skaičius. Jeigu turime lyginį stebėjimų skaičių, medianos numeris bus trupmeninis, t.y. viduriniai duomenys yra du, todėl mediana tokiu atveju randama kaip dviejų vidurinių duomenų vidurkis.
• Moda – tai reikšmė, kuri pasikartoja dažniausiai. Jeigu visi duomenys pasikartoja po vieną kartą, tai modos rasti yra negalima.
• Eksceso koeficientas – tai lėkštumo matas. Kai jis didesnis už 0, duomenų sklaida apie tą vidurkį yra didesnė, nei normaliosios kreivės.
Kai mažesnis už 0, duomenų sklaida apie tą vidurkį yra mažesnė, nei normaliosios kreivės, ir kai lygi 0, sklaida apie vidurkį yra normaliosios kreivės.
• Asimetrijos koeficientas – tai simetrijos matas. Kai jis mažesnis už
0, asimetrija neigiama – kairioji. Kai lygus 0 – simetriška, ir kai daugiau už 0 – asimetrija teigiama (dešinioji).
• Duomenų plotis – maksimalios ir minimalios reikšmių skirtumas.
• Maksimali reikšmė – didžiausia reikšmė imtyje.
• Minimali reikšmė – mažiausia reikšmė imtyje.
• Suma – visų imties narių suma.
Namų ūkio dydis
Šioje statistikos lentelėje vidutinis namų ūkio dydis yra 2,64 žmogaus.
Mediana lygi 3, vadinasi, vidurinis duomuo lygus 3. Moda – 3, tai reiškia, kad dažniausiai pasikartoja skaičius 3. Dispersija yra 0,91, o vidutinis kvadratinis nuokrypis 0,95. pasiskirstymas – asimetrinis (asimetrija neigiama, kairioji). Skirtumas tarp maksimumo ir minimumo, t.y. duomenų plotis yra 3. Minimali stebėta reikšmė – 1, maksimali – 4. Duomenų suma yra
66. Iš viso buvo 25 stebėjimai.
Iš pateiktos statistikos matome, kad nagrinėjama 25 namų ūkiai.
Mieste 17 ūkių
Kaime 8 ūkiai.
Didžioji dalis nagrinėjamų namų ūkių yra miestuose – 68%.
[pic]
Nagrinėdami namų ūkius pagal socialinę – ekonominę grupę:
Ūkininkai – 1
Samdomieji darbuotojai – 16
Verslininkai – 2
Pensininkai – 4
Kiti – 2
Daugiausiai pagal socialinę – ekonominę grupę sudaro samdomieji darbininkai
– 44%.
[pic]
Didžiausias namų ūkis yra 6 asmenų. Viso tokių ūkių yra 1, gyvenantis kaime
Mažiausias namų ūkis statistikoje yra 1 namų ūkio nario. Tokių ūkių yra 7, iš jų 6 jų yra mieste, ir 1 gyvena mieste. Didžiausią procentą namų ūkių sudaro 3 asmenų namų ūkiai – 40%, kurių 7 gyvena mieste, 3 – kaime.
Pagal namų ūkių galvos amžių statistiką galime paskirstyti tokiu būdu:
Iki 30 metų 4
30-39 metai 4
40-49 metai 7
50-59 metai 6
60 metų ir daugiau 4
Didžiausią dalį – 36% visų namų ūkių šeimos galva yra 60 ir daugiau metų.
[pic]
Pagal statistinius duomenis ūkiai gauna pajamas tik iš šių sektorių:
➢ Darbas asmeniniame žemės ūkyje 1
➢ Pensija
4
➢ Samdomas darbas ne ž.ū. visuomeniniame sektoriuje 5
➢ Samdomas darbas ne ž.ū. privačiame sektoriuje 11
➢ Stipendija
1
➢ Pajamos iš verslo, amatų
2
➢ Kitas pajamų šaltinis
1
Didžiausią dalį (44%) pajamų ūkiai uždirba iš samdomo darbo ne ž.ū.
privačiame sektoriuje. Statistikos ūkiai negauna pajamų iš samdomo darbo ž.ū. visuomeniniame ir privačiame sektoriuje, bedarbio pašalpos, laisvos profesinės veiklos, socialinių pašalpų, nėra išlaikytinių.
[pic]
Namų ūkio disponuojamos pajamos
Vidutinės namų ūkio disponuojamos pajamos stebėjimuose yra 968,55Lt.
Mediana lygi 837,21, t.y. vidurinis duomuo lygus 837,21. Modos nėra, tai reiškia, kad visi stebėjimai pasikartoja po vieną kartą. Dispersija lygi
464699,83, o vidurinis kvadratinis nuokrypis 681,69. Pasiskirstymas –
asimetrinis, (asimetrija teigiama, dešinioji). Duomenų plotis, t.y.
skirtumas tarp maksimumo ir minimumo, yra 3262,44. Minimali stebėta reikšmė yra 277,34, maksimali – 3539,78. Duomenų suma yra 24213,85, iš viso – 25
stebėjimai.
Namų ūkio vartojimo išlaidos
Vidutinės namų ūkių vartojimo išlaidos statistikoje yra 970,0936 Lt.
Mediana (vidurinis duomuo) lygi 965,73. Modos nėra, tai reiškia, kad visi stebėjimai pasikartoja po vieną kartą. Dispersija yra 271377,37, o vidutinis kvadratinis nuokrypis – 520,94. pasiskirstymas – asimetrinis.
Skirtumas tarp maksimumo ir minimumo, t.y. duomenų plotis yra 1955,62.
Minimali reikšmė – 296,24, maksimali – 2251,86. Duomenų suma yra 24252,34, iš viso turime 25 stebėjimai.
2. Skurdo rodiklių įvertinimas
Apskaičiuosiu 3 skurdo rodiklius:
1. Skurstančiųjų gyventojų lygį šalyje;
2. Žemų pajamų nuokrypį (skurdo gylį);
3. Žemų pajamų indeksą;
4. Kvadratinis skurdo nuokrypis.
Tam, kad galėčiau apskaičiuoti šiuos rodiklius, reikia apskaičiuoti pajamas vienam namų ūkio nariui, kurios gaunamos namų ūkio disponuojamas pajamas padalinus iš namų ūkio dydžio. Sudėjus visas namų ūkio disponuojamas pajamas, ir padalinus jas iš namų ūkio dydžio sumos, gausiu vidutines pajamas vienam namų ūkio nariui. Pajamos vienam namų ūkio nariui skaičiuojamos darant prielaidą, kad namų ūkio narių svoriai lygūs. Skurdo ribą pasirenku 55( nuo vidutinių pajamų vienam namų ūkio nariui.
|Namų ūkio |Namų ūkio |Pajamos vienam namų ūkio |
|dydis |disponuojamos |nariui |
| |pajamos | |
|1 |700,00 Lt |700,00 Lt |
|3 |768,25 Lt |256,08 Lt |
|1 |407,74 Lt |407,74 Lt |
|3 |265,14 Lt |88,38 Lt |
|2 |868,91 Lt |434,46 Lt |
|3 |1.406,92 Lt |468,97 Lt |
|1 |433,10 Lt |433,10 Lt |
|1 |2.798,40 Lt |2.798,40 Lt |
|3 |1.126,30 Lt |375,43 Lt |
|6 |1.780,00 Lt |296,67 Lt |
|2 |700,00 Lt |350,00 Lt |
|1 |553,44 Lt |553,44 Lt |
|3 |1.070,66 Lt |356,89 Lt |
|1 |397,37 Lt |397,37 Lt |
|2 |1.052,00 Lt |526,00 Lt |
|2 |867,44 Lt |433,72 Lt |
|3 |770,99 Lt |257,00 Lt |
|3 |1.019,21 Lt |339,74 Lt |
|2 |1.052,26 Lt |526,13 Lt |
|3 |715,42 Lt |238,47 Lt |
|2 |3.952,02 Lt |1.976,01 Lt |
|5 |766,85 Lt |153,37 Lt |
|1 |439,01 Lt |439,01 Lt |
|3 |1.588,63 Lt |529,54 Lt |
|3 |1.902,79 Lt |634,26 Lt |
|60 |27.402,85 Lt |13.970,18 Lt |
Skurdo riba yra: 27.402,85/60*0,55(251.19 Lt.
1. Skurstančiųjų gyventojų lygis šalyje:
q – skurstančiųjų gyventojų skaičius;
n – visų gyventojų skaičius
11 žmonių yra žemiau skurdo ribos, jų pajamos mažesnės, nei 251.19 Lt.
L(q/n ( 11/60 = 0,18333
Išvada: yra 18,33% gyventojų, kurių pajamos žemiau skurdo ribos.
2. Žemų pajamų nuokrypis (skurdo lygis)
Yi – i-tojo skurstančiojo pajamos;
Z – skurdo riba.
[pic]
N = 0,367592
3. Žemų pajamų indeksas
I = L* N
I = 0,18333*0,367592 = 0,0673918
4. Kvadratinis skurdo nuokrypis [pic]
yi – i-ojo skurstančiojo pajamos z – skurdo riba k – asmenų suma namų ūkyje n – ištirtas žmonių skaičius
Q = 0,033771185
3. Išlaidų priklausomybės nuo įvairių faktorių tyrimas (regresinė analizė
Regresinės analizės tikslas – ištirti, kaip namų ūkio vartojimo išlaidos priklauso nuo pasirinktų veiksnių. Pasirinkti veiksniai: vaikų skaičius iki
18 metų, namų ūkio galvos išsimokslinimas, namų ūkio galvos lytis, socialinė-ekonominė grupė ir namų ūkio gyvenamoji vieta (miestas-kaimas).
| |Y |X1 |X2 |X3 |X4 |X5 | |Namų ūkio dydis |Namų ūkio vartojimo išlaidos |Namų ūkio vartojimo išlaidos 1gyv. |Vaikų iki 18 metų skaičius
|Namų ūkio galvos soc-ek.grupė (1-samdomi darbininkai; 0-kita) |Namų ūkio galvos išsimokslinimas (1-bendras vidurinis; 0-kitas) |Gyvenamoji vieta (1-
miestas; 0- kaimas) |Pagal galvos lytį (1-vyras; 0-moteris) | |1 |675,76 Lt
|675,76 Lt |0 |0 |0 |1 |0 | |3 |731,87 Lt |243,96 Lt |0 |0 |0 |1 |1 | |1
|458,77 Lt |458,77 Lt |0 |1 |0 |1 |1 | |3 |436,23 Lt |145,41 Lt |1 |0 |1 |1
|0 | |2 |875,04 Lt |437,52 Lt |0 |1 |0 |1 |0 | |3 |1.050,97 Lt |350,32 Lt
|1 |1 |0 |1 |1 | |1 |458,51 Lt |458,51 Lt |0 |1 |1 |1 |0 | |1 |2.185,27 Lt
|2.185,27 Lt |0 |1 |0 |1 |0 | |3 |592,49 Lt |197,50 Lt |1 |1 |0 |0 |0 | |6
|908,91 Lt |151,49 Lt |1 |1 |1 |0 |1 | |2 |701,40 Lt |350,70 Lt |1 |1 |0 |1
|0 | |1 |615,22 Lt |615,22 Lt |0 |0 |0 |0 |0 | |3 |805,90 Lt |268,63 Lt |0
|1 |0 |1 |1 | |1 |680,15 Lt |680,15 Lt |0 |0 |1 |1 |0 | |2 |1.274,51 Lt
|637,26 Lt |0 |1 |1 |1 |1 | |2 |1.429,84 Lt |714,92 Lt |0 |1 |0 |1 |1 | |3
|379,18 Lt |126,39 Lt |0 |1 |0 |1 |0 | |3 |2.089,66 Lt |696,55 Lt |1 |1 |1
|1 |1 | |2 |837,24 Lt |418,62 Lt |0 |1 |1 |0 |1 | |3 |823,48 Lt |274,49 Lt
|1 |0 |1 |0 |0 | |2 |774,62 Lt |387,31 Lt |0 |0 |0 |0 |1 | |5 |988,92 Lt
|197,78 Lt |1 |0 |0 |0 |1 | |1 |468,78 Lt |468,78 Lt |0 |0 |0 |1 |0 | |3
|812,57 Lt |270,86 Lt |0 |1 |0 |1 |1 | |3 |1.425,47 Lt |475,16 Lt |0 |1 |0
|0 |1 | |
Tikslas – ištirti priklausomybę Y nuo X1,…X5 ir atrinkti reikšmingus Xi (i = 1,2,3,4,5). Pasirinkau tokį modelį, nes manau, kad šie regresoriai labiausiai įtakoja išlaidas. Norint nustatyti kuris iš pasirinktų veiksnių yra reikšmingiausias, t.y. labiausiai įtakoja namų ūkio vartojimo išlaidas,
EXCEL programoje reikia atlikti šiuos veiksmus: Tools – Data Analysis –
Regression.
Gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,57934 | | | | | | | | |R Square |0,335635
| | | | | | | | |Adjusted R Square |0,160802 | | | | | | | | |Standard
Error |217,3284 | | | | | | | | |Observations |25 | | | | | | | | | | | | |
| | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F |Significance F | | |
| |Regression |5 |453363 |90672,61 |1,919744 |0,138239 | | | | |Residual
|19 |897400,8 |47231,62 | | | | | | |Total |24 |1350764 | | | | | | |
| | | | | | | | | | | |Coefficients |Standard Error |t Stat |P-value
|Lower 95% |Upper 95% |Lower 95,0% |Upper 95,0% | |Intercept |463,817
|130,4778 |3,554757 |0,002115 |190,7237 |736,9103 |190,7237 |736,9103 |
|X1vaikų sk. |-212,674 |71,4593 |-2,97615 |0,007761 |-362,24 |-63,1078 |-
362,24 |-63,1078 | |X2soc.ekon.grupė |157,7732 |111,3146 |1,417364
|0,172567 |-75,2109 |390,7573 |-75,2109 |390,7573 | |X3išsilavinimas |-
63,5748 |127,2557 |-0,49958 |0,623104 |-329,924 |202,7744 |-329,924
|202,7744 | |X4gyv.vieta |-43,9292 |95,92468 |-0,45796 |0,652179 |-244,702
|156,8435 |-244,702 |156,8435 | |X5galvos lytis |48,9799 |103,286 |0,474216
|0,64075 |-167,2 |265,16 |-167,2 |265,16 | |
Tiriamųjų veiksnių P-value reikšmė turi būti mažesnė už mano pasirinktą reikšmingumo lygmenį α = 0,05. Taigi atliekame tyrimą, kol nebelieka koeficiento, kurio P-value reikšmė didesnė už α.
Y (vartojimo išlaidos) = 463,817-212,674X1 + 157,7732X2 -63,5748X3-
43,9292X4 + 48,9799X5
X4 (gyvenamoji vieta) P-value 0,652179> 0,05
Pagal gautus lentelių duomenis tyrimo ketvirčio (X4) P-value reikšmė lygi 0,652179 yra didžiausia, vadinasi jis nereikšmingas ir nuo jo nepriklauso namų ūkio vartojimo išlaidos. Toliau tyrimas vyksta be galvos lyties stulpelio lentelėje.
Significance F<α (0,138239<0,05), vadinasi bent vienas regresorius yra reikšmingas.
Sudarome naują lentelę (tik be X4) ir pakartojame operacijas iš naujo
Excel→Tools→Data Analyses→Regresion. Gauname:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,572976 | | | | | | | | |R Square
|0,328301 | | | | | | | | |Adjusted R Square |0,193962 | | | | | | | |
|Standard Error |212,9914 | | | | | | | | |Observations |25 | | | | | | | |
| | | | | | | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F
|Significance F | | | | |Regression |4 |443457,5 |110864,4 |2,443813
|0,080075 | | | | |Residual |20 |907306,4 |45365,32 | | | | | | |Total
|24 |1350764 | | | | | | | | | | | | | | | | | | |Coefficients
|Standard Error |t Stat |P-value |Lower 95% |Upper 95% |Lower 95,0% |Upper
95,0% | |Intercept |426,7357 |100,2719 |4,255785 |0,000387 |217,5723
|635,8992 |217,5723 |635,8992 | |X1vaikų sk. |-214,674 |69,90237 |-3,07105
|0,006027 |-360,487 |-68,86 |-360,487 |-68,86 | |X2soc.ekon.grupė |176,7797
|101,2269 |1,746371 |0,096089 |-34,3758 |387,9352 |-34,3758 |387,9352 |
|X3išsilavinimas |-52,3313 |122,373 |-0,42764 |0,673484 |-307,597 |202,9342
|-307,597 |202,9342 | |X5galvos lytis |53,21243 |100,8187 |0,527803
|0,603443 |-157,092 |263,5165 |-157,092 |263,5165 | |
Y (vartojimo išlaidos) = 426,7357-214,674X1 +176,7797X2-52,3313X3+
53,21243X5
X3 (išsilavinimas) P-value 0,673484> 0,05
Pagal gautus iš lentelių rezultatus, gyvenamosios vietos (X4) P-value reikšmė lygi 0,673484. Ji yra didžiausia iš visų P-value reikšmių, todėl toliau tyrimas atliekamas be šio veiksnio ir jis laikomas nereikšmingu.
Significance F<α (0,080075<0,05), vadinasi bent vienas regresorius yra reikšmingas.
Toliau pasinaudojant tomis pačiomis EXCEL operacijomis, gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,567591 | | | | | | | | |R Square
|0,322159 | | | | | | | | |Adjusted R Square |0,225325 | | | | | | | |
|Standard Error |208,8064 | | | | | | | | |Observations |25 | | | | | | | |
| | | | | | | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F
|Significance F | | | | |Regression |3 |435161,3 |145053,8 |3,326912
|0,039304 | | | | |Residual |21 |915602,5 |43600,12 | | | | | | |Total
|24 |1350764 | | | | | | | | | | | | | | | | | | |Coefficients
|Standard Error |t Stat |P-value |Lower 95% |Upper 95% |Lower 95,0% |Upper
95,0% | |Intercept |397,1477 |71,1501 |5,58183 |1,54E-05 |249,183 |545,1125
|249,183 |545,1125 | |X1vaikų sk. |-206,88 |66,15905 |-3,12702 |0,005095 |-
344,466 |-69,2951 |-344,466 |-69,2951 | |X2soc.ekon.grupė |180,3941
|98,89142 |1,824164 |0,082391 |-25,2619 |386,0501 |-25,2619 |386,0501 |
|X5galvos lytis |71,6689 |89,32347 |0,802352 |0,431336 |-114,089 |257,4273
|-114,089 |257,4273 | |
Y (vartojimo išlaidos)= 397,1477 -206,88X1 + 180,3941X2 +71,6689X5
X5 (galvos lytis) P-value 0,431336> 0,05
Pagal gautus iš lentelių rezultatus, išsilavinimas (X5) P-value reikšmė lygi 0,431336. Ji yra didžiausia iš visų P-value reikšmių, todėl toliau tyrimas atliekamas be šio veiksnio ir jis laikomas nereikšmingu.
Significance F<α(0,039304<0,05), vadinasi bent vienas regresorius yra reikšmingas. Toliau pasinaudojant tomis pačiomis EXCEL operacijomis, gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,548981 | | | | | | | | |R Square |0,30138
| | | | | | | | |Adjusted R Square |0,237869 | | | | | | | | |Standard
Error |207,109 | | | | | | | | |Observations |25 | | | | | | | | | | | | |
| | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F |Significance F | | |
| |Regression |2 |407092,9 |203546,5 |4,745322 |0,019349 | | | | |Residual
|22 |943671 |42894,13 | | | | | | |Total |24 |1350764 | | | | | | | |
| | | | | | | | | | |Coefficients |Standard Error |t Stat |P-value |Lower
95% |Upper 95% |Lower 95,0% |Upper 95,0% | |Intercept |430,758 |57,04417
|7,551305 |1,52E-07 |312,4555 |549,0605 |312,4555 |549,0605 | |X1vaikų sk.
|-196,501 |64,35451 |-3,05341 |0,005825 |-329,964 |-63,0376 |-329,964 |-
63,0376 | |X2soc.ekon.grupė |188,5271 |97,57088 |1,932206 |0,066313 |-
13,8228 |390,8769 |-13,8228 |390,8769 | |
Y (vartojimo išlaidos)= 430,758 -196,501X1 + 188,5271X2
X2 (socialinė-ekonominė grupė) P-value 0,066313>0,05
Pagal gautus iš lentelių rezultatus, išsilavinimas (X2) P-value reikšmė lygi 0,066313. Ji yra didžiausia iš visų P-value reikšmių, todėl toliau tyrimas atliekamas be šio veiksnio ir jis laikomas nereikšmingu.
Significance F<α(0,019349<0,05), vadinasi bent vienas regresorius yra reikšmingas. Toliau pasinaudojant tomis pačiomis EXCEL operacijomis, gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,427578 | | | | | | | | |R Square
|0,182823 | | | | | | | | |Adjusted R Square |0,147294 | | | | | | | |
|Standard Error |219,0705 | | | | | | | | |Observations |25 | | | | | | | |
| | | | | | | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F
|Significance F | | | | |Regression |1 |246951 |246951 |5,145686 |0,033004
| | | | |Residual |23 |1103813 |47991,86 | | | | | | |Total |24 |1350764
| | | | | | | | | | | | | | | | | | |Coefficients |Standard Error |t
Stat |P-value |Lower 95% |Upper 95% |Lower 95,0% |Upper 95,0% | |Intercept
|477,6235 |54,61268 |8,745651 |8,99E-09 |364,6487 |590,5982 |364,6487
|590,5982 | |X1vaikų sk. |-132,061 |58,21732 |-2,26841 |0,033004 |-252,492
|-11,6292 |-252,492 |-11,6292 | |
Y (vartojimo išlaidos)= 477,6235-132,061X1
X1 (vaikų skaičius) P-value 0,033004<0,05
Pagal gautus iš lentelių rezultatus, vaikų skaičius (X1) P-value reikšmė lygi 0,033004 ir ji mažesnė už 0,05, daugiau tyrimas neatliekamas.
Vartojimo išlaidų priklausomybę nuo namų ūkių vaikų skaičiaus aprašo lygtis:
Y = 477,6235-132,061X1
Y – išlaidos vienam namų ūkio nariui, Lt;
X1 – vaikų skaičius iki 18 metų;
Didžiausios išlaidos, tenkančios vienam namų ūkio nariui bus tada, kai vaikų skaičius iki 18 metų bus mažiausias:
Y= 477,6235-132,061*0 =477,6235Lt.
Mažiausios išlaidos, tenkančios vienam namų ūkio nariui bus tada, kai namų ūkį sudarys daugiausiai asmenų:
Y = 477,6235-132,061* 2=213.5015 Lt.
Remiantis gautais rezultatais, galima padaryti išvadą, kad namų ūkio vartojimo išlaidos nepriklauso nuo gyvenamosios vietos, namų ūkio galvos išsimokslinimo, namų ūkio galvos lyties ir socialinės-ekonominės grupės.
4. Determinacijos koeficiento įvertis
Determinacijos koeficientas parodo, kaip gerai mano pasirinktas modelis aprašo duomenis. Determinacijos koeficientas gali priimti tokias reikšmes: 0 ≤ R² ≤ 1. Kuo R² yra arčiau 1, tuo mano pasirinktas modelis geriau aprašo duomenis.
Gaunu, kad R² = 0,182823. Tai reiškia, kad vartojimo išlaidos 18,28%
priklauso nuo disponuojamų pajamų, ir 81,77% nuo kitų, neįvertintų reikšmių.
5. Regresijos koeficiento reikšmingumo patikrinimas
Regresijos koeficiento reikšmingumas tikrinamas pagal Fišerio kriterijų (F). Jis gaunamas iš EXCEL programos panaudojant operacijas Tools
– Data Analysis – Regression. Jis nurodytas lentelėse Significance F.
Toliau lyginamas su reikšmingumo lygmeniu (α = 0,05) ir, kuo šis kriterijus mažesnis, jis neturi viršyti 0,05, tuo regresijos lygtis adekvatesnė realiai padėčiai. Jeigu reikšmingumo lygmuo ά = 0,05 ir Significance
F<0,05, galima padaryti išvadą, kad bent vienas iš Xi yra reikšmingas namų ūkio vartojimo išlaidoms. Pagal gautus regresinės analizės rezultatus reikšmingas faktorius yra vaikų iki 18 metų skaičius, o nereikšmingi: namų ūkio socialinės-ekonominės grupė, gyvenamoji vieta, namų ūkio galvos išsilavinimas, namų ūkio galvos lytis.
Išvados
Atlikus tyrimus, buvo nustatyta, kad reikšmingiausi faktoriai, turintys įtaką išlaidoms, yra vaikų iki 18 metų skaičius ir ekonominė-
socialinė grupė.
Įvertinus skurdo rodiklius buvo gauti tokie rezultatai:
L = 0,18333;
N = 0,367592;
I = 0,0673918;
Q = 0,033771185
4. Atlikus regresinę analizę buvo gauta regresijos lygtis:
Y (vartojimo išlaidos) = 477,6235-132,061X1
5. Išlaidos vienam namų ūkio nariui priklauso nuo vaikų skaičiaus iki 18
metų. Vartojimo išlaidoms vienam namų ūkio nariui visiškai neturi šie faktoriai: gyvenamoji vieta, socialinės-ekonominės grupės, namų ūkio galvos išsilavinimas bei namų ūkio galvos lyties.