Turinys
Įvadas……………………………………………………………………………………………………………..31. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA…………………………………………….81.1. Kiekybiniai duomenys………………………………………………………………………………………………81.2. Kokybiniai duomenys………………………………………………………………………………………………….102. Vieno namų ūkio nario vidutinis pajamų pasiskirstymas………………………………….143. Vieno šeimos nario išlaidų kaime ir mieste palyginimas………………………………….174. Patikrinimas: ar namų ūkio santaupos didėja………………………………………………….215. Skurdo rodiklių įvertinimas………………………………………………………………………….226. Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas…………..256.1. Lorenco kreivė……………………………………………………………………………………………………………256.2. Gini koeficientas…………………………………………………………………………………………………………267. Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas………278. Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas……………………………………………………………………349. Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas…….38Išvados………………………………………………………………………………………………………….42ĮvadasTerminas „ūkio statistika“ yra termino „ekonominė statistika“ atitikmuo.Ūkio statistika:• tiria ūkinių procesų ir reiškinių kiekybę;• pateikia statistinių tyrimų atlikimo metodiką;• pateikia matų sistemą konkretiems reiškiniams ir procesams apibūdinti. Tam naudojami kompleksiniai reiškinių analizės būdai.• supažindina su statistinių metodų ir ekonometrinių modelių taikymo ūkiniams procesams analizuoti metodika.
Ekonometrija tai atskira disciplina, kuri apjungia teorinius rezultatus, metodus, modelius skirtus suteikti konkrečias skaitines reikšmes ekonominiams reiškiniams naudojantis: • ekonomikos teorija;• ekonometrinė statistika;• matematiniais statistiniais metodais.
Ekonometrija yra tarpinis ekonomikos, statistikos ir matematikos mokslas, t.y. mokslas, kuris nustato empirinius ekonomikos dėsnius. Nagrinėjami stebėjimo duomenys, kurių pagrindu gaunamos kiekybinės ekonominių santykių išraiškos (priklausomybės), kuriami ekonominiai modeliai, įvertinami nežinomi jų parametrai, skaičiuojamos prognozės.
Ekonometrijos tikslai:• ekonominių ir socialinių rodiklių analizė; • rodiklių prognozė;• šalies socialinio-ekonominio vystymosi imitavimas.
Šio kursinio darbo tikslai ir uždaviniai:1. pateikti bendrą namų ūkių charakteristiką (aprašomoji statistika);2. įvertinti vieno namų ūkio nario vidutinių pajamų pasiskirstymą;3. patikrinti ar skiriasi vieno šeimos nario išlaidos kaime ir mieste; 4. patikrinti ar namų ūkių santaupos didėja;5. įvertinti skurdo rodiklius;6. išanalizuoti namų ūkių nelygybę: Gini koeficientas, Lorenco kreivė;7. ištirti išlaidų priklausomybę nuo kitų įvairių faktorių (regresinė analizė);8. nustatyti, ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas;9. įvertinti pajamų, išlaidų, namų ūkio dydžio koreliaciją ir jos reikšmingumą.
Šiame kursiniame darbe yra vartojamos tokios pagrindinės sąvokos:Namų ūkis – tai gali būti:• atskirai gyvenantis vienas asmuo;• asmenų grupė, gyvenanti viename bute ar name ir turinti bendrą biudžetą.
Beje, asmenys, gyvenantys instituciniuose namų ūkiuose, nėra tiriami. Tai gali būti: senelių namai, įkalinimo įstaigos ir pan.
Namų ūkio galva – tai asmuo, turintis didžiausias pajamas. Tiksliau tariant, tai asmuo, kuris, ūkio narių nuomone, per metus gauna didžiausias pajamas. Tačiau kai didžiausias pajamas gaunančio asmens išskirti negalima (pvz., visa šeima ūkininkauja ir pajamų negalima priskirti kuriam nors ūkio nariui), namų ūkio galva laikomas asmuo, kurį nurodo šeima.
Namų ūkio galvos socialinė-ekonominė grupė:• ūkininkai (namų ūkio galvos pagrindinis pajamų šaltinis yra asmeninis žemės ūkis);• samdomieji darbuotojai (namų ūki galvos pagrindinis pajamų šaltinis yra samdomas darbas visuomeniniame arba privačiame sektoriuje);• verslininkai (namų ūkio galvos pajamos yra iš verslo, amatų, laisvos profesinės veiklos);• pensininkai (namų ūkio galvos pajamos yra pensija);• kiti (namų ūkio galvos pagrindinis pajamų šaltinis yra įvairios pašalpos, stipendija, pajamos iš turto bei kiti pajamų šaltiniai).
Namų ūkio tipas. Jis nustatomas pagal namų ūkio demografinę sudėtį. Išskiriami šie tipai:• vienišas asmuo;• vienas suaugęs asmuo su vaikais iki 18 m.;• sutuoktinių pora su vaikais iki 18 m.;• kiti namų ūkiai su vaikais iki 18 m. Šiam tipui priklauso namų ūkiai, kuriuos sudaro tėvai su vaikais iki 18 m. ir vyresniais, kelių kartų namų ūkiai su vaikais iki 18 metų, seneliai su anūkais iki 18 metų ir pan.;• sutuoktinių pora be vaikų;• kiti namų ūkiai be vaikų.
Tačiau šiame kursiniame darbe nagrinėjami šie namų ūkio tipai:• namų ūkis su vaikais 18 metų;• namų ūkis be vaikų iki 18 metų.
Disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios gali būti gaunamos:• už darbą,• iš ūkininkavimo,• iš verslo,• iš amatų,• iš laisvos profesinės veiklos,• taip pat pensijos, įvairios pašalpos, stipendijos,• pajamos iš turto, re…nta ir t.t.
Vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkio vartojimo poreikiams patenkinti, t.y. išlaidos:• maistui• būstui• drabužiams• sveikatos priežiūrai ir t.t.
Skurdo riba – tai kriterijus, kurio pagalba analitikai suskirsto individus, šeimas, namų ūkius į:• skurstančiuosius;• neskurstančiuosius.
Reikia atkreipti dėmesį į tai jog skurdo sąvoka yra daugiaprasmė ir kinta vystantis visuomenei, taip pat gali būti labai skirtingai suprantama įvairiose šalyse. Tarkim Europos Konsiliume 1984 m. lapkričio 19 dieną skurdo sąvoka buvo apibrėžta taip: „skurdžiais vadinami asmenys, šeimos, asmenų grupės, kurių ištekliai (materialiniai, kultūriniai ir socialiniai) yra nepakankami savo šalyje susiklosčiusiam minimaliam gyvenimo būdui užtikrinti.
Yra išskiriami 3 skurdo ribų tipai:1. Absoliuti- tai minimalus pajamų ar išlaidų dydis būtinoms reikmėms patenkinti (Lietuvoj-MGL).2. Santykinė- skurdo slenkstis siejamos su šalies vidutiniais pajamų/išlaidų rodikliais ir priklauso nuo jų.3. Subjektyvi- atsižvelgiama į respondentų nuomonę apie juos pačius.Skurdo rodikliai – skaičiuojant skurdo rodiklius, namų ūkio dydis gali būti įvertinamas pagal paprastą ir ekvivalentinę skales.Pagrindiniai skurdo rodikliai:• skurstančiųjų gyventojų lygis šalyje- rodiklis, parodantis šalies gyventojų dalį kurių pajamos yra žemiau skurdo ribos.• žemų pajamų nuokrypis- parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos (parodo skurdo gilumą).• žemų pajamų indeksas- parodo, kiek lėšų reikia eliminuoti skurdą šalyje.• kvadratinis skurdo nuokrypis- skurdo intensyvumo rodiklis, kuris atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra skurstančiųjų, tuo didesnis šis rodiklis.
Duomenys, panaudoti šiame kursiniame darbe
Namų ūkio dydis
Namų ūkio disponuojamos pajamos (Lt)
Gyvenamoji vieta1. 5 didieji miestai2. Kiti miestai3. Kaimas
Namų ūkiai su vaikais ir be vaikų1. Namų ūkis su vaikais iki 18 metų2. Namų ūkis be vaikų iki 18 metų
Namų ūkio galvos pagrindinis šaltinis1. Darbas asmeniniame žemės ūkyje2. Samdomas darbas žemės ūkio visuomeniniame sektoriuje3. Samdomas darbas žemės ūkio privačiame sektoriuje4. Pajamos iš verslo, amatų5. Samdomas darbas ne žemės ūkio visuomeniniame sektoriuje6. Samdomas darbas ne žemės ūkio privačiame sektoriuje7. Pajamos iš laisvos profesinės veiklos8. Bedarbio pašalpa9. Stipendija10. Pensija11. Socialinės pašalpos12. Išlaikytiniai13. Kitas pajamų šaltinis
Namų ūkio galvos lytis1. Vyras2. Moteris
Namų ūkio galvos socialinė-ekonominė grupė1. Ūkininkai2. Samdomi darbuotojai3. Verslininkai4. Pensininkai5. Kita
Namų ūkio galvos išsimokslinimas1. Neturi pradinio, pradinis2. Pagrindinis3. Bendras vidurinis4. Aukštesnysis5. Aukštasis
Namų ūkio galvos amžius (grupuotas)1. iki 30 metų2. 30-39 metai3. 40-49 metai4. 50-59 metai5. 60 metų ir daugiau
Miestas-Kaimas1. Miestas2. Kaimas
Namų ūkio vartojimo išlaidos1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA1.1. Kiekybiniai duomenysCharakteristikų apibrėžimai:1. Vidurkis – tai visų stebėtų skaitinių duomenų suma, padalinta iš duomenų skaičiaus. Jis rodo vidutinę atsitiktinio dydžio reikšmę.2. Dispersija – tai išsibarstymo apie vidurkį matas. Tai skirtumų tarp stebėtų duomenų reikšmių ir vidurkio kvadratų vidurkis.3. Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.4. Mediana – tai vidurinis duomuo stebėjimų sekoje, išdėstytoje didėjimo tvarka, t.y. skaičius, perskirstantis variacinę eilutę į dvi maždaug lygias dalis.5. Moda – tai reikšmė, kuri pasikartoja dažniausiai. Jei visi duomenys pasikartoja po vieną kartą, tai modos rasti negalime.6. Asimetrijos koeficientas – parodo pasiskirstymo simetriškumą, Jei asimetrijos koeficientas:• >0, tai asimetrija yra teigiama (dešinioji asimetrija);• =0, tai rodo, kad yra asimetrija;• <0, tai asimetrija yra neigiama (kairioji asimetrija).7. Ekscesas – tai simetrijos koeficientas (matas). Kai šis koeficientas:• >0, tai duomenų sklaida apie vidurkį yra didesnė už normaliąją kreivę;• =0, tai duomenų sklaida apie vidurkį yra tokia pati kaip ir normalios kreivės;• <0, tai duomenų sklaida apie vidurkį yra mažesnė už normaliąją kreivę.8. Duomenų plotis – tai maksimalios ir minimalios stebėjimų sekos duomenų reikšmių skirtumas, kuris parodo stebimų duomenų reikšmių diapazoną.9. Minimali reikšmė – tai stebimų duomenų sekoje esanti mažiausia reikšmė.10. Maksimali reikšmė – tai stebimų duomenų sekoje esanti didžiausia reikšmė.
Taigi rasiu šias pagrindines kiekybines charakteristikas šiems duomenims: namų ūkio dydis; namų ūkio disponuojamos pajamos; namų ūkio vartojimo išlaidos (žr. žemiau esančiose lentelėse). Ir padarysiu atitinkamas išvadas apie tai.
Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
3 175 10605 2348 28734 1058 20304 1171 12374 1944 15642 1092 8674 611 8682 748 8041 1295 11312 955 11312 810 4105 1580 4952 744 4854 700 8294 534 18345 2229 14472 1970 18123 994 10401 1234 10301 331 3213 1427 17733 647 14873 1555 17693 274 2342 114 8302 1247 14135 3990 61011 270 4683 1333 13475 1168 16223 1229 10204 2270 2249
Pagrindinės charakteristikos Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
Vidurkis 3,03125 1188,96875 1361,90625Standartinė paklaida 0,226671102 140,4037201 186,1173557Mediana 3 1130 1131Moda 3 negalima reikšmė 1131Vidutinis kvadratinis nuokrypis 1,282245384 794,2433804 1052,838754Dispersija 1,644153226 630822,5474 1108469,443Eksceso koeficientas -1,019131513 3,724180142 13,14302642Asimetrijos koeficientas 0,036244666 1,476204565 3,092761232Duomenų plotis 4 3876 5867Minimali reikšmė 1 114 234Maksimali reikšmė 5 3990 6101Suma 97 38047 43581Duomenų skaičius 32 32 32Vidurkio paklaida (95,0%) 0,462299017 286,3554347 379,5890612
Namų ūkio dydis.Apskaičiavus, t.y. ir kaip matyti pateiktoje lentelėje, vidutinis namų ūkio dydis yra 3,03125 (apytiksliai po tris asmenis). Mediana lygi 3, t.y. vidurinis duomuo namų ūkio dydžio stebėjimo sekoje, išdėstytoje didėjimo tvarka yra 3. Moda taip pat lygi 3, kas rodo, jog namų ūkiai šio stebėjimo sekoje su trimis nariais pasitaiko dažniausiai. Dispersija lygi 1,644153226, vidutinis kvadratinis nuokrypis 1,282245384. Asimetrijos koeficientas 0,036244666, tai simetrija yra teigiama (dešinioji asimetrija). Duomenų plotis lygus 4. Minimali stebėta reikšmė 1 (mažiausias iš visų stebimų namų ūkių yra namų ūkis, kurį sudaro tik vienas asmuo), o maksimali 5 (didžiausias namų ūkis yra iš penkių asmenų). Bendras visų stebimų namų ūkių narių skaičius yra 97, iš viso stebimi 32 namų ūkiai.
Namų ūko disponuojamos pajamos.Stebėjimų sekoje vidutinės disponuojamos pajamos – 1188, 96875. Mediana lygi – 1130, tai reiškia, kad išdėsčius namų ūkių disponuojamas pajamas didėjimo tvarka, vidurį gausime 1130. Moda negalima. D…ispersija lygi 630822,5474, vidutinis kvadratinis nuokrypis 794,2433804. Asimetrijos koeficientas lygus 1,476204565 . Duomenų plotis – t.y. skirtumas tarp maksimumo ir minimumo, lygus 3876. Minimali stebėta reikšmė yra 114 (mažiausia namų ūkio disponuojamų pajamų suma), o maksimali 3990 (tokia didžiausia namų ūkio disponuojamų pajamų suma). Visų namų ūkių išlaidos sudaro 38047, iš viso yra 32 stebėjimai.
Namų ūkio vartojimo išlaidos.Stebėjimų sekoje vidutinės vartojimo išlaidos – 1361,90625. Mediana lygi – 1131, tai reiškia, kad išdėsčius namų ūkių disponuojamas pajamas didėjimo tvarka, vidurį gausime 1131. Moda lygi medianai, t.y. lygi 1131, tai reiškia, kad tokios sumos vartojimo išlaidos pasitaiko dažniausiai. Dispersija lygi 1108469,443, vidutinis kvadratinis nuokrypis 1052,838754. Asimetrijos koeficientas lygus 3,092761232, tai reiškia, jog simetrija yra teigiama (dešinioji asimetrija). Duomenų plotis – t.y. skirtumas tarp maksimumo ir minimumo, lygus 5867. Minimali stebėta reikšmė yra 234 (mažiausia namų ūkio disponuojamų pajamų suma), o maksimali 6101 (tokia didžiausia namų ūkio disponuojamų pajamų suma). Visų namų ūkių vartojimo išlaidos sudaro 43581, iš viso yra 32 stebėjimai.1.2. Kokybiniai duomenysGyvenamoji vieta.Mano kursinio darbo varianto duomenimis nagrinėjami 32 namų ūkiai. Iš jų:• 5-kiuose didžiuosiuose miestuose gyvena 17 namų ūkių;• Kituose miestuose – 9 namų ūkiai;• Kaimuose -6 namų ūkiai.
Taigi mažiausiai namų ūkių gyvena kaimuose (18,75 proc.), daugiausiai namų ūkių gyvena didžiuosiuose miestuose (53,125 proc.), o kituose miestuose gyvena 28,125 proc. visų stebimų namų ūkių (žr. į žemiau esančią diagramą).
Namų ūkio dydis.Nagrinėjant namų ūkio dydį, galima įsigilinti, koks skaičius namų ūkių susideda iš vieno, dviejų, trijų, keturių ar penkių asmenų.
Namų ūkio dydis Namų ūkių skaičius
1 42 83 84 75 5
Taigi, kaip matyti iš aukščiau pateiktos lentelės bei skritulinės diagramos, iš nagrinėjamų 32 namų ūkių daugiausiai yra šeimų, susidedančių iš dviejų ir trijų asmenų (25 proc.), o mažiausią dalį iš visų nagrinėjamų namų ūkių užima šeimos, sudarytos iš vieno asmens (12,5 proc.).
Namų ūkių pajamų ir išlaidų palyginimas.Namų ūkio eilės nr. Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
1 175 10602 2348 28733 1058 20304 1171 12375 1944 15646 1092 8677 611 8688 748 8049 1295 113110 955 113111 810 41012 1580 49513 744 48514 700 82915 534 183416 2229 144717 1970 181218 994 104019 1234 103020 331 32121 1427 177322 647 148723 1555 176924 274 23425 114 83026 1247 141327 3990 610128 270 46829 1333 134730 1168 162231 1229 102032 2270 2249
Akivaizdu, jog arti pusės tiriamų namų ūkių išlaidos viršija disponuojamas pajamas. Beje, 27-ojo pagal eilės numerį namų ūkio vartojimo išlaidos yra daugiau nei 2000 litų didesnės nei disponuojamos pajamos.
Namų ūkio galvos socialinė – ekonominė grupė.Nagrinėdami namų ūkius pagal socialinę-ekonominę grupę, matome, kad:1. Ūkininkai 02. Samdomi darbuotojai 223. Verslininkai 24. Pensininkai 75. Kita 1
Iš pateiktų duomenų matyti, jog didžiausią dalį sudaro samdomi darbuotojai, t.y. net 22 iš 32, mažiausią – ūkininkai ir kita, atitinkamai: 0 ir 1.2. Vieno namų ūkio nario vidutinis pajamų pasiskirstymasPirmiausiai apskaičiuoju kiekvieno iš 32 stebimų namų ūkių vieno namų ūkio nario vidutinį pajamų pasiskirstymą (namų ūkio disponuojamos pajamos/namų ūkio dydis).Namų ūkio dydis Namų ūkio disponuo-jamos pajamos (Lt) Vieno namų ūkio nario vidutinis pajamų pasiskirstymas (Lt)
3 175 58,33335 2348 469,64 1058 264,54 1171 292,754 1944 4862 1092 5464 611 152,752 748 3741 1295 12952 955 477,52 810 4055 1580 3162 744 3724 700 1754 534 133,55 2229 445,82 1970 9853 994 331,33331 1234 12341 331 3313 1427 475,66673 647 215,66673 1555 518,33333 274 91,33332 114 572 1247 623,55 3990 7981 270 2703 1333 444,33335 1168 233,63 1229 409,66674 2270 567,5
Toliau atlieku tokius skaičiavimus:• randu minimalią reikšmę iš rastų vieno namų ūkio nario vidutinio pajamų pasiskirstymo duomenų (litais). Gauta minimali reikšmė: 57 (Lt);• randu maksimalią reikšmę iš to paties stulpelio duomenų. Maksimali reikšmė: 1295 (Lt);• apskaičiuoju, kiek mano turimais duomenimis geriausia paimti intervalų. Pagal formulę: k=1+3,322lg*(n) gaunu, jog k yra apytiksliai lygus 6;• apskaičiuoju intervalo dydį pagal formulę: ir gaunu, jog intervalo dydis (d)=206,333 (Lt)• iš pradžių randu intervalų galus pagal tokias formules: ; ; ; . Tačiau apskaičiavusi , gaunu neigiamą skaičių. Todėl apskaičiuoju pagal tokią formulę: . Taigi randu tokius intervalų galus:Randu intervalų galus:
t0 57t1 263,3333t2 469,6667t3 676t4 882,3333t5 1088,6667t6 1295
• šią sudarytą lentelę panaudoju tolimesniems skaičiavimams, t.y. gaunu tokius duomenis:Bin Frequency57 1263,3333 7469,6667 13676 7882,3333 11088,6667 11295 2
More 0
• kad galėčiau įvertinti vieno namų ūkio nario vidutinį pasiskirstymą, t.y. nubrėžti histogramą, sudarau tokias lenteles: (57; 263,33] (263,33; 469,67] (469,67; 676] (676; 882,33] (882,33; 1088,67] (1088,67; 1295] SumaDažnis 8 13 7 1 1 2 32Santykiniai dažniai 0,25 0,40625 0,21875 0,03125 0,03125 0,0625 1Sukaupti sant.dažniai 0,25 0,65625 0,875 0,90625 0,9375 1 S1 S2 S3 S4 S5 S6
(0; 57] (57; 263,33] (263,33; 469,67] (469,67; 676] (676; 882,33] (882,33; 1088,67] (1088,67; 1295] 0 0 0,25 0,25 0,65625 0,65625 0,875 0,875 0,90625 0,90625 0,9375 0,9375 1 1
Gaunu tokį vieno namų ūkio nario vidutinį pajamų pasiskirstymą:3. Vieno šeimos nario išlaidų kaime ir mieste palyginimasPatikrinimui, ar skiriasi vieno šeimos nario išlaidos kaime ir mieste, naudojami tokie pradiniai duomenys (žr. 3.1. lentelę), kurių pagalba, t.y. namų ūkio vartojimo išlaidas (Lt) padalijus iš namų ūkio dydžio, gaunu vieno namų ūkio nario duomenis kaime ir mieste (žr. 3.2. lentelę).
3.1. lentelė 3.2. lentelėNamų ūkio dydis Namų ūkio vartojimo išlaidos (Lt)
3 10605 28734 20304 12374 15642 8674 8682 8041 11312 11312 4105 4952 4854 8294 18345 14472 18123 10401 10301 3213 17733 14873 17693 2342 8302 14135 61011 4683 13475 16223 10204 2249Vieno namų ūkio nario išlaidos (Lt) Miestas-kaimas
353,3333 2574,6 1507,5 2309,25 1391 1433,5 1217 1402 11131 1565,5 1205 199 1242,5 1207,25 1458,5 2289,4 1906 1346,6667 11030 1321 1591 1495,6667 1589,6667 178 2415 2706,5 11220,2 1468 1449 1324,4 2340 1562,25 1
Kad būtų įmanoma atlikti tolimesnius skaičiavimus, sudarau dar vieną lentelę, kurioje duomenys grupuojami taip:
Vieno namų ūkio nario išlaidos (Lt) Miestas-kaimas
574,6 1309,25 1391 1433,5 1217 1402 11131 1565,5 1205 199 1242,5 1207,25 1289,4 1906 1346,6667 11030 1321 1591 1495,6667 1589,6667 1706,5 11220,2 1468 1449 1340 1562,25 1353,3333 2507,5 2458,5 278 2415 2324,4 2
Statistinių hipotezių tikrinimas (teorijos apžvalga).Bet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes vadinamas statistine hipoteze. Pradinė hipotezė vadinama nuline hipoteze arba pagrindine ir žymima , priešinga šiai hipotezei yra alternatyvioji hipotezė, kuri žymima .
Statistiniais metodais tikrindami hipotezės teisingumą, galime padaryti dviejų rūšių klaidas. Pirmosios rūšies klaidą padarome tada, kai atmetame hipotezę , kai ji yra teisinga. Antros rūšies klaida padaroma, jei hipotezė priimama, nors ji ir yra klaidinga (žr. į žemiau esančią lentelę).
Hipotezė Teisinga KlaidingaAtmetama Pirmos rūšies klaida Teisingas sprendimasPriimama Teisingas sprendimas Antros rūšies klaida
Taisyklę, pagal kurią iš imties duomenų darome išvadą apie hipotezės teisingumą ar klaidingumą, vadiname statistiniu kriterijumi arba tiesiog kriterijumi.
Hipotezės apie dispersijų ir dviejų vidurkių lygybę tikrinimas.Tarkime, kad X ir Y yra normalieji atsitiktiniai dydžiai. Sprendžiant praktinius uždavinius, dažnai tenka atsakyti į klausimą: ar iš esmės skiriasi nagrinėjamų atsitiktinių dydžių vidurkiai EX ir EY.
Tegu , ,…, ir , ,…, yra šių atsitiktinių dydžių nepriklausomos imtys. Į suformuluotą klausimą galima atsakyti patikrinus hipotezę su alternatyva , esant reikšmingumo lygmeniui a.
Jei imtys yra mažos ir vidutiniai kvadratiniai nuokrypiai ir nėra žinomi, hipotezei su alternatyva tikrinti taikomas Stjudento kriterijus. Tačiau šiuo atveju prireikia papildomos sąlygos . Tada naudojamasi statistika, kuri galiojant hipotezei , yra Stjudento skirstinys.t= Pagal reikšmingumo lygmenį a ir laisvės laipsnių skaičių k=m+n-1.Panašus priklausomų imčių kriterijus naudojamas ekonominiams skaičiavimams, nustatant ekonominių rodiklių kitimo pobūdį. Tuo tikslu imtis , , padalijama į dvi dalis: , , ir ,…, . Apskaičiavus šių imčių vidurkius ir , tikrinama hipotezė . Jei ji teisinga, galima tvirtinti, kad nagrinėjamasis rodiklis nekinta.
Nežinant, ar imčių , ,…, ir , ,…, dispersijos lygios, natūralu pirmiau tikrinti hipotezę apie dispersijų lygybę, t.y. . Šiai hipotezei tikrinti taikomas Fišerio kriterijus. Randama statistikos reikšmė, iš Fišerio skirstinio lentelės pagal pasirinktąjį reikšmingumo lygmenį nustatoma kritinė sritis. Jei statistinė reikšmė patenka į kritinę sritį, hipotezė atmetama, priešingu atveju – priimama.
Hipotezė apie dviejų dispersijų lygybę.…Tikrinu tokią hipotezę:
F-Test Two-Sample for Variances Mieste KaimeVidurkis 503,575 356,1222222Dispersija 84252,45805 23045,8163Observations 26 6df 25 5F 3,655867814 P(F<=f) one-tail 0,076711569 F Critical one-tail 4,520899211
Kaip matyti iš gautų duomenų, , todėl hipotezė priimama. Tai reiškia, jog dispersijos yra lygios.
Hipotezė apie dviejų vidurkių lygybę.Kadangi gavau, kad dispersijos lygios, toliau tikrinu, ar vidurkiai yra lygūs, ar ne. Tikrinu tokią hipotezę:
t-Test: Two-Sample Assuming Equal Variances Mieste KaimeVidurkis 503,575 356,122222Dispersija 84252,45805 23045,8163Observations 26 6Pooled Variance 74051,35109 Hypothesized Mean Difference 0 df 30 t Stat 1,196392757 P(T<=t) one-tail 0,120456678 t Critical one-tail 1,697260851 P(T<=t) two-tail 0,240913355 t Critical two-tail 2,042272449
Išvados: , todėl hipotezę apie vidurkius galima priimti, nors išlaidų vidurkis mieste yra didesnis beveik 150 litų (147,45278 Lt).4. Patikrinimas: ar namų ūkio santaupos didėjaNorint patikrinti, ar namų ūkio santaupos didėja, pirmiausia reikia apskaičiuoti visų stebimų namų ūkių santaupas iš kiekvieno namų ūkio disponuojamų pajamų (litais) atitinkamai atėmus namų ūkio vartojimo išlaidas (litais) (žr. į žemiau esančią lentelę).Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio santaupos (Lt)
175 1060 -8852348 2873 -5251058 2030 -9721171 1237 -661944 1564 3801092 867 225611 868 -257748 804 -561295 1131 164955 1131 -176810 410 4001580 495 1085744 485 259700 829 -129534 1834 -13002229 1447 7821970 1812 158994 1040 -461234 1030 204331 321 101427 1773 -346647 1487 -8401555 1769 -214274 234 40114 830 -7161247 1413 -1663990 6101 -2111270 468 -1981333 1347 -141168 1622 -4541229 1020 2092270 2249 21
Pirmiausiai tikrinu tokią hipotezę (žr. žemiau).
t-Test: Paired Two Sample for Means Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
Mean 1188,96875 1361,90625Variance 630822,5474 1108469,443Observations 32 32Pearson Correlation 0,821580454 Hypothesized Mean Difference 0 df 31 t Stat -1,618678858 P(T<=t) one-tail 0,057823647 t Critical one-tail 1,695518742 P(T<=t) two-tail 0,115647294 t Critical two-tail 2,039513438
Išvados: , todėl H0 yra teisinga. Namų ūkio santaupos nedidėja. Todėl kitų hipotezių tikrinti nereikia.5. Skurdo rodiklių įvertinimasSkurdo riba – tai kriterijus, kurio pagalba politikai ar kiti asmenys suskirsto gyventojus, šeimas ar namų ūkius į skurstančius ir neskurstančius.Norint apskaičiuoti skurdo rodiklius, reikalingi šie duomenys: namų ūkio dydis, disponuojamos pajamos ir disponuojamos pajamos vienam ūkio nariui.Duomenys:Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Vieno namų ūkio nario disponuojamos pajamos (Lt)
1 3 175 58,33332 5 2348 469,63 4 1058 264,54 4 1171 292,755 4 1944 4866 2 1092 5467 4 611 152,758 2 748 3749 1 1295 129510 2 955 477,511 2 810 40512 5 1580 31613 2 744 37214 4 700 17515 4 534 133,516 5 2229 445,817 2 1970 98518 3 994 331,333319 1 1234 123420 1 331 33121 3 1427 475,666722 3 647 215,666723 3 1555 518,333324 3 274 91,333325 2 114 5726 2 1247 623,527 5 3990 79828 1 270 27029 3 1333 444,333330 5 1168 233,631 3 1229 409,666732 4 2270 567,5Suma: 97 38047 13849,6667
Randu vidutines pajamas vienam namų ūkio nariui, kur: vidutinės pajamos vienam namų ūkio nariui = suma disponuojamų pajamų / suma namų ūkio dydžių.Gauta reikšmė: 392,2371 (Lt).
Įvertinsiu šiuos skurdo rodiklius:• skurdo ribą,• skurdo lygį,• skurdo gylį,• žemų pajamų indeksą.
Skurdo riba:Skurdo riba pasirenkama su 50 % nuo vidutinių pajamų vienam namų ūkio nariui.
r =0.5* vidutinės pajamos vienam namų ūkio nariui.Skurdo riba: 196,1186 (Lt).Skurdo lygis:Skurstančių gyventojų lygis šalyje parodo šalies gyventojų dalį, kurių pajamos žemiau skurdo ribos. Skurdo lygiui įvertinti naudojama formulė:L Čia:L – skurdo lygis,q – skurstančių gyventojų skaičius,n – visų gyventojų skaičius.Nustatant skurstančių gyventojų skaičių atrenku tuos namų ūkius, kur vienam nariui tenka žemesnės pajamos už skurdo ribą.Pagal nagrinėjamus duomenis yra 6 namų ūkiai, kuriuose pajamos žemiau skurdo ribos. Šiuos ūkius iš viso sudaro 20 gyventojų (tiek yra skurstančių gyventojų).L=q/n=20/97= 0,206185567Vadinasi , 20,62 proc. visų stebimų gyventojų pajamos yra žemiau skurdo ribos.
Skurdo gylis (žemų pajamų nuokrypis):Žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo skurdo gilumą. Jis randamas:
Kur:xi – i-tojo skurstančiojo pajamosr – skurdo ribaki – namų ūkio dydisN=1/20*(((196,1186-58,333)/196,1186)*3+((196,1186-152,75)/196,1186)*4+((196,1186-175)/196,1186)*4+((196,1186-133,5)/196,1186)*4+((196,1186-91,3333)/196,1186)*3+((196,1186-57)/196,1186)*2)= 0,386086047, apytiksliai N=0,3861Vadinasi, vidutiniškai 38,61 proc. skurstančiųjų pajamos nukrypsta nuo skurdo ribos.
Žemų pajamų indeksas:Žemų pajamų indeksas parodo kiek reikia lėšų, norint eliminuoti skurdą šalyje. Apskaičiuojamas pagal tokią formulę: I = L * N Kur:L – skurdo lygis, N – skurdo gylis.I= 0,07960537Reikia 7,96 proc. lėšų, norint eliminuoti skurdą šalyje.6. Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas6.1. Lorenco kreivėLorenco kreivė rodo, kurią pajamų dalį gauna tam tikra visuomenės dalis. Ši kreivė padeda įvertinti, kaip lygiai pasiskirsto pajamų grafinis vaizdas. Įstriža linija rodo idealiai lygų pajamų pasiskirstymą. Kuo toliau Lorenco kreivė yra nukrypusi nuo įstrižos linijos, tuo netolygesnis pajamų pasiskirstymas. Plotas, esantis tarp Lorenco kreivės ir absoliučios lygybės tiesės vadinamas koncentracijos plotu. Jis parodo skirtumus tarp siekiamos ir realios padėties pajamų pasiskirstymo atžvilgiu.
Sudarau lentelę, kurios apskaičiuotas duomenimis bus braižoma Lorenco kreivė:Vieno šeimos nario pajamos (Lt) (didėjimo tvarka) Numeracija
Sukauptos vieno namų ūkio nario pajamos (Lt) (3)
0 057 1 57 0,03 0,00411658,33 2 115,33 0,06 0,0083272891,33 3 206,66 0,09 0,014921666133,5 4 340,16 0,13 0,024560892152,75 5 492,91 0,16 0,035590043175 6 667,91 0,19 0,048225733215,67 7 883,58 0,22 0,063797956233,6 8 1117,18 0,25 0,080664796264,5 9 1381,68 0,28 0,099762738270 10 1651,68 0,31 0,119257801292,75 11 1944,43 0,34 0,140395504316 12 2260,43 0,38 0,163211949331 13 2591,43 0,41 0,187111453331,33 14 2922,76 0,44 0,211034784372 15 3294,76 0,47 0,237894649374 16 3668,76 0,50 0,264898922405 17 4073,76 0,53 0,294141517409,67 18 4483,43 0,56 0,323721304444,33 19 4927,76 0,59 0,35580368445,8 20 5373,56 0,63 0,387992196469,6 21 5843,16 0,66 0,421899166475,67 22 6318,83 0,69 0,456244413477,5 23 6796,33 0,72 0,490721794486 24 7282,33 0,75 0,525812908518,33 25 7800,66 0,78 0,563238376546 26 8346,66 0,81 0,602661726567,5 27 8914,16 0,84 0,643637461623,5 28 9537,66 0,88 0,688656617798 29 10335,66 0,91 0,74627536985 30 11320,66 0,94 0,8173962391234 31 12554,66 0,97 0,90649591295 32 13849,66 1,00 113849,66 Pasitelkusi šiuos duomenis, t.y. 4 ir 5 stulpelių duomenimis braižau Lorenco kreivę:
Akivaizdu iš pateiktos Lorenco kreivės, jog tiriamų 32 namų ūkių pajamų pasiskirstymas nėra idealus, t.y. galima teigti, kad pajamų pasiskirstymas yra gana netolygus.6.2. Gini koeficientasGini koeficientas dažniausiai naudojamas kaip pajamų pasiskirstymo, netolygumo matas.Kuo šis koeficientas yra didesnis, tuo pajamų pasiskirstymas yra netolygesnis. Esant absoliučiai pajamų pasiskirstymo lygybei, Gini koeficientas yra lygus nuliui. Jei visos pajamos tektų vienam namų ūkio nariui, tai Gini koeficientas būtų lygus vienam. Kai reikšmė mažesnė už 0,25, tai gyventojų pajamų diferenciacijos lygis yra labai mažas; tarp 0,25 – 0,30 – nedidelis; gautas koeficientas didesnis nei 0,30 rodo gyventojų pajamų diferenciacijos netolygumą.
Gini koeficientas skaičiuojamas pagal šią formulę: ;Kur:n – namų ūkių skaičius; – vieno namų ūkio nario disponuojamų pajamų stulpelio vidurkis.Sudarau tokią lentelę:N (1) Vieno šeimos nario pajamos (Lt)(didėjimo tvarka) (2) (1)x(2)
32 57 182431 58,33 1808,2330 91,33 2739,929 133,5 3871,528 152,75 427727 175 472526 215,67 5607,4225 233,6 584024 264,5 634823 270 621022 292,75 6440,521 316 663620 331 662019 331,33 6295,2718 372 669617 374 635816 405 648015 409,67 6145,0514 444,33 6220,6213 445,8 5795,412 469,6 5635,211 475,67 5232,3710 477,5 47759 486 43748 518,33 4146,647 546 38226 567,5 34055 623,5 3117,54 798 31923 985 29552 1234 24681 1295 1295 432,801875 151355,6
= 432,801875 (Lt); = 151355,6 (Lt);n=32.G(y)= 0,348220597.
Išvados: kadangi gautoji Gini koeficiento reikšmė yra daugiau nei 0,30, tai gyventojų pajamų pasiskirstymas, t.y. diferenciacija yra netolygi. 7. Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimasRegresinė analizė – tai vieno kintamojo priklausomybės tyrimas nuo kitų kintamųjų. Regresinės analizės kintamieji skirstomi į:• priklausomus kintamuosius, kurie charakterizuoja rezultatą. Jų reikšmė formuojasi nagrinėjamo reiškinio viduje priklausomai nuo daugelio kitų kintamųjų reikšmių;• nepriklausomus kintamuosius, kurie aprašo nagrinėjamo reiškinio funkcionavimą, savybes, apsprendžia rezultatą.Regresijos lygtis: kur:Y – priklausomas kintamasis; – nepriklausomieji kintamieji; – nežinomieji kintamieji; – atsitiktinis dydis, parodantis nukrypimus nuo taško iki tiesės.
Šioje kursinio darbo dalyje ištirsiu vienam namų ūkio nariui tenkančių išlaidų priklausomybę nuo įvairių faktorių. Regresinėje analizėje Y – vieno namų ūkio nario išlaidos, jas įtakojančių veiksnių priklausomybei ištirti pasirenku šiuos faktorius (represorius):1. X1 – namų ūkio disponuojamos pajamos vienam gyventojui (Lt);2. X2 – namų ūkio galvos lytis (1 – vyras; 0 – moteris);3. X3 – namų ūkio galvos išsimokslinimas (1 – aukštasis; 0 – kita, t.y. neturi pradinio, pradinis; pagrindinis; bendrasis vidurinis; aukštesnysis); 4. X4 – grupuotas namų ūkio galvos amžius (1 – 60 metų ir daugiau; 0 – mažiau nei 60 metų, t.y. amžius iki 60 metų); 5. X5 – namų ūkio galvos socialinė – ekonominė grupė (1 – pensininkai, 0 – kita, t.y. ūkininkai, samdomi darbuotojai, verslininkai).
Sudarau lentelę:Y X1 X2 X3 X4 X5Namų ūkio vartojimo išlaidos vienam gyventojui (Lt) Namų ūkio disponuojamos pajamos vienam gyventojui (Lt) Namų ūkio galvos lytis Namų ūkio galvos išsimokslinimas Namų ūkio galvos amžius (grupuotas) Namų ūkio galvos socialinė-ekonominė grupė
353,3333 58,3333 1 0 0 0574,6 469,6 1 0 0 0507,5 264,5 1 0 1 1309,25 292,75 1 0 0 0391 486 0 0 0 0433,5 546 0 1 0 0217 152,75 0 0 1 1402 374 0 1 0 01131 1295 0 0 0 0565,5 477,5 1 0 0 0205 405 0 0 0 099 316 1 0 1 0242,5 372 1 0 1 1207,25 175 1 0 0 0458,5 133,5 1 0 0 0289,4 445,8 1 0 0 0906 985 1 0 0 0346,6667 331,3333 1 0 0 01030 1234 0 0 0 0321 331 0 0 1 1591 475,6667 0 0 0 0495,6667 215,6667 0 0 0 0589,6667 518,3333 1 1 0 078 91,3333 0 0 0 1415 57 1 0 1 1706,5 623,5 1 0 1 01220,2 798 1 1 0 0468 270 0 0 1 1449 444,3333 1 1 0 0324,4 233,6 1 0 0 0340 409,6667 0 0 0 0562,25 567,5 1 0 0 0
Pirmiausia patikrinu, ar regresoriai tarpusavyje nėra koreliuoti (t.y. jie turi būti nepriklausomi). Šiam tikslui tikrinu koreliaciją: X1 X2 X3 X4 X5 X6X1 1 X2 0,824316441 1 X3 0,019792469 -0,143357898 1 X4 0,228087373 0,151875326 0,005476267 1 X5 -0,22234941 -0,265142603 0,036735918 -0,248451997 1 X6 -0,30341224 -0,38496402 -0,177964846 -0,227710017 0,741940827 1
Kadangi nėra reikšmės, viršijančios 0,85, tai reiškia, jog pasirinkti regresoriai nėra koreliuoti (jie nepriklausomi). Vadinasi, šie faktoriai (regresoriai) yra tinkamai parinkti.
Tikrinu regresiją:SUMMARY OUTPUTRegression Statistics Multiple R 0,846597234R Square 0,716726877Adjusted R Square 0,662251277Standard Error 159,2443604Observations 32
ANOVA df SS MS F Significance FRegression 5 1668206,427 333641,2853 13,15684214 1,9358E-06Residual 26 659327,9243 25358,76632 Total 31 2327534,351
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 53,20841 80,182717 0,663589 0,512795 -111,609526 218,026342 -111,609526 218,026342X1 0,798718 0,107980 7,396893 7,446E-08 0,576761 1,020674 0,576761 1,020674X2 94,47842 62,238010 1,518018 0,141077 -33,453640 222,410481 -33,453640 222,410481X3 80,75861 80,460233 1,003708 0,324770 -84,629762 246,146990 -84,629762 246,146990X4 -49,02829 101,572884 -0,482691 0,633355 -257,814339 159,757762 -257,814339 159,757762X5 94,05452 114,142740 0,824008 0,417430 -140,569239 328,678282 -140,569239 328,678282
Significant F<α (1,9358E-06<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X4 (grupuotas …namų ūkio galvos amžius) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,633355) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.Sudarau naują lentelę (be X4) ir pakartoju operacijas iš naujo:
SUMMARY OUTPUTRegression Statistics Multiple R 0,845097R Square 0,714188Adjusted R Square 0,671846Standard Error 156,9662Observations 32
ANOVA df SS MS F Significance FRegression 4 1662298,1 415574,5 16,866958 4,8315E-07Residual 27 665236,27 24638,38 Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 56,28262 78,78589 0,714374 0,4811268 -105,37267 217,937908 -105,37267 217,937908X1 0,793132 0,1058224 7,494936 4,614E-08 0,57600233 1,01026146 0,57600233 1,01026146X2 86,34413 59,055982 1,462073 0,1552642 -34,828734 207,516994 -34,828734 207,516994X3 85,55979 78,700797 1,087153 0,2865796 -75,920903 247,040485 -75,920903 247,040485X5 53,66997 76,533593 0,70126 0,4891411 -103,36399 210,703928 -103,36399 210,703928
Significant F<α (4,8315E-07<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X5 (namų ūkio galvos socialinė – ekonominė grupė) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,4891411) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.Sudarau naują lentelę (be X5) ir pakartoju operacijas vėl iš naujo:SUMMARY OUTPUTRegression Statistics Multiple R 0,842011R Square 0,708983Adjusted R Square 0,677802Standard Error 155,5351Observations 32
ANOVA df SS MS F Significance FRegression 3 1650181,8 550060,6 22,738079 1,1558E-07Residual 28 677352,59 24191,16 Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 88,76827 63,146848 1,405743 0,1708004 -40,582183 218,118724 -40,582183 218,118724X1 0,763343 0,0960383 7,948315 1,174E-08 0,56661716 0,96006825 0,56661716 0,96006825X2 75,79992 56,589083 1,33948 0,1911864 -40,117563 191,717397 -40,117563 191,717397X3 75,37164 76,642995 0,983412 0,3338265 -81,624413 232,367699 -81,624413 232,367699
Significant F<α (1,1558E-07<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X3 (namų ūko galvos išsimokslinimas) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,3338265) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.Sudarau naują lentelę (be X3) ir pakartoju operacijas vėl iš naujo:SUMMARY OUTPUTRegression Statistics Multiple R 0,836021R Square 0,698931Adjusted R Square 0,678168Standard Error 155,4468Observations 32
ANOVA df SS MS F Significance FRegression 2 1626786,5 813393,3 33,661758 2,7584E-08Residual 29 700747,84 24163,72 Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 93,31927 62,941311 1,482639 0,1489569 -35,410167 222,048701 -35,410167 222,048701X1 0,777911 0,094835 8,202791 4,809E-09 0,58395216 0,97187074 0,58395216 0,97187074X2 77,35013 56,535026 1,368181 0,1817636 -38,276976 192,977241 -38,276976 192,977241
Significant F<α (2,7584E-08<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X2 (namų ūkio galvos lytis) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,1817636) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.Sudarau naują lentelę (be X2) ir pakartoju operacijas vėl iš naujo:SUMMARY OUTPUTRegression Statistics Multiple R 0,824316R Square 0,679498Adjusted R Square 0,668814Standard Error 157,6896Observations 32
ANOVA df SS MS F Significance FRegression 1 1581554 1581554 63,603042 6,6825E-09Residual 30 745980,36 24866,01 Total 31 2327534,4
Coe…fficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 147,2964 49,750082 2,960727 0,0059481 45,6931881 248,899633 45,6931881 248,899633X1 0,759311 0,0952095 7,975152 6,683E-09 0,56486673 0,9537544 0,56486673 0,9537544
Significance F<α (6,6825E-09<0,05), vadinasi likęs regresorius X1 (namų ūkio disponuojamos pajamos vienam gyventojui) yra reikšmingas. Tai reiškia, kad vieno namų ūkio nario vartojimo išlaidos priklauso tik nuo jo disponuojamų pajamų. Šią priklausomybę aprašo lygtis:
Y = 147,2964 + 0,759311*X1
Y – vieno namų ūkio nario išlaidos, Lt;X1 – vieno namų ūkio nario disponuojamos pajamos, Lt.
Didžiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus didžiausias pajamas:Y = 147,2964 + 0,759311*X1 = 147,2964 + 0,759311*1295 = 1130,6
Mažiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus mažiausias pajamas:
Y = 147,2964 + 0,759311*X1 = 147,2964 + 0,759311*57 = 190,577
Išvados: remiantis gautais rezultatais, galima padaryti išvadą, jog vieno namų ūkio nario vartojamos išlaidos nepriklauso nuo namų ūkio galvos lyties, išsimokslinimo, amžiaus bei socialinės – ekonominės grupės.
Determinacijos koeficiento įvertis.Determinacijos koeficientas parodo, ar pasirinktas modelis gerai aprašo duomenis. Determinacijos koeficientas gali įgyti reikšmes iš intervalo:08. Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidasDuomenys:X YVieno namų ūkio nario pajamos (Lt) (didėjimo tvarka) Vieno namų ūkio nario išlaidos (Lt)
57 41558,3333 353,333391,3333 78133,5 458,5152,75 217175 207,25215,6667 495,6667233,6 324,4264,5 507,5270 468292,75 309,25316 99331 321331,3333 346,6667372 242,5374 402405 205409,6667 340444,3333 449445,8 289,4469,6 574,6475,6667 591477,5 565,5486 391518,3333 589,6667546 433,5567,5 562,25623,5 706,5798 1220,2985 9061234 10301295 1131
Norint nustatyti, ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario vidutines išlaidas, reikia apskaičiuoti koreliacijos koeficientą bei patikrinti, ar gautas koreliacijos koeficientas yra reikšmingas ar ne. Taip pat tuo pačiu tikslu sudarysiu regresijos lygtį ir rasiu determinacijos koeficientą.
Koreliacijos koeficientas: Vieno namų ūkio nario pajamos (Lt) Vieno namų ūkio nario išlaidos (Lt)Vieno namų ūkio nario pajamos (Lt) 1 Vieno namų ūkio nario išlaidos (Lt) 0,824316444 1
Išvada: gautas koreliacijos koeficientas yra arti vieneto, todėl priklausomybė tarp vieno namų ūkio nario pajamų (Lt) ir vieno namų ūkio nario išlaidų (Lt) yra labai stipri.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant vieno namų ūkio nario pajamoms (Lt), vieno namų ūkio nario išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant vieno namų ūkio nario pajamoms (Lt), vieno namų ūkio nario išlaidos (Lt) taip pat mažėja.
Koreliacijos koeficiento reikšmingumo įvertinimasTikrinu hipotezę: ; .Koreliacijos koeficientas reikšmingas tuomet, kai . ( 0,01). . 7,971412448. . .Išvados: priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas yra reikšmingas.
Regresijos lygtisDuomenys:SUMMARY OUTPUTRegression Statistics Multiple R 0,824316R Square 0,679498Adjusted R Square 0,668814Standard Error 157,6896Observations 32
ANOVA df SS MS F Significance FRegression 1 1581554 1581554 63,603042 6,6825E-09Residual 30 745980,36 24866,01 Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%Intercept 147,2964 49,750082 2,960727 0,0059481 45,6931881 248,899633 45,6931881 248,899633Vieno namų ūkio nario pajamos (Lt) 0,759311 0,0952095 7,975152 6,683E-09 0,56486673 0,9537544 0,56486673 0,9537544
Y = 147,2964 + 0,759311*X1
Y – vieno namų ūkio nario išlaidos, Lt;X1 – vieno namų ūkio nario disponuojamos pajamos, Lt.
Didžiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus didžiausias pajamas:Y = 147,2964 + 0,759311*X2 = 147,2964 + 0,759311*1295 = 1130,6
Mažiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus mažiausias pajamas:
Y = 147,2964 + 0,759311*X2 = 147,2964 + 0,759311*57 = 190,577
Išvada: kaip matyti iš pateiktos regresijos lygties, kuri nusako vieno namų ūkio nario išlaidų priklausomybę nuo jo gautų (disponuojamų) pajamų, parametro reikšmė: vieno namų ūkio nario pajamoms padidėjus bent vienu litu, jo išlaidos padidės 0,759311 (Lt).
Determinacijos koeficiento įvertis.Determinacijos koeficientas – tai daugiamačio koreliacijos koeficiento kvadratas (R2).Kaip jau minėjau 7 – oje šio kursinio darbo dalyje, determinacijos koeficientas turi patekti į intervalą: . Jis atspindi parinkto modelio tikslumą, t.y. kuo artimesnis 1, tuo parinktas modelis geriau aprašo duomenis. Gaunu tokią determinacijos koeficiento reikšmę:
D= R2 = 0,8243162 = 0,679497198.
Išvada: modelyje aprašytas vieno namų ūkio nario pajamų vidurkis aprašo beveik 68 proc. vieno namų ūkio nario išlaidų vidurkį. Tai reiškia, kad vartojimo išlaidos (jų vidurkis) beveik 68 procentais priklauso nuo disponuojamų pajamų, o likusieji 32 procentai pri…klauso nuo kitų faktorių (neįvertintų reikšmių).
Regresijos tiesė (grafiškai)Duomenys:Vieno namų ūkio nario pajamos (Lt) (didėjimo tvarka) Vieno namų ūkio nario išlaidos (Lt) Predicted vieno namų ūkio nario vartojimo išlaidos (Lt)57 415 190,577116558,3333 353,3333 191,589505391,3333 78 216,6467539133,5 458,5 248,6643746152,75 217 263,2811029175 207,25 280,1757629215,6667 495,6667 311,0544178233,6 324,4 324,6713619264,5 507,5 348,1340583270 468 352,3102664292,75 309,25 369,5845817316 99 387,2385522331 321 398,6282107331,3333 346,6667 398,8812889372 242,5 429,7599437374 402 431,2785649405 205 454,8171923409,6667 340 458,3606669444,3333 449 484,6833824445,8 289,4 485,7970632469,6 574,6 503,8686546475,6667 591 508,475164477,5 565,5 509,8672081486 391 516,3213479518,3333 589,6667 540,8723641546 433,5 561,8799816567,5 562,25 578,2051587623,5 706,5 620,7265502798 1220,2 753,2262434985 906 895,21731861234 1030 1084,2856491295 1131 1130,603593
Galutinės šios kursinio dalies išvados: Taigi, apskaičiavusi koreliacijos koeficientą, įvertinusi jo reikšmingumą, sudariusi regresijos lygtį bei apskaičiavusi determinacijos koeficientą, galiu drąsiai teigti, jog vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario išlaidas. Beje, visa tai iliustruoja ir pateiktas grafikas.9. Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimasDuomenys:Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio dydis
175 1060 32348 2873 51058 2030 41171 1237 41944 1564 41092 867 2611 868 4748 804 21295 1131 1955 1131 2810 410 21580 495 5744 485 2700 829 4534 1834 42229 1447 51970 1812 2994 1040 31234 1030 1331 321 11427 1773 3647 1487 31555 1769 3274 234 3114 830 21247 1413 23990 6101 5270 468 11333 1347 31168 1622 51229 1020 32270 2249 4
Koreliacijos įvertinimas Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio dydisNamų ūkio disponuojamos pajamos (Lt) 1 Namų ūkio vartojimo išlaidos (Lt) 0,821580454 1 Namų ūkio dydis 0,500114034 0,493981601 1
Išvados:1. gauta koreliacija tarp namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt) yra 0,821580454, t.y. arti vieneto, todėl priklausomybė tarp namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt) yra labai stipri.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant namų ūkio pajamoms (Lt), namų ūkio išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio pajamoms (Lt), namų ūkio išlaidos (Lt) taip pat mažėja.
2. gauta koreliacija tarp namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt) yra 0,500114034, t.y. šiek tiek arčiau vieneto nei nulio, todėl galima teigti, jog priklausomybė tarp namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt) yra nei stipri, nei silpna, t.y. vidutinė.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant namų ūkio dydžiui, namų ūkio disponuojamos pajamos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio dydžiui, namų ūkio disponuojamos pajamos (Lt) taip pat mažėja.
3. gauta koreliacija tarp namų ūkio dydžio ir namų ūkio vartojimo išlaidų (Lt) yra 0,493981601, t.y. šiek tiek arčiau nulio nei vieneto, todėl galima teigti, jog priklausomybė yra nei stipri, nei silpna, t.y. vidutinė.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant namų ūkio dydžiui, namų ūkio vartojimo išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio dydžiui, namų ūkio vartojimo išlaidos (Lt) taip pat mažėja.
Koreliacijos reikšmingumo įvertinimasTikrinu tris tokias hipotezes: ; .Koreliacijos koeficientas reikšmingas tuomet, kai . ( 0,01). .1. kai r = 0,821580454, tai: 7,971412448.
2. kai r = 0,500114034, tai: 3,163239389.
3. kai r = 0,493981601, tai: 3,111828273.
. .Išvados: visos gautosios trys priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas tarp:• namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt);• namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt);• namų ūkio dydžio ir namų ūkio vartojimų išlaidų (Lt) yra reikšmingas.IšvadosBendra charakteristika. Kokybinių duomenų apibendrinimas. Buvo stebimi 32 namų ūkiai, iš kurių:• daugiausiai gyvena 5 -iuose didžiuosiuose miestuose (net 17 namų ūkių iš 32); • daugiausiai yra šeimų, susidedančių iš dviejų ir trijų asmenų (25 proc.);• arti pusės tiriamų namų ūkių vartojimo išlaidos viršija disponuojamas pajamas;• daugiausiai, t.y. net 22 tiriamų namų ūkių galvos socialinė – ekonominė grupė – samdomi darbuotojai. Kiekybinių duomenų apibendrinimas. Stebėjimų sekoje: • vidutinis namų ūkio dydis yra 3,03125 (apytiksliai po tris asmenis);• vidutinės disponuojamos pajamos – 1188, 96875 (Lt);• vidutinės vartojimo išlaidos – 1361,90625 (Lt).
Vieno šeimos nario išlaidų kaime ir mieste palyginimas. Kad galėčiau nustatyti, ar skiriasi vieno šeimos nario išlaidos kaime ir mieste patikrinau šias hipotezes:• Hipotezė apie dviejų dispersijų lygybę.Išvada: , todėl hipotezė priimama. Tai reiškia, jog dispersijos yra lygios.• Hipotezė apie dviejų vidurkių lygybę.Išvada: , todėl hipotezę apie vidurkius galima priimti, nors išlaidų vidurkis mieste yra didesnis beveik 150 litų (147,45278 Lt).
Patikrinimas: ar namų ūkio santaupos didėja. Patikrinime: ar namų ūkių santaupos didėja gavau tokias išvadas: , todėl H0 yra teisinga. Namų ūkio santaupos nedidėja.
Skurdo rodiklių įvertinimas. Apskaičiavusi skurdo rodiklius, gavau, kad:skurdo riba yra lygi 196,1186 (Lt);20,62 proc. visų stebimų gyventojų pajamos yra žemiau skurdo ribos;vidutiniškai 38,61 proc. skurstančiųjų pajamos nukrypsta nuo skurdo ribos;reikia 7,96 proc. lėšų, norint eliminuoti skurdą šalyje.
Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas. Išanalizavusi namų ūkio nelygybę, t.y. nubrėžus Lorenco kreivę bei apskaičiavus Gini koeficientą, priėjau tokią išvadą: stebimų 32 namų ūkių pajamų pasiskirstymas (diferenciacija) yra netolygus.
Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas. Atlikusi regresinę analizę, priėjau išvadą, jog vieno namų ūkio nario vartojimo išlaidos priklauso tik nuo jo disponuojamų pajamų, t.y. remiantis gautais rezultatais, galima padaryti išvadą, jog vieno namų ūkio nario vartojamos išlaidos nepriklauso nuo namų ūkio galvos lyties, išsimokslinimo, amžiaus bei socialinės – ekonominės grupės. Gavau šią priklausomybę aprašančią lygtį:Y = 147,2964 + 0,759311*X1
Determinacijos koeficientas. Gavau, kad R2 = 0,8243162 = 0,679497198. Tai reiškia, kad vartojimo išlaidos beveik 68 procentais priklauso nuo disponuojamų pajamų, o likusieji 32 procentai priklauso nuo kitų faktorių (neįvertintų reikšmių).
Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas. Nustatyme ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas, t.y. apskaičiavusi koreliacijos koeficientą, įvertinusi jo reikšmingumą, sudariusi regresijos lygtį bei apskaičiavusi determinacijos koeficientą, priėjau tokią išvadą, jog vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario išlaidas.
Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas. Galutinės šio kursinio darbo paskutinės dalies išvados: visos gautosios trys priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas tarp:
• namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt);• namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt);• namų ūkio dydžio ir namų ūkio vartojimų išlaidų (Lt) yra reikšmingas.