Statistikos kursinis

I. ĮŽANGA ………………………………………………………………………………………………………………….II. DUOMENŲ LENTELĖ ……………………………………………………………………………………………III. IŠPLĖSTINĖ DAŽNIŲ LENTELĖ …………………………………………………………………………IV. DIAGRAMOS ………………………………………………………………………………………………………V. SKAITINĖS DUOMENŲ CHARAKTERISTIKOS …………………………………………………… 1. Poslinkio charakteristikos. …………………………………………………………………………….. a. Vidurkis. …………………………………………………………………………………………… b. Moda. ………………………………………………………………………………………………. c. Mediana. …………………………………………………………………………………………… 2. Sklaidos charakteristikos. ………………………………………………………………………………. a. Imties plotis. ………………………………………………………………………………………b. Tiesinis nuokrypis. ……………………………………………………………………………..c. Dispersija. ………………………………………………………………………………………… d. Vidutinis kvadratinis nuokrypis. …………………………………………………………..VI. KORLIALECINĖ IR REGRESINĖ ANALIZĖ. ……………………………………………………….. 1. Regresija. …………………………………………………………………………………………………….. 2. Koreliacija. …………………………………………………………………………………………………..a. Bendrasis, klaidų ir regresinis nuokrypiai. ……………………………………………..b. Determinacijos koeficientas. ………………………………………………………………..c. Koreliacijos koeficientas. …………………………………………………………………….d. Koreliacijos indeksas. ………………………………………………………………………….VII. PIRSONO IR ČIUPROVO RODIKLIAI. ………………………………………………………………..VIII. IŠVADA. ……………………………………………………………………………………………………………IX. LITERATŪRA. …………………………………………………………………………………………………….

I. ĮŽANGA

Užduoties atlikimui pasirinkau tirti jaunuolių, pašauktų į pradinę privalomąją karo tarnybą ir paskirtų dalyvauti “Baziniame inžinerinio parengimo” kurse Karo inžinerijos mokykloje pažangumą. Tai nutariau atlikti tam, kad nustatyčiau kaip civilinis išsilavinimas įtakoja karių pažangumą “Bazinio inžinerinio parengimo” kurso metu.

II. DUOMENŲ LENTELĖ

Šiam tikslui naudojamas bendras “Bazinio inžinerinio parengimo” kursų įskaitų ir praktinių pratybų žiniaraštis (priedas Nr. 1). Šios lentelės pagalba sudaroma kuklesnė duomenų lentelė, įtraukiant į ją tik reikalingus mums duomenis (priedas Nr. 2).

III. IŠPLĖSTINĖ DAŽNIŲ LENTELĖ

Dažnių lentelės pagalba pavaizduosiu turimus duomenis kiek vaizdžiau ir suprantamiau. Lentelę suskirstysiu į keturis intervalus, kadangi minėtų kursų metu vertinimas vyksta penkių balų sistemoje, o mažiausias įvertinimas – 2 balai (lentelė Nr. 1). Šioje lentelėje taip pat apskaičiuoju ir papildomus duomenis, kurie bus reikalingi tolimesnėje tyrimo eigoje.

Požymis(balai) Paprastasisdažnis Procentinisdažnis Augantis (sukauptas)dažnis Augantis procentinisdažnis Santykinisdažnis1 < x < 2 17 21.8% 17 21,8% 0,222 < x < 3 2 2.6% 19 24,4% 0,033 < x < 4 56 71.8% 75 96,2% 0,724 < x < 5 3 3.8% 78 100% 0,04å 78 100% 1,00

Lentelė Nr. 1 Išplėstinė dažnių lentelė.

IV. DIAGRAMOS

Duomenis, esančius lentelėje, galima pavaizduoti įvairių diagramų pagalba. Šiuo atveju pavaizduoti vienetinį įvertinimų pasiskirstymą panaudojau stulpelinę diagramą, o procentinį įvertinimų pasiskirstymą pavaizdavau skritulinės diagramos pagalba (pav. 1 ir pav. 2).

Pav. 1 Vienetinis įvertinimų pasiskirstymas.

Pav. 2 Procentinis įvertinimų pasiskirstymas.

V. SKAITINĖS DUOMENŲ CHARAKTERISTIKOS

Šioje skiltyje pateikiu pagrindines skaitinių duomenų charakteristikų apskaičiavimo būdus, bei galutinę šių charakteristikų lentelę (lentelė Nr. 2, 3, 4).

1. Poslinkio charakteristikos.

a. Vidurkis. Vidurkis gali būti paprastasis ir svertinis:

Paprastasis vidurkis:

Svertinis vidurkis:

čia -intervalo vidurys -paprastasis dažnis -atvejų skaičius

4 Šiuo atveju vidurkį apskaičiuoju naudodamas svertinio vidurkio formulę:

Vidutiniškai kariai įvertinami 3,1 balais (patenkinamai).

b. Moda. Tai dažniausiai pasikartojantis stebėjimas. Naudojantis dažnių lentele Moda apskaičiuojama pagal sekančią formulę:

čia: – modalinio intervalo apatinė riba – modalinio intervalo dydis – priešmodalinio intervalo dažnis – modalinio intervalo dažnis – pomodalinio intervalo dažnis

taigi:

Dažniausiai kariai įvertinami 3,5 balais.

Intervalo vid.xi xifi Vidurkisx MAX fi xo h f1 f2 f3 ModaMo1,5 25,5 2,5 5 3,5 196 4,5 13,5 SUM: 240 3,1 56 3 1 2 56 3 3,5

Lentelė Nr. 2 Skaitinės duomenų charakteristikos (Vidurkis, Moda).

c. Mediana. Tai sutvarkytos variacinės eilės vidurinis skaičius. Naudojantis dažnių lentele Mediana apskaičiuojama pagal sekančią formulę:

čia: – medianinio intervalo apatinė riba – medianinio intervalo dydis – dažnių suma iki medianinio intervalo (randama iš sukauptų dažnio stulpelio) – medianinio varianto numeris – medianinio intervalo paprastasis dažnis

taigi:

Mediana nusako, jog pusė karių įvertinami mažiau nei 3,36 balai, o kita pusė daugiau nei 3,36 balai.Kadangi vidurkis mažesnis už medianą, o moda didesnė už vidurkį ir medianą, turime kairiašonę asimetriją (nėra didelių skaičių palyginus dideliame kiekyje reikšmių ir duomenys koncentruojasi);

S Fme h xo Mediana(Me)

39 19 56 1 3 3,36

Lentelė Nr. 3 Skaitinės duomenų charakteristikos (Mediana).

2. Sklaidos charakteristikos. a. Imties plotis. Tai maksimalios ir minimalios statistinių duomenų reikšmės skirtumas. Imties plotis randamas iš didžiausios reikšmės atėmus mažiausią reikšmę:

taigi:

Imties plotis lygus 4 – kariai gali būti įvertinti 4 būdais (variantais) t. y. 2, 3, 4, ir 5 balais;

b. Tiesinis nuokrypis. Tai sklaidos charakteristika apibrėžiama kaip variantų nuokrypių nuo vidurkio vidurkinis dydis. Apskaičiuoti galima dviem būdais:

Jeigu duomenys nesutvarkyti:

Jeigu duomenys sutvarkyti:

4 Šiuo atveju naudotoju formulę, skirtą naudojimui kai duomenys sutvarkyti:

Vidurkis turi laisvumą ± 0,72 t. y. nuo 2,38 iki 3,82. Tačiau statistikoje pirmenybė teikiama vidutiniam kvadratiniam nuokrypiui.

c. Dispersija. Tai variantų nuokrypio nuo vidurkio kvadratų vidurkinis dydis. Apskaičiuoti galima dviem būdais:

Kai duomenys nesutvarkyti:

Kai duomenys sutvarkyti:

4 Šiuo atveju naudotoju formulę, skirtą naudojimui kai duomenys sutvarkyti:

Dispersija neturi matavimo vieneto, ji yra tarpinė grandis apskaičiuojant vidutinį kvadratinį nuokrypį.

d. Vidutinis kvadratinis nuokrypis. Tai dydis parodantis, kiek vidutiniškai požymio reikšmės yra nutolusios nuo vidurkio. Apskaičiuojama pagal formulę:

taigi:

Vidurkis turi laisvumą ± 0,87 t. y. nuo 2,23 iki 3,97.

Imties plotis Ties. nuokr.l(d) Dispersija Vid kvadrat. nuokr. 1,58 26,81 42,27 0,58 1,15 0,67 0,42 23,69 10,02 1,42 4,27 6,08 4 4,00 55,92 0,72 59,04 0,76 0,87

Lentelė Nr. 4 Skaitinės duomenų charakteristikos (Imties plotis, Tiesinis nuokrypis, Dispersija, Vidutinis kvadratinis nuokrypis).

VI. KORLIALECINĖ IR REGRESINĖ ANALIZĖ.

1. Regresija.Norint įvertinti statistinio ryšio formą (regresija) sudarau lentelę (priedas Nr. 3), kurios pagalba braižoma sklaidos diagrama (pav. 3). Priede Nr. 3 pavaizduotą lentelę galima sutraukti, parodant tik po vieną mums reikalingų duomenų (lentelė Nr. 5):

Eil. Nr. Įvertinimas(y) Išsilavinimas(x)1 4.0 12 4.0 210 2.0 117 2.0 227 4.0 341 5.0 347 5.0 256 3.0 167 5.0 4Suma: 279.00 120Vidurkis: 3.58 1.54

Lentelė Nr. 5 Koreliacinės regresinės analizės lentelė.

Pav. 3 Sklaidos diagrama.

Iš diagramos matome, kad priklausomybė yra tiesinė ir tiesioginė (kai x didėja, tai ir y didėja). Kadangi priklausomybė yra tiesinė, todėl regresinei kreivei išlyginti naudosime tiesei skirtas formules:

duomenis, apskaičiuotus remiantis šiomis formulėmis įrašome į lentelę Nr. 6.

Eil. Nr. Įvertinimas(y) Išsilavinimas(x) xy x2 b1 b0 y1 4.0 1 4.0 1.0 0.4753 2.8457 3.32 4.0 2 8.0 4.0 3.810 2.0 1 2.0 1.0 3.317 2.0 2 4.0 4.0 3.827 4.0 3 12.0 9.0 4.341 5.0 3 15.0 9.0 4.347 5.0 2 10.0 4.0 3.856 3.0 1 3.0 1.0 3.367 5.0 4 20.0 16.0 4.7Suma: 279.00 120 447 222 279Vidurkis: 3.58 1.54 5.73 2.85 3.58

Lentelė Nr. 6 Koreliacinės regresinės analizės lentelė.

Pav. 4 Sklaidos diagrama (po regresinės kreivės išlyginimo).

Išlyginta regresinė kreivė dar kartą įrodo, kad priklausomybė yra tiesinė ir tiesioginė (kai x didėja, tai ir y didėja).

2. Koreliacija.Koreliacinė analizė ištiria ryšio tarp priežasties ir padarinio stiprumą. Tai vykdoma naudojantis sekančiomis formulėmis, bei sudaroma lentelė Nr. 7.

a. Bendrasis, klaidų ir regresinis nuokrypiai. Kuo mažiau skiriasi bendrasis nuokrypis nuo regresinio nuokrypio, tuo geriau regresinė kreivė atitinka eksperimentinius duomenis.

– bendrasis nuokrypis

– klaidų nuokrypis

– regresinis nuokrypis

b. Determinacijos koeficientas. Tai santykis tarp regresinio nuokrypio ir bendrojo nuokrypio kvadratų sumų. Rezultatas parodo kiek y variacijos yra paaiškinama nepriklausomu kintamuoju x.

r2 = 0,14, tai reiškia, kad tik 14% y variacijos (išsibarstymo) paaiškinama nepriklausomu kintamuoju x.

c. Koreliacijos koeficientas. Kuo koeficiento reikšmė artimesnė |1|, tuo ryšys tarp x ir y stipresnis ir atvirkščiai – kuo artimesnė 0 – tuo silpnesnis. 4Koeficiento ženklas turi sutapti su koeficiento b1 ženklu ir su regresinės kreivės forma.

Ryšys tarp priežasties ir padarinio yra silpnas.

d. Koreliacijos indeksas. Kuo koeficiento reikšmė artimesnė 1, tuo ryšys tarp x ir y stipresnis ir atvirkščiai – kuo artimesnė 0 – tuo silpnesnis.

Ryšys tarp priežasties ir padarinio yra silpnas.

Eil. Nr. Klaidų nuokrypis( y – y )2 Regresinis nuokrypis( y – y )2 Bendrasis nuokrypis( y – y )2 Determinacijos koeficientas( r2 ) Koreliacijos koeficientas( r ) Koreliacijos indeksas( R )1 0.46 0.07 0.18 0.14 0.38 0.382 0.04 0.05 0.18 10 1.75 0.07 2.49 17 3.23 0.05 2.49 27 0.07 0.48 0.18 41 0.53 0.48 2.03 47 1.45 0.05 2.03 56 0.10 0.07 0.33 67 0.06 1.37 2.03 Suma: 50.59 8.45 59.04 Vidurkis:

Lentelė Nr. 7 Koreliacija.

VII. PIRSONO IR ČIUPROVO RODIKLIAI.

Kadangi šiuo atveju požymiai turi daugiau nei 2 reikšmes, tai ryšio tarp priežasties ir padarinio glaudumui išmatuoti naudoju Pirsono ir Čiuprovo rodiklius. Duomenys pateikiami lentelėje Nr. 8 bei stulpelinėje diagramoje (pav. 5). Rodikliai apskaičiuojami naudojantis sekančiomis formulėmis:

Balai Nebaigtas vidurinis Vidurinis Aukštesnysis Aukštasis Viso:2 14 3 0 0 173 2 0 0 0 24 28 23 5 0 565 0 1 1 1 3Viso: 44 27 6 1 78 78

Lentelė Nr. 8 Lentelė neparametriniams ryšiams.

Pav. 5 Įvertinimų pasiskirstymas priklausomai nuo išsilavinimo.

Pirsono rodiklis:

Čiuprovo rodiklis:

čia:

ir – grupės skaičius pagal atitinkantį požymį (šiuo atveju = 4; = 4)

Skaičiavimų rezultatai konkrečiu atveju yra:

taigi:

= 0,28 = 0,05 = 0,74 = 0,40 = 1,47 = 0,47 = 0,57 = 0,23

Abiejų rodiklių reikšmės gali svyruoti nuo 0 iki 1, o ryšiui patvirtinti reikalaujama, kad rodikliai būtų: C1 D 0,5, o C2 D 0,3. Pirmenybė teikiama Pirsono rodikliui. Šiuo atveju ryšys yra labai silpnas arba jo visai nėra.

VIII. IŠVADA.

Įvertinus visus duomenis, koreliacinę regresinę analizę, bei Pirsono ir Čiuprovo rodiklius galima daryti išvadą, jog civilinis išsilavinimas turi labai nedidelę įtaką karių pažangumui “Bazinio inžinerinio parengimo” kurso metu. Tai gali būti įtakojama tuo, kad didelę dalį teigiamų įvertinimų karai gauna praktinių pratybų poligonuose metu, o čia kaip žinia lemiamą vaidmenį atlieka daugiau regimoji atmintis bei praktiniai įgūdžiai nei išsilavinimas.

IX. LITERATŪRA

1. “Matematinė sportinių tyrimų statistika”. Kaunas. Šviesa. 1974.2. “Ekonominė statistika”. KTU. Kaunas”Technologija”. 2001.3. “Bendroji statistikos teorija”. Vilnius. Mintis. 1996.4. “Statistika ir jos taikymai”. Vilnius. 2000.