,,Statistinių metodų taikymas versle“

Projektas ,,Statistinių metodų taikymas versle“

Hipotezių tikrinimas. Koreliacinė ir regresinė analizė

Ataskaita

Verslo tyrimo objektas – VU TVM studentai, gyvenantys bendrabučiuose.

Hipotezės:

Vidutinė 1 km kelionės kaina studentui 0.04 – 0.08 Eur. (apie vidurkį).

Mažiausiai pusė respondentų yra ištikimi savo pasirinktai transporto priemonei (apie proporcijas).

Vidutiniškai vyrai už kelionę moka 1 eur. daugiau nei moterys (apie skirtumus tarp vidurkių).

3. Imties dydžio skaičiavimai, remiantis įverčių temoje pateiktomis formulėmis:

 

n – imties dydis

N – populiacijos dydis – 94 studentai

e – norima paklaida – 5% – 0.05

Imties dydis yra 76 studentai.

4. Duomenų rūšys: kokybiniai ir kiekybiniai duomenys.

Imties duomenys atvaizduoti grafiškai SPSS.

Įvertinkite jūsų pasirinktos transporto priemonės saugumą

 

 

 

 

 

N Valid 76
Missing 0
Mean 8,105
Std. Error of Mean ,1925
Median 8,500
Mode 9,0
Std. Deviation 1,6779
Variance 2,815
Range 7,0
Minimum 3,0
Maximum 10,0
Sum 616,0
Percentiles 25 7,000
50 8,500
75 9,000

 

Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, pasirinktos transporto priemonės saugumą duomenims yra būdinga kairiašonė asimetrija, nes vidurkis 8,11 mažesnis už medianą, lygią 8,5. Stačiakampė digrama taip pat aiškiai rodo kairiašonę asimetriją.

 

Kiek nepatogumų jums sukelia jūsų vežamas krovinys?

N Valid 75
Missing 1
Mean 1,960
Std. Error of Mean ,0858
Median 2,000
Mode 2,0
Std. Deviation ,7433
Variance ,552
Range 2,0
Minimum 1,0
Maximum 3,0
Sum 147,0
Percentiles 25 1,000
50 2,000
75 3,000

 

Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, nepatogumus vežant krovinį yra būdinga dešiniašonė asimetrija, nes vidurkis 2,12 didesnis už medianą, lygią 2,0. Stačiakampė digrama taip pat aiškiai rodo dešiniašonę asimetriją.

 

 

 

 

Kiek kainuoja kelionė į vieną pusę jūsų pasirinktu transportu?

N Valid 76
Missing 0
Mean 32,20
Std. Error of Mean 3,395
Median 20,00
Mode 15
Std. Deviation 29,599
Variance 876,081
Range 120
Minimum 0
Maximum 120
Sum 2447
Percentiles 25 15,00
50 20,00
75 38,00

 

 

 

 

 

 

Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, kelionės kainą pasirinkta transporto priemone duomenims yra būdinga dešiniašonė asimetrija, nes vidurkis 32,2 didesnis už medianą, lygią 20,0. Stačiakampė digrama taip pat aiškiai rodo dešiniašonę asimetriją. Susidarė nemaža dalis išskirčių, nes, priklausomai nuo pasirinktos transporto priemonės, išlaidos kelionei smarkiai skiriasi. Pavyzdžiui, važiuojantys nuosavu automobiliu ir neimantys pakeleivių moka kelis kartus daugiau nei tie, kurie pasirenka kitą kelionės būdą.

6. Pasikliautinojo intervalinio įverčio vidurkiui skaičiavimas remiantis MS Excel pagalba.

Pasikliautinasis intervalas vidurkiui:

 

29,44276 – 6,090189 ≤ μ ≤ 29,44276 + 6,090189

23,35 ≤ μ ≤ 35,53

 

Column1
Mean 29,44276
Standard Error 3,057167
Median 20
Mode 15
Standard Deviation 26,65176
Sample Variance 710,3165
Kurtosis 4,298402
Skewness 2,160259
Range 125
Minimum 5
Maximum 130
Sum 2237,65
Count 76
Confidence Level(95,0%) 6,090189

 

Pasikliautinasis intervalas proporcijoms:

 

0,81 1,96 * * 0,81 + 1,96 * *

 

0,81 1,96 * * 0,81 + 1,96 * *

0,81 0,03 ≤ 0,81 + 0,03

 

7. Hipotezių tikrinimas panaudojant du požiūrius: kritinės reikšmės ir p-reikšmės.

8. Patikrinti, ar patenkintos tikrinimui būtinos prielaidos (duomenų pasiskirstymo normalumas, ar np>=5, n(1-p)>=5, tikėtini dažniai mažiausiai 5 chi-kvadrato lentelėse, ar dispersijos lygios ir pan.)

9. Įverčių ir hipotezių tikrinimo išvados sąryšis.

10. Intervalų ir santykių matavimų skalės bivariaciniams duomenims:

Nustatyti, kuris kintamasis yra priklausomas ir kuris nepriklausomas.

Priklausomas kintamasis Y – kelionės kaina (Lt.), jis priklauso nuo nepriklausomo kintamojo X – atstumas (km).

Nubrėžti sklaidos diagramą.

Grafikas, kuriame atidėtos abiejų kintamūjų poros rodo, kad yra….(įrašysim ką nors )

Atstumo (km.) Ir išlaidų kelionei (Lt.) ryšys: didėjant atstumui tarp Vilniaus ir kelionės tikslo, didėja ir kelionei reikalingų išlaidų apimtis.

Apskaičiuoti koreliacijos koeficientą ir patikrinti jo reikšmingumą.

MS Excel pagalba gauta koreliacijos matrica. Pagal Pirsono tiesinės koreliacijos koeficiento interpretavimą gauta teigiama reikšmė: r = 0,430317 yra vidutinio stiprumo laipsnio.

 

Column 1 Column 2
Column 1 1
Column 2 0,430317 1

 

Apskaičiuoti determinacijos koeficientą. Pakomentuoti.

SUMMARY OUTPU

Regression Statistics

Multiple R

0,430317

Determinacijos koeficientas

R Square

0,185173

Adjusted R Square

0,174162

Standard Error

24,21384

Observations

76

Regresijos kvadratų suma

Nepaaiškinta kvadratų suma

Visa kvadratų suma

ANOVA

df

SS

MS

F

Significance F

Regression

1

9859,879

9859,879

16,81683

0,000105

Residual

74

43386,96

586,3103

Total

75

53246,84

b0

 

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Lower 95,0%

Upper 95,0%

b1

Intercept

5,138534

6,548123

0,784734

0,435115

-7,90889

18,18595

-7,90889

18,18595

km

0,135682

0,033086

4,100833

0,000105

0,069756

0,201608

0,069756

0,201608

 

VKS = NKS + RKS

53246,84 = 43386,96 + 9859,879

r2 = = = 0,185173037099336

Sudarytoje regresijos tiesėje atstumas km paaiškina 18 procentų išlaidų kelionei variacijos, o kitus 82 procentus išlaidų variacijos paaiškina kiti nei atstumas veiksniai.

Tiems patiems duomenims sudaryti tiesinės regresijos lygtį ir panaudoti ją numatymui.

b0 = 5,138534

b1 = 0,135682

= = 179,22

 

= = 29,46

b0 = 29,46 – 0,135682 179,22 = 5,14

Pavadinimų skalės duomenims apskaičiuoti Chi-kvadrato pagrindu sudarytus ryšio rodiklius, patikrinti hipotezę apie kintamųjų nepriklausomumą.

11.Hipotezių tikrinimas

1.Vidutinė 1 km kelionės kaina studentui 0.06 Eur. (apie vidurkį).

a)Kolmogorov-Smirnov testas

One-Sample Test
Test Value = 0
t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference
Lower Upper
KAINA 9,643 75 ,000 29,46711 23,3794 35,5548
Atstumas km 2,024 76 ,047 353,792 5,59 702,00

 

One-Sample Kolmogorov-Smirnov Test
KAINA KM
N 76 76
Normal Parametersa,b Mean 29,4671 179,2237
Std. Deviation 26,64074 84,50524
Most Extreme Differences Absolute ,281 ,205
Positive ,281 ,205
Negative -,195 -,167
Test Statistic ,281 ,205
Asymp. Sig. (2-tailed) ,000c ,000c

Normalumo prielaida atmetame hipotezei apie vidutinę 1km kelionės kaina studentui 0.04 – 0.08 Eur

Jeigu p reikšmė mažesnė 0,05, normalumo prielaida atmetama, jei didesnė negu 0,05, nėra įrodymų, kad pasiskirstymas nėra normalusis.

 

b)T-tirkinimas

 

One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
KAINA 76 29,4414 26,65023 3,05699

 

 

One-Sample Test
Test Value = 0.06
t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference
Lower Upper
KAINA 9,611 75 ,000 29,38145 23,2916 35,4713

 

Kadangi p < 0,05, tai H0 atmetama, Vidutinė 1 km kelionės kaina studentui 0.06 Eur, esant 5 proc. reikšmingumo lygmeniui. Nėra įrodymų, kad vidutinė 1 km kelionės kaina studentui 0.06 Eur.

Vidutiniškai vyrai už kelionę moka 1 eur. daugiau nei moterys

(apie skirtumus tarp vidurkių).

1-moterys

2-vyrai

Group Statistics
LYTIS N Mean Std. Deviation Std. Error Mean
KAINA 1 47 24,5500 25,11751 3,66377
2 29 37,3690 27,58082 5,12163

 

Levene’s Test for Equality of Variances t-test for Equality of Means
F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference
Lower Upper
3,019 ,086 -2,082 74 ,041 -12,81897 6,15766 -25,08837 -,54956
-2,036 55,192 ,047 -12,81897 6,29716 -25,43778 -,20015

 

Šiuo atveju išvadas formuluojame pagal pirmąją eilutę.

H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Lentelėje paryškinta Leveneʼs Test for Equaliry of Variances Sig.=0,115 ir p reikšmė (p=0,076).

Kadangi Leveneʼs Test for Equality of Variance Sig. stulpelyje esanti reikšmė yra didesnė, nei 0,05, tai gauta p-reikšmė p = 0,076. Kadangi p>0,05, tai H0 neatmetama ir patvirtina, kad nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių., esant 5 proc. reikšmingumo lygmeniui. Skirtumas šiuo lygmeniu nėra statistiškai reikšmingas.

Hipotezės apie skirtumą tarp dviejų vidurkių tikrinimas rankiniu būdu

Hipotezė: „Nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių.“

Naudojant SPSS programą nustatėme, kad abiejų populiacijų dispersijos vienodos.

Hipotezės tikrinimas:

H0: µ1 – µ2 = 0

H1: µ1 – µ2 ≠ 0.

Naudojamas dvipusis tikrinimas.

Tarkime, kad α = 0,05.

n1 = 34, n2 = 56. Stjudento t statistinis kriterijus.

t statistinio kriterijaus tα/2, (n1 + n2 – 2) iš plotų po Sjudento t kreive lentelės dvipusiam tikrinimui su (n1 + n2 – 2) = 34+56-2=88 laisvės laipsnių yra 1,96. Jeigu apskaičiuotasis t (nepaisant ženklo) bus didesnis negu 1,96, nulinė hipotezė atmetama, kai reikšmingumo lygmuo 5 proc.

Atlikus imties tyrimą gauta:= 1104,91 su nepaslinktuoju s12 = 27 103,37 ir= 1033,73 su nepaslinktuoju s22 = 37 028,53.

Skaičiuojama turint galvoje nulinės hipotezės teiginį, kad µ1 – µ2 = 0,

t

1,96

-1,96

0

Atmesti H0

Atmesti H0

α=0,05

α=0,05

1,794

2 pav.

Apskaičiuotoji t reikšmė nepatenka į atmetimo sritį, todėl neatmetama nulinė hipotezė, kad nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių., esant 5 proc. reikšmingumo lygmeniui. Skirtumas šiuo lygmeniu nėra statistiškai reikšmingas.

Kaip matome, naudojant SPSS programą, gaunama ta pati išvada.