Projektas ,,Statistinių metodų taikymas versle“
Hipotezių tikrinimas. Koreliacinė ir regresinė analizė
Ataskaita
Verslo tyrimo objektas – VU TVM studentai, gyvenantys bendrabučiuose.
Hipotezės:
Vidutinė 1 km kelionės kaina studentui 0.04 – 0.08 Eur. (apie vidurkį).
Mažiausiai pusė respondentų yra ištikimi savo pasirinktai transporto priemonei (apie proporcijas).
Vidutiniškai vyrai už kelionę moka 1 eur. daugiau nei moterys (apie skirtumus tarp vidurkių).
3. Imties dydžio skaičiavimai, remiantis įverčių temoje pateiktomis formulėmis:
n – imties dydis
N – populiacijos dydis – 94 studentai
e – norima paklaida – 5% – 0.05
Imties dydis yra 76 studentai.
4. Duomenų rūšys: kokybiniai ir kiekybiniai duomenys.
Imties duomenys atvaizduoti grafiškai SPSS.
Įvertinkite jūsų pasirinktos transporto priemonės saugumą
N | Valid | 76 |
Missing | 0 | |
Mean | 8,105 | |
Std. Error of Mean | ,1925 | |
Median | 8,500 | |
Mode | 9,0 | |
Std. Deviation | 1,6779 | |
Variance | 2,815 | |
Range | 7,0 | |
Minimum | 3,0 | |
Maximum | 10,0 | |
Sum | 616,0 | |
Percentiles | 25 | 7,000 |
50 | 8,500 | |
75 | 9,000 |
Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, pasirinktos transporto priemonės saugumą duomenims yra būdinga kairiašonė asimetrija, nes vidurkis 8,11 mažesnis už medianą, lygią 8,5. Stačiakampė digrama taip pat aiškiai rodo kairiašonę asimetriją.
Kiek nepatogumų jums sukelia jūsų vežamas krovinys?
N | Valid | 75 |
Missing | 1 | |
Mean | 1,960 | |
Std. Error of Mean | ,0858 | |
Median | 2,000 | |
Mode | 2,0 | |
Std. Deviation | ,7433 | |
Variance | ,552 | |
Range | 2,0 | |
Minimum | 1,0 | |
Maximum | 3,0 | |
Sum | 147,0 | |
Percentiles | 25 | 1,000 |
50 | 2,000 | |
75 | 3,000 |
Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, nepatogumus vežant krovinį yra būdinga dešiniašonė asimetrija, nes vidurkis 2,12 didesnis už medianą, lygią 2,0. Stačiakampė digrama taip pat aiškiai rodo dešiniašonę asimetriją.
Kiek kainuoja kelionė į vieną pusę jūsų pasirinktu transportu?
N | Valid | 76 |
Missing | 0 | |
Mean | 32,20 | |
Std. Error of Mean | 3,395 | |
Median | 20,00 | |
Mode | 15 | |
Std. Deviation | 29,599 | |
Variance | 876,081 | |
Range | 120 | |
Minimum | 0 | |
Maximum | 120 | |
Sum | 2447 | |
Percentiles | 25 | 15,00 |
50 | 20,00 | |
75 | 38,00 |
Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, kelionės kainą pasirinkta transporto priemone duomenims yra būdinga dešiniašonė asimetrija, nes vidurkis 32,2 didesnis už medianą, lygią 20,0. Stačiakampė digrama taip pat aiškiai rodo dešiniašonę asimetriją. Susidarė nemaža dalis išskirčių, nes, priklausomai nuo pasirinktos transporto priemonės, išlaidos kelionei smarkiai skiriasi. Pavyzdžiui, važiuojantys nuosavu automobiliu ir neimantys pakeleivių moka kelis kartus daugiau nei tie, kurie pasirenka kitą kelionės būdą.
6. Pasikliautinojo intervalinio įverčio vidurkiui skaičiavimas remiantis MS Excel pagalba.
Pasikliautinasis intervalas vidurkiui:
29,44276 – 6,090189 ≤ μ ≤ 29,44276 + 6,090189
23,35 ≤ μ ≤ 35,53
Column1 | |
Mean | 29,44276 |
Standard Error | 3,057167 |
Median | 20 |
Mode | 15 |
Standard Deviation | 26,65176 |
Sample Variance | 710,3165 |
Kurtosis | 4,298402 |
Skewness | 2,160259 |
Range | 125 |
Minimum | 5 |
Maximum | 130 |
Sum | 2237,65 |
Count | 76 |
Confidence Level(95,0%) | 6,090189 |
Pasikliautinasis intervalas proporcijoms:
0,81 1,96 * * ≤ 0,81 + 1,96 * *
0,81 1,96 * * ≤ 0,81 + 1,96 * *
0,81 0,03 ≤ 0,81 + 0,03
7. Hipotezių tikrinimas panaudojant du požiūrius: kritinės reikšmės ir p-reikšmės.
8. Patikrinti, ar patenkintos tikrinimui būtinos prielaidos (duomenų pasiskirstymo normalumas, ar np>=5, n(1-p)>=5, tikėtini dažniai mažiausiai 5 chi-kvadrato lentelėse, ar dispersijos lygios ir pan.)
9. Įverčių ir hipotezių tikrinimo išvados sąryšis.
10. Intervalų ir santykių matavimų skalės bivariaciniams duomenims:
Nustatyti, kuris kintamasis yra priklausomas ir kuris nepriklausomas.
Priklausomas kintamasis Y – kelionės kaina (Lt.), jis priklauso nuo nepriklausomo kintamojo X – atstumas (km).
Nubrėžti sklaidos diagramą.
Grafikas, kuriame atidėtos abiejų kintamūjų poros rodo, kad yra….(įrašysim ką nors )
Atstumo (km.) Ir išlaidų kelionei (Lt.) ryšys: didėjant atstumui tarp Vilniaus ir kelionės tikslo, didėja ir kelionei reikalingų išlaidų apimtis.
Apskaičiuoti koreliacijos koeficientą ir patikrinti jo reikšmingumą.
MS Excel pagalba gauta koreliacijos matrica. Pagal Pirsono tiesinės koreliacijos koeficiento interpretavimą gauta teigiama reikšmė: r = 0,430317 yra vidutinio stiprumo laipsnio.
Column 1 | Column 2 | |
Column 1 | 1 | |
Column 2 | 0,430317 | 1 |
Apskaičiuoti determinacijos koeficientą. Pakomentuoti.
SUMMARY OUTPU
Regression Statistics
Multiple R
0,430317
Determinacijos koeficientas
R Square
0,185173
Adjusted R Square
0,174162
Standard Error
24,21384
Observations
76
Regresijos kvadratų suma
Nepaaiškinta kvadratų suma
Visa kvadratų suma
ANOVA
df
SS
MS
F
Significance F
Regression
1
9859,879
9859,879
16,81683
0,000105
Residual
74
43386,96
586,3103
Total
75
53246,84
b0
Coefficients
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
Lower 95,0%
Upper 95,0%
b1
Intercept
5,138534
6,548123
0,784734
0,435115
-7,90889
18,18595
-7,90889
18,18595
km
0,135682
0,033086
4,100833
0,000105
0,069756
0,201608
0,069756
0,201608
VKS = NKS + RKS
53246,84 = 43386,96 + 9859,879
r2 = = = 0,185173037099336
Sudarytoje regresijos tiesėje atstumas km paaiškina 18 procentų išlaidų kelionei variacijos, o kitus 82 procentus išlaidų variacijos paaiškina kiti nei atstumas veiksniai.
Tiems patiems duomenims sudaryti tiesinės regresijos lygtį ir panaudoti ją numatymui.
b0 = 5,138534
b1 = 0,135682
= = 179,22
= = 29,46
b0 = 29,46 – 0,135682 179,22 = 5,14
Pavadinimų skalės duomenims apskaičiuoti Chi-kvadrato pagrindu sudarytus ryšio rodiklius, patikrinti hipotezę apie kintamųjų nepriklausomumą.
11.Hipotezių tikrinimas
1.Vidutinė 1 km kelionės kaina studentui 0.06 Eur. (apie vidurkį).
a)Kolmogorov-Smirnov testas
One-Sample Test | ||||||
Test Value = 0 | ||||||
t | df | Sig. (2-tailed) | Mean Difference | 95% Confidence Interval of the Difference | ||
Lower | Upper | |||||
KAINA | 9,643 | 75 | ,000 | 29,46711 | 23,3794 | 35,5548 |
Atstumas km | 2,024 | 76 | ,047 | 353,792 | 5,59 | 702,00 |
One-Sample Kolmogorov-Smirnov Test | |||
KAINA | KM | ||
N | 76 | 76 | |
Normal Parametersa,b | Mean | 29,4671 | 179,2237 |
Std. Deviation | 26,64074 | 84,50524 | |
Most Extreme Differences | Absolute | ,281 | ,205 |
Positive | ,281 | ,205 | |
Negative | -,195 | -,167 | |
Test Statistic | ,281 | ,205 | |
Asymp. Sig. (2-tailed) | ,000c | ,000c | |
Normalumo prielaida atmetame hipotezei apie vidutinę 1km kelionės kaina studentui 0.04 – 0.08 Eur
Jeigu p reikšmė mažesnė už 0,05, normalumo prielaida atmetama, jei didesnė negu 0,05, nėra įrodymų, kad pasiskirstymas nėra normalusis.
b)T-tirkinimas
One-Sample Statistics | ||||
N | Mean | Std. Deviation | Std. Error Mean | |
KAINA | 76 | 29,4414 | 26,65023 | 3,05699 |
One-Sample Test | ||||||
Test Value = 0.06 | ||||||
t | df | Sig. (2-tailed) | Mean Difference | 95% Confidence Interval of the Difference | ||
Lower | Upper | |||||
KAINA | 9,611 | 75 | ,000 | 29,38145 | 23,2916 | 35,4713 |
Kadangi p < 0,05, tai H0 atmetama, Vidutinė 1 km kelionės kaina studentui 0.06 Eur, esant 5 proc. reikšmingumo lygmeniui. Nėra įrodymų, kad vidutinė 1 km kelionės kaina studentui 0.06 Eur.
Vidutiniškai vyrai už kelionę moka 1 eur. daugiau nei moterys
(apie skirtumus tarp vidurkių).
1-moterys
2-vyrai
Group Statistics | |||||
LYTIS | N | Mean | Std. Deviation | Std. Error Mean | |
KAINA | 1 | 47 | 24,5500 | 25,11751 | 3,66377 |
2 | 29 | 37,3690 | 27,58082 | 5,12163 |
Levene’s Test for Equality of Variances | t-test for Equality of Means | |||||||||
F | Sig. | t | df | Sig. (2-tailed) | Mean Difference | Std. Error Difference | 95% Confidence Interval of the Difference | |||
Lower | Upper | |||||||||
3,019 | ,086 | -2,082 | 74 | ,041 | -12,81897 | 6,15766 | -25,08837 | -,54956 | ||
-2,036 | 55,192 | ,047 | -12,81897 | 6,29716 | -25,43778 | -,20015 |
Šiuo atveju išvadas formuluojame pagal pirmąją eilutę.
H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Lentelėje paryškinta Leveneʼs Test for Equaliry of Variances Sig.=0,115 ir p reikšmė (p=0,076).
Kadangi Leveneʼs Test for Equality of Variance Sig. stulpelyje esanti reikšmė yra didesnė, nei 0,05, tai gauta p-reikšmė p = 0,076. Kadangi p>0,05, tai H0 neatmetama ir patvirtina, kad nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių., esant 5 proc. reikšmingumo lygmeniui. Skirtumas šiuo lygmeniu nėra statistiškai reikšmingas.
Hipotezės apie skirtumą tarp dviejų vidurkių tikrinimas rankiniu būdu
Hipotezė: „Nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių.“
Naudojant SPSS programą nustatėme, kad abiejų populiacijų dispersijos vienodos.
Hipotezės tikrinimas:
H0: µ1 – µ2 = 0
H1: µ1 – µ2 ≠ 0.
Naudojamas dvipusis tikrinimas.
Tarkime, kad α = 0,05.
n1 = 34, n2 = 56. Stjudento t statistinis kriterijus.
t statistinio kriterijaus tα/2, (n1 + n2 – 2) iš plotų po Sjudento t kreive lentelės dvipusiam tikrinimui su (n1 + n2 – 2) = 34+56-2=88 laisvės laipsnių yra 1,96. Jeigu apskaičiuotasis t (nepaisant ženklo) bus didesnis negu 1,96, nulinė hipotezė atmetama, kai reikšmingumo lygmuo 5 proc.
Atlikus imties tyrimą gauta:= 1104,91 su nepaslinktuoju s12 = 27 103,37 ir= 1033,73 su nepaslinktuoju s22 = 37 028,53.
Skaičiuojama turint galvoje nulinės hipotezės teiginį, kad µ1 – µ2 = 0,
t
1,96
-1,96
0
Atmesti H0
Atmesti H0
α=0,05
α=0,05
1,794
2 pav.
Apskaičiuotoji t reikšmė nepatenka į atmetimo sritį, todėl neatmetama nulinė hipotezė, kad nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių., esant 5 proc. reikšmingumo lygmeniui. Skirtumas šiuo lygmeniu nėra statistiškai reikšmingas.
Kaip matome, naudojant SPSS programą, gaunama ta pati išvada.