,,Statistinių metodų taikymas versle“

Projektas ,,Statistinių metodų taikymas versle“

Hipotezių tikrinimas. Koreliacinė ir regresinė analizė

Ataskaita

Verslo tyrimo objektas – VU TVM studentai, gyvenantys bendrabučiuose.

Hipotezės:

Vidutinė 1 km kelionės kaina studentui 0.04 – 0.08 Eur. (apie vidurkį).

Mažiausiai pusė respondentų yra ištikimi savo pasirinktai transporto priemonei (apie proporcijas).

Vidutiniškai vyrai už kelionę moka 1 eur. daugiau nei moterys (apie skirtumus tarp vidurkių).

3. Imties dydžio skaičiavimai, remiantis įverčių temoje pateiktomis formulėmis:

 

n – imties dydis

N – populiacijos dydis – 94 studentai

e – norima paklaida – 5% – 0.05

Imties dydis yra 76 studentai.

4. Duomenų rūšys: kokybiniai ir kiekybiniai duomenys.

Imties duomenys atvaizduoti grafiškai SPSS.

Įvertinkite jūsų pasirinktos transporto priemonės saugumą

 

 

 

 

 

NValid76
Missing0
Mean8,105
Std. Error of Mean,1925
Median8,500
Mode9,0
Std. Deviation1,6779
Variance2,815
Range7,0
Minimum3,0
Maximum10,0
Sum616,0
Percentiles257,000
508,500
759,000

 

Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, pasirinktos transporto priemonės saugumą duomenims yra būdinga kairiašonė asimetrija, nes vidurkis 8,11 mažesnis už medianą, lygią 8,5. Stačiakampė digrama taip pat aiškiai rodo kairiašonę asimetriją.

 

Kiek nepatogumų jums sukelia jūsų vežamas krovinys?

NValid75
Missing1
Mean1,960
Std. Error of Mean,0858
Median2,000
Mode2,0
Std. Deviation,7433
Variance,552
Range2,0
Minimum1,0
Maximum3,0
Sum147,0
Percentiles251,000
502,000
753,000

 

Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, nepatogumus vežant krovinį yra būdinga dešiniašonė asimetrija, nes vidurkis 2,12 didesnis už medianą, lygią 2,0. Stačiakampė digrama taip pat aiškiai rodo dešiniašonę asimetriją.

 

 

 

 

Kiek kainuoja kelionė į vieną pusę jūsų pasirinktu transportu?

NValid76
Missing0
Mean32,20
Std. Error of Mean3,395
Median20,00
Mode15
Std. Deviation29,599
Variance876,081
Range120
Minimum0
Maximum120
Sum2447
Percentiles2515,00
5020,00
7538,00

 

 

 

 

 

 

Pavyzdyje apie VU TVM studentų, gyvenančių bendrabučiuose, kelionės kainą pasirinkta transporto priemone duomenims yra būdinga dešiniašonė asimetrija, nes vidurkis 32,2 didesnis už medianą, lygią 20,0. Stačiakampė digrama taip pat aiškiai rodo dešiniašonę asimetriją. Susidarė nemaža dalis išskirčių, nes, priklausomai nuo pasirinktos transporto priemonės, išlaidos kelionei smarkiai skiriasi. Pavyzdžiui, važiuojantys nuosavu automobiliu ir neimantys pakeleivių moka kelis kartus daugiau nei tie, kurie pasirenka kitą kelionės būdą.

6. Pasikliautinojo intervalinio įverčio vidurkiui skaičiavimas remiantis MS Excel pagalba.

Pasikliautinasis intervalas vidurkiui:

 

29,44276 – 6,090189 ≤ μ ≤ 29,44276 + 6,090189

23,35 ≤ μ ≤ 35,53

 

Column1
Mean29,44276
Standard Error3,057167
Median20
Mode15
Standard Deviation26,65176
Sample Variance710,3165
Kurtosis4,298402
Skewness2,160259
Range125
Minimum5
Maximum130
Sum2237,65
Count76
Confidence Level(95,0%)6,090189

 

Pasikliautinasis intervalas proporcijoms:

 

0,81 1,96 * * 0,81 + 1,96 * *

 

0,81 1,96 * * 0,81 + 1,96 * *

0,81 0,03 ≤ 0,81 + 0,03

 

7. Hipotezių tikrinimas panaudojant du požiūrius: kritinės reikšmės ir p-reikšmės.

8. Patikrinti, ar patenkintos tikrinimui būtinos prielaidos (duomenų pasiskirstymo normalumas, ar np>=5, n(1-p)>=5, tikėtini dažniai mažiausiai 5 chi-kvadrato lentelėse, ar dispersijos lygios ir pan.)

9. Įverčių ir hipotezių tikrinimo išvados sąryšis.

10. Intervalų ir santykių matavimų skalės bivariaciniams duomenims:

Nustatyti, kuris kintamasis yra priklausomas ir kuris nepriklausomas.

Priklausomas kintamasis Y – kelionės kaina (Lt.), jis priklauso nuo nepriklausomo kintamojo X – atstumas (km).

Nubrėžti sklaidos diagramą.

Grafikas, kuriame atidėtos abiejų kintamūjų poros rodo, kad yra….(įrašysim ką nors )

Atstumo (km.) Ir išlaidų kelionei (Lt.) ryšys: didėjant atstumui tarp Vilniaus ir kelionės tikslo, didėja ir kelionei reikalingų išlaidų apimtis.

Apskaičiuoti koreliacijos koeficientą ir patikrinti jo reikšmingumą.

MS Excel pagalba gauta koreliacijos matrica. Pagal Pirsono tiesinės koreliacijos koeficiento interpretavimą gauta teigiama reikšmė: r = 0,430317 yra vidutinio stiprumo laipsnio.

 

Column 1Column 2
Column 11
Column 20,4303171

 

Apskaičiuoti determinacijos koeficientą. Pakomentuoti.

SUMMARY OUTPU

Regression Statistics

Multiple R

0,430317

Determinacijos koeficientas

R Square

0,185173

Adjusted R Square

0,174162

Standard Error

24,21384

Observations

76

Regresijos kvadratų suma

Nepaaiškinta kvadratų suma

Visa kvadratų suma

ANOVA

df

SS

MS

F

Significance F

Regression

1

9859,879

9859,879

16,81683

0,000105

Residual

74

43386,96

586,3103

Total

75

53246,84

b0

 

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Lower 95,0%

Upper 95,0%

b1

Intercept

5,138534

6,548123

0,784734

0,435115

-7,90889

18,18595

-7,90889

18,18595

km

0,135682

0,033086

4,100833

0,000105

0,069756

0,201608

0,069756

0,201608

 

VKS = NKS + RKS

53246,84 = 43386,96 + 9859,879

r2 = = = 0,185173037099336

Sudarytoje regresijos tiesėje atstumas km paaiškina 18 procentų išlaidų kelionei variacijos, o kitus 82 procentus išlaidų variacijos paaiškina kiti nei atstumas veiksniai.

Tiems patiems duomenims sudaryti tiesinės regresijos lygtį ir panaudoti ją numatymui.

b0 = 5,138534

b1 = 0,135682

= = 179,22

 

= = 29,46

b0 = 29,46 – 0,135682 179,22 = 5,14

Pavadinimų skalės duomenims apskaičiuoti Chi-kvadrato pagrindu sudarytus ryšio rodiklius, patikrinti hipotezę apie kintamųjų nepriklausomumą.

11.Hipotezių tikrinimas

1.Vidutinė 1 km kelionės kaina studentui 0.06 Eur. (apie vidurkį).

a)Kolmogorov-Smirnov testas

One-Sample Test
Test Value = 0
tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the Difference
LowerUpper
KAINA9,64375,00029,4671123,379435,5548
Atstumas km2,02476,047353,7925,59702,00

 

One-Sample Kolmogorov-Smirnov Test
KAINAKM
N7676
Normal Parametersa,bMean29,4671179,2237
Std. Deviation26,6407484,50524
Most Extreme DifferencesAbsolute,281,205
Positive,281,205
Negative-,195-,167
Test Statistic,281,205
Asymp. Sig. (2-tailed),000c,000c

Normalumo prielaida atmetame hipotezei apie vidutinę 1km kelionės kaina studentui 0.04 – 0.08 Eur

Jeigu p reikšmė mažesnė 0,05, normalumo prielaida atmetama, jei didesnė negu 0,05, nėra įrodymų, kad pasiskirstymas nėra normalusis.

 

b)T-tirkinimas

 

One-Sample Statistics
NMeanStd. DeviationStd. Error Mean
KAINA7629,441426,650233,05699

 

 

One-Sample Test
Test Value = 0.06
tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the Difference
LowerUpper
KAINA9,61175,00029,3814523,291635,4713

 

Kadangi p < 0,05, tai H0 atmetama, Vidutinė 1 km kelionės kaina studentui 0.06 Eur, esant 5 proc. reikšmingumo lygmeniui. Nėra įrodymų, kad vidutinė 1 km kelionės kaina studentui 0.06 Eur.

Vidutiniškai vyrai už kelionę moka 1 eur. daugiau nei moterys

(apie skirtumus tarp vidurkių).

1-moterys

2-vyrai

Group Statistics
LYTISNMeanStd. DeviationStd. Error Mean
KAINA14724,550025,117513,66377
22937,369027,580825,12163

 

Levene’s Test for Equality of Variancest-test for Equality of Means
FSig.tdfSig. (2-tailed)Mean DifferenceStd. Error Difference95% Confidence Interval of the Difference
LowerUpper
3,019,086-2,08274,041-12,818976,15766-25,08837-,54956
-2,03655,192,047-12,818976,29716-25,43778-,20015

 

Šiuo atveju išvadas formuluojame pagal pirmąją eilutę.

H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Lentelėje paryškinta Leveneʼs Test for Equaliry of Variances Sig.=0,115 ir p reikšmė (p=0,076).

Kadangi Leveneʼs Test for Equality of Variance Sig. stulpelyje esanti reikšmė yra didesnė, nei 0,05, tai gauta p-reikšmė p = 0,076. Kadangi p>0,05, tai H0 neatmetama ir patvirtina, kad nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių., esant 5 proc. reikšmingumo lygmeniui. Skirtumas šiuo lygmeniu nėra statistiškai reikšmingas.

Hipotezės apie skirtumą tarp dviejų vidurkių tikrinimas rankiniu būdu

Hipotezė: „Nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių.“

Naudojant SPSS programą nustatėme, kad abiejų populiacijų dispersijos vienodos.

Hipotezės tikrinimas:

H0: µ1 – µ2 = 0

H1: µ1 – µ2 ≠ 0.

Naudojamas dvipusis tikrinimas.

Tarkime, kad α = 0,05.

n1 = 34, n2 = 56. Stjudento t statistinis kriterijus.

t statistinio kriterijaus tα/2, (n1 + n2 – 2) iš plotų po Sjudento t kreive lentelės dvipusiam tikrinimui su (n1 + n2 – 2) = 34+56-2=88 laisvės laipsnių yra 1,96. Jeigu apskaičiuotasis t (nepaisant ženklo) bus didesnis negu 1,96, nulinė hipotezė atmetama, kai reikšmingumo lygmuo 5 proc.

Atlikus imties tyrimą gauta:= 1104,91 su nepaslinktuoju s12 = 27 103,37 ir= 1033,73 su nepaslinktuoju s22 = 37 028,53.

Skaičiuojama turint galvoje nulinės hipotezės teiginį, kad µ1 – µ2 = 0,

t

1,96

-1,96

0

Atmesti H0

Atmesti H0

α=0,05

α=0,05

1,794

2 pav.

Apskaičiuotoji t reikšmė nepatenka į atmetimo sritį, todėl neatmetama nulinė hipotezė, kad nėra skirtumo tarp vyrų ir moterų minimalaus atlyginimo, kurio jie tikisi, vidurkių., esant 5 proc. reikšmingumo lygmeniui. Skirtumas šiuo lygmeniu nėra statistiškai reikšmingas.

Kaip matome, naudojant SPSS programą, gaunama ta pati išvada.