Haridustehnoloogia praktika

Andmeanalüüs: üldistav statistika 21.09.13

21.09.2013 10:18 by Ruth Randoja

u:ifht12m


p:tulu83kas


Üldistava statistika kursusel on eesmärk analüüsida olemasolevaid andmeid ja teha üldistusi mittemõõdetavate objektide kohta.


ÜK – > V – > ÜK


1. Miks ja millises kontekstis me kasutame üldistava statistika meetode?


olukordi jagatakse laias plaanis kaheks:



  • valikuuring

  • eksperimentaalsed uuringud – käitutakse kahe rühmaga erinevalt ja vaadatakse, mis juhtub.


2. Millest sõltub meetodi valik?


3 põhjust



  • grupp

  • mida ma tahan teada, kas leidub seos?

  • millised andmed mul kasutada on? (siin on olulisustestide üldine skeem)



  • Kirjeldava statistika meetod.

  • Kas ma saan erinevust üldistada -

  • õige olulisutesti valik

  • kontrollin valikutesti tingimusi (kõikidel testidel on mingid tingimused)

  • valin olulisusnivoo – tõesnäosus, mida ma endale eksida luban  – 0,05, 0,01 v

  • siis teen arvutused

  • siis teen otsused vastavalt olulisustõenäosusele

  • sõnastan järeldused


Mida näitab olulisustõenäosus


olulisustõenäsus järgi tehtav otsus, kas tõestan erinevuse v jään h0 juurde.


Olusisutõenäosus määrab eksimise võimaluse sisuka hüpoteesi eelistamisel.


milline on tõenäosus, et see tuleb juhuse tõttu.


Lubame endale eksida viiel juhul sajas, kui


Näide sõltuvate valimite kohta:


Sõltumatud valimid on sellised, kus me oleme uurinud reaalselt erinevaid

objekte. Sõltuvad valimid aga sellised, kus me oleme uurinud samu objekte kahel

korral.


Capture 1. tabel


annab kirjeldava statistika – annab nende kohta, kes vastasid N võtab kaasa, kes vastasid mõlemale küsimusele.


Hea palk (M=1,9; SD=0,8) ja paindlik töögraafik(M=1,9; SD=0,9)


kasutatakse märgistusi M ja SD


Kumma hinnangud on üjhtlasemad? hea palk.


Nelja punkti skaalal on 1,9


2. tabel


annab seosed:


Tegemist on intervalltunnusega ja nad peavad olema mõõdetud samal skaalal. Mõlemad eeldused on täidetud.


Siis mõtleme läbi ja paneme kirja hüpoteesid.


Erinevust keskväärtuste vahel ei ole


H0 : Mp=Mt


H1:Mp ei võrdu Mt


alfa=0,05


Nüüd peaksime tegema arvutused


Kui vaatame kolmandat tabelit, olulisustõenäosuse on viimases lahtris ja ta on praegu


Sig=0,91 II järeldus – pean jääma Ho juurde


Jääme selle juurde, et nende vahel erinevust ei ole.


Ül 12


Kuivõrd aitasid töökoha saamisel kaasa eesti keele oskus?


hinnang, kui oluline on ametikohal eesti keele oskus?


need on sõltuvad valimid – samad objektid ja 2 küsimust.


Skaalad tuleks kõige pealt samale arvule teisendada.


esimene on nõustun täiesti ja ei nõustu üldese, ühte tuleks pöörata ja teisendada ja teist ainult teisendada.


skaala


5-1 nõustun 4


2             3


3             2


4 ei nõustu 1


tahan sellest saada


Tranform/compute


A34_9p 34 näitab küsimust


Valimis on erinevus- naiste jaosk pisut olulisem kui meeste jaosk, kuid üldistada seda ei saa.


Meeste ja naiste hinnagud hea palga olulisusele töökoha valimisel ei erine.


7


Keskväärtuste erinevus:


3,23 – 2,87 =0,36


blabla, olen tõestanud, et see erinevus nende valimite keskmiste vahel on üldistatav.


Järeldus: naiste jaoks on olulisem töökoha valikul erialase töö puudumine. (alfa<0,001)


alfa suurus – uurija ise otsustab vea suuruse, sotsiaalteadustes 5%, täppisteadustes 1. Kuna ma näen, et olulisustõenäousu on nii väike, siis ei pea 5 juurde jääma.


alfa=0,01 alfa=0,05


Ho            H1


Sig 0,03 ja alfa=0,01 siis jääme H0 juurde, sest alfa<Sig


kui alfa=0,05, siis tõestame H1, sest alfa>Sig


Ühe- ja kahepoolsed testid:


Ho:M=M


H1:M ei võrdu M


Matemaatika statistika algkursus koolidele, Kadri Hiob 1995


Valim


8


T-test


erialast tööd 0,36  H1


soodustused 0,12   H1


Valim


Suur erinevus keskmiste vahelVäike


statistiliselt tuleb suur erinevus suure valimi korral oluline


kui mul on suur valim ja erinevus keskmiste puhul on väike, kas siis tõestan olulisuse ära, tõenäoliselt suure valimi


blabla


Erinevus


Suur


Väike


9


Excelis saab t-testi teha kahek moel, kasutades funktysiooni ja lisamoodulit


11












































































t-Test: Paired Two Sample for Means
Tulemus enne Tulemus pärast
Mean 25,66666667 26,86666667
Variance 8,095238095 10,83809524
Observations 15 15
Pearson Correlation 0,902376482
Hypothesized Mean Difference 0
df 14
t Stat -3,263110069
P(T<=t) one-tail 0,002831527
t Critical one-tail 1,761310136
P(T<=t) two-tail 0,005663054
t Critical two-tail 2,144786688











































































t-Test: Two-Sample Assuming Equal Variances
Variable 1 Variable 2
Mean 28 26
Variance 4,5 4
Observations 5 5
Pooled Variance 4,25
Hypothesized Mean Difference 0
df 8
t Stat 1,533929978
P(T<=t) one-tail 0,081795385
t Critical one-tail 1,859548038
P(T<=t) two-tail 0,16359077
t Critical two-tail 2,306004135


http://rrandoja.wordpress.com/2013/09/21/andmeanaluus-uldistav-statistika-21-09-13/

0 comments:

Post a comment