Haridustehnoloogia praktika

Andmeanalüüs kirjeldav statistika 7.10.13

07.10.2013 12:06 by Ruth Randoja

Kõik vajalik on siin olemas:


http://minitorn.cs.tlu.ee/~katrin/cmsSimple/


Iseseisvate tööde esitamine: 8.12.2013 23.59


eksam 10.12.2013


mailile@jesmin.ee


Kirjeldav ja üldistav statistika • Kirjeldav – kirjeldab andmeid, mida mõõtsime, tehakse järeldusi, kuid ainult nende andmete kohta, mida kogusime, kokkuvõtete tegemine, teeme järeldusi ainult nendest andmetest, mida oleme reaalselt kogunud. Kirjeldav: Haapsalus on nii.

 • Üldistav- kogume andmeid Haapsalu kohta, kuid tahame teha üldistusi ka teiste väikelinnade kohta, pakub meetodeid vea hindamiseks (vea teeme me alati).


Üldkogum ja valim • Üldkogum on need, kelle kohta tahame järeldusi teha (kogu eesti keskastme juhid)

 • Valim – mõõtmiseks valitud (uuringusse kaasatud) üldkogumi osa


Üldkogum 30 000- kõik eesti 9. kl õpilast, valimisse võtame 300. Suurus sõltub andmete kvaliteedist, kui tahame rääkida kogu eesti lõpetajatest ja mõõdame ainult Tln-s ja Trt-s, ei ole tulem korrektne, valim peab olema kvaliteetne, palju sõltub ka teemaspetsiifikast.


Valimi moodustamine • Juhuslik valim – kõigil üldkogumi liikemtel on võrdne tõenäosus sattuda valimisse – eeldab üldkogumi nimekirja. – kõige nõutavam statistilise korrektsuse jaoks.

 • Süstemaatiline valim (systematic sampling) objektid valitakse kindla süsteemi järgi (iga 7-s).

 • Kihtvalim – alamosad, rühmad vanuse, soo jne järgi. Rühma seest valitakse esindajad juhuslikult, garanteeride kõigi rühmade võrdse esidnatuse.

 • Mugavusvalim (convenience sampling) lihtsuse ja mugavuse huvides uurimuse läbiviijale lähimate (kättesaadavamate) isikute valimine (oma õpilase, tuttavad õpetajad)

 • Lumepalli valim (snowball sampling), leitakse mõned inimsed, kes vastavad tingimustele. Igaüks neist toob järgmised esindajad, kes omakorda peavad kaasama veel mõned.


Kui üldkogum on Tallinna ülikooli üliõpilase, kelle hulgas on 75% naisi, siis ka valmis peab olema 75% naisi.


Valim peab olema juhuslik ja esinduslik.


Erinevad uuringutüübid


Rakendust loov uurimus ehk arendusuuring (mingisuguse vajaduse rahuldamiseks)


Erinevad uuringutüübid • Rakendust loov uurimus ehk arendusuuring (mingisuguse vajaduse rahuldamiseks) nt uurime windows vistat, et luua windows 7-t

 • Teoreetiline uurimus (olemasoleva teabe analüüs) – kohustusliku kirjanduse lugemispäevik, ei kogu uut informatsiooni

 • Empiiriline uurimus – tegeleme kõige rohkem, see, mille reaalselt läbi viin, kogun uut teavet, selle omad osad: uurimisprobleem, strateegia, valikumeetod, anmdekogumismeetodid, andmeanalüüsi meetodid, tulemused ja järeldused ehk siis


Empiiriline uurimus • Uurimisprobleem (küsimus, hüpotees, eesmärk, …)

 • strateegia (juhtumianalüüs, eksperiment, tegevusuuing, vaatlus)

 • Valikumeeotd (juhuslik valim, üks juhtum, mitu juhtumit)

 • Andmekogumismeetodid (struktureeritud ankeet, struktureerimata intervjuu…)

 • andmeanalüüsi meetodid (kirjeldavad või järeldavad statisitilised meetodid, kodeerimine)

 • Tulemused/järeldused (kirjeldused, empiirilised üldistused, seaduspärasused,…)


Akadeemilised/teaduslikud uurimused


Kvaliteedi näitajad: • tähtsus e olulisus ja eetilisus

 • argumentatsiooni veenvus

 • asjatundlik meetodite kasutus

 • sisukus, komplekssus ja kompaktsus

 • esitluse ja vormistuse korrektsus


Andmete kogumine


Tavapärased andmekogumismeetodid: • otsene loendamine ja mõõtmine

 • dokumenteerimine/koonandmete talletamine (vaatlus?)

 • struktureeritud või poolstruktureeritud intervjuud (küsitlused)

 • struktureeritud või poolstruktureeritud ankeedid (kirjalikud küsimustikud)

 • standardiseeritud võimekus ja sooritustestid – psühholoogilisi ja sotsiaalseid aspekte mõõtvad testid (nt väärtushinnangute skaalad)

 • eksperimendid (kontrollgrupp ja katsegrupp)

 • struktureerimata andmete kodeerimine- kontentanalüüs

 • Mõelda võiks: kas tasuks kasutada eksperte/konsultante, pilootuuringuid


Hea küsimustik


Hea küsimustik on • selge sõnastusega

 • kergesti ja üheselt mõistetav

 • kiiresti vastatav

 • vormistuselt korrektne

 • koostatud nii, et oleks minimiseeritud vastajate ja andmete töötlejate poolt potentsiaalselt tehtavate vigade hulk


Hoiduda tuleks sellistest küsimustest nagu: • suunavad küsimused;

 • teaduslikult täpse, kuid pika ja keeruka sõnastusega küsimused;

 • halvasti või mitmeti mõistetavad küsimused;

 • ärritavad küsimused (sh küsimusega mittesobivad vastusevariandid);

 • kategoorilist laadi ja eitust sisaldavad küsimused;

 • kirjalikes (eriti posti teel korraldatud) küsitlustes pole soovitav esitada avatud küsimusi (!?)


Likert’i tüüpi skaala, kus otstest äärmuslikud ja keskel kaalupunkt


Ärritavad küsimused – mind sunnitakse võtma seisukohta, mida ma ei taha- protsestib ja jätab vastamata.


Vigade vältimiseks, tuleks lasta tuttavatel küsitlust proovida


Usaldusväärse ja sisuka analüüsitlumeuse jaoks tuleb:


1. Koostada alganmdetest korrektne andmetabel – NB! See ei ole mõeldud teistele esitlemiseks vaid andmete viimiseks analüüsitavale kujule


2. Valida andmete tüübile ja sisule vastav andmete analüüsimeetod


3. valida


Andmetabeli peamised reeglid


Statistiline andmestik: objekt – tunnus – väärtus


Tabel: rida-veerg-lahter


objektid on need inimesed, asutused, loomad, kellel kohta me uurime.


objektid käivad reas


tunnus on see, mis on objektide ühine omadus – suurus, vanus,  inimeste puhul on tunnus üks küsimus, tunnused on veerus


väärtused eristavad objektide tunnuseid, väärtused asuvad lahtris


andmetabel on askeetlik – st, et viin andmed võimalikult väiksele kujule


väärtus võib olla ka sõna, igas lahtris on ainult 1 ühik infot.


Andmete kokku võtmine ja esitamine


Struktureeritud andmete esmaseks kokkuvõtuks ning ülevaatlikuks analüüsiks saab kasutada kirjeldava statistika meetodeid, mis võib jagada kolme suurde rühma: • - sagedustabelid (sh risttabelid)

 • - arvnäitajad (esitatakse tihti tabelisse koondatult

 • -arvjoonised e diagrammid


Millest sõltub analüüsitüübi valik? 1. Küsimuse tüübiste mis tüüpi on küsimus, millel tahame analüüsiga vastust saada

 2. andmete tüübist – kas nimi, järjestus, intervcall või binaarsed tunnused


Tunnusetüübid


Võtmeküsimused. väärtuste järjestatavus ja skaalavahemike võrdsus! • Nimitunnused – nimitunnusel ei ole väärtused üheselt järjestatavad, järjestustunnusel on!, simituunustega saame teha ilusaid jooniseid, kuid ei saa arvutada keskmist.

 • Järjestustunnused- järjestustunnusel ei ole väärtuste vahemikud võrdsed, intervalltunnusel on! haridustase

 • Intervalltunnused – vahemikud – vanuse vahemik, sissetulek- arvtunnused väheste erinevate väärtustega – laste arv

  - arvtunnused paljude erinevate väärtustega

  Binaarsed tunnused – binaarsel tunnusel on ainult kaks väärtust ja seega järjestamise ja vahede võrdsuse probleemi ei teki! mees-naine, jah-ei, siis tegemist on binaarsega.


Kui sõnalised väärtused, siis vaatan, et kas on järjestatavad ja kas vahemikud on võrdsed


Kui tunnuseks on • auto värv – nimitunnus, ei saa järjestada

 • vererõhk – intervalltunnus

 • rahvus – nimitunnus


Et aru saada, mis tüüpi küsimusega on tegemist 1. kas saan järjestada

 2. kas vahemikud on võrdsed


Esitlusmeetodid • Kui on vaja esitada palju numbrilist infot, siis esitan TABELIS

 • kui on vaja esile tuua tendentse, võrdlusi, valin esitluseks JOONISE

 • kui on vaja esitada vähe numbrilist infot, esitan selle TEKSTI SEES


Kodutöö


Name alla käib lühike ja  Label alla küsimus.


Märkiders tunnuse tüübi, väldin hiljem vigu


Type väljal on alati Numeric (stringi ei kasuta, kuna kodeerin), Decimal on komakohad, vajadusel muudan seda, Values alla sisestan vastusevariandid numbritega Measure all küsin, kas saab järjestada või kas vahemikud on võrdsed ja siis vastavalt, kas nimitunnus, järjestustunnus või intervalltunnus.


andmed


Adnmete sisestamine numbritega. Enda elu lihtsaks tegemiseks kirjutan vastusevariantidele numbrid ette, see võtab sadu tunde vähemakshttp://rrandoja.wordpress.com/2013/10/07/andmeanaluus-kirjeldav-statistika-7-10-13/

0 comments:

Post a comment