Kako odstraniti odstopanja v SPSS
Izstopajoči podatki v statističnih analizah so ekstremne vrednosti, ki se ne ujemajo z večino nabora podatkov. Če jih ne odstranimo, lahko te skrajne vrednosti močno vplivajo na morebitne zaključke, ki bi jih lahko izpeljali iz zadevnih podatkov, saj lahko korelacijske koeficiente in črte, ki se najbolje prilegajo, popačijo v napačno smer. SPSS je eden od številnih programov za statistično analizo, ki se lahko uporabljajo za interpretacijo nabora podatkov ter prepoznavanje in odstranjevanje izstopajočih vrednosti.
Raziskovalna analiza podatkov
1. korak
Kliknite na "Analiziraj". Izberite »Opisna statistika« in nato »Razišči«.
2. korak
Povlecite in spustite stolpce, ki vsebujejo podatke o odvisnih spremenljivkah, v polje z oznako »Seznam odvisnih«. Kliknite "V redu."
3. korak
Odstranite morebitne izstopajoče vrednosti, ki jih je prepoznal SPSS na ploskvah stebla in listov ali ploskvah škatle, tako da izbrišete posamezne podatkovne točke. Lahko pa nastavite filter za izključitev teh podatkovnih točk.
4. korak
Izberite »Podatki« in nato »Izberi primere« ter kliknite pogoj, ki ima izstopajoče vrednosti, ki jih želite izključiti. Določite vrednost za ta pogoj, ki izključuje samo izstopajoče vrednosti in nobeno od neizstopajočih podatkovnih točk.
5. korak
Izberite "Če je pogoj izpolnjen" v polju "Izberi" in nato kliknite gumb "Če" tik pod njim. V polje zgoraj desno vnesite pravilo za izključitev izstopajočih vrednosti, ki ste jih določili v prejšnjem koraku. Če bi na primer iz pogoja »višina« izključevali meritve nad 74,5 palca, bi vnesli »višina <=74,5«. Kliknite "Nadaljuj" in "V redu", da aktivirate filter.
Regresijska analiza
1. korak
V meniju »Analiziraj« izberite »Regresija« in nato »Linearno«. Izberite odvisne in neodvisne spremenljivke, ki jih želite analizirati.
2. korak
Kliknite »Shrani« in nato izberite »Cookova razdalja«. Vrednosti, izračunane za Cookovo razdaljo, bodo shranjene v vaši podatkovni datoteki kot spremenljivke z oznako "COO-1."
3. korak
Zaženite boxplot tako, da izberete "Graphs" in nato "Boxplot." Kliknite »Enostavno« in izberite »Povzetki ločenih spremenljivk«. V polje z oznako »Boxes Represent« vnesite »COO-1« in nato v polje »Label Cases By« vnesite ID ali ime, po katerem želite identificirati primere.
4. korak
Povečajte polje v izhodni datoteki tako, da ga dvokliknete. Zabeležite si primere, ki ležijo onkraj črnih črt – to so vaši odstopanji. Lahko se odločite za odstranitev vseh izstopajočih vrednosti ali samo skrajnih izstopajočih vrednosti, ki so označene z zvezdico (*).
5. korak
Vrnite se v podatkovno datoteko in poiščite primere, ki jih je treba izbrisati. Delajte od spodaj navzgor in označite številko skrajno levo v sivem stolpcu, tako da je izbrana celotna vrstica. Kliknite »Uredi« in izberite »Počisti«. Ponovite ta korak za vsak izstop, ki ste ga prepoznali v okvirčku.
Opozorilo
Pri brisanju primerov v 5. koraku 2. razdelka vedno delajte od dna podatkovne datoteke navzgor, ker se ID številke spremenijo, ko izbrišete primer. Če delate od zgoraj navzdol, boste na koncu izbrisali napačne male in male črke.