Neparametrični Correlation Techniques

Korelacija jestatistično tehniko za videti na linearnem odnosu med dvema kvantitativnih spremenljivk . Z drugimi besedami , je videti , kako dobropremica prilega podatke . Korelacije se gibljejo od -1 do +1 ; korelacija -1 pomeni popolno negativno razmerje ( kot ena spremenljivka gre gor ,druga gre dol ) , medtem ko jekorelacija 1 pomeni popolno pozitiven odnos ( kot ena gre gor ,druga gre gor ) . Korelacija 0 pomeni, da ni linearno razmerje. Neparametrična korelacija naredi manj predpostavk kot parametrično korelacijo . Parametrična regresija predpostavlja so spremenljivke interval ali razmerje zaplombirati . Spearman je Rho

Spearman je rho (grška črka) predpostavlja le, da so spremenljivke vrstilna pomanjšana . Ordinalna lestvica pomeni, da številke, navedene za vsako spremenljivko v pravem vrstnem redu , vendar ni nujno, da enakomerno . Na primer , če vprašate ljudi, kako jim je všeč, predsednik Obama in izbire so bili ” Sploh ne, ” “malo “, ” Nekoliko “, ” Precej ” in “veliko ” in te odločitve so bile dosegel 1 , 2 , 3 , 4 in 5 , nato pa so številke v pravem zaporedju , vendar je težko reči , čerazlika med ” sploh ne ” in “malo ” jeenaka razliki med ” precej ” in “veliko “. Za izračun Spearman je R , razvrsti podatke in izračunati običajno korelacijo med vrstah.

Kendallov Tau

Kendallov tau (grška črka ), prav tako ne prevzemapodatkov je ordinalna , vendar ima drugačen pomen kot Spearman je R. razumeti Kendall je tau , morate najprej razumeti, skladnih in neskladne pare . Par je dve poljubni predmeti v nizu podatkov , na primer, če imate opravka z ljudmi ,par je lahko Bob in Joe . Par vrednosti je konkordantna če je predmet , ki je večja od ene spremenljivke tudi višje na drugi . Par skladajo če je predmet , ki je višja od ene spremenljivke nižje na drugi . Kendallov tau se lahko izračuna kot ( CD ) /( n * n – 1/2 ) , kjer je C število skladnih parov , D je število neharmoničnega parov in je n število predmetov .

Goodman – Kruskal Gamma

Goodman – Kruskal je gama (grška črka) predpostavlja tudi ordinalnih podatkov . To se izračuna kot (CD ) /( C + D ), kjer so C in D enak pomen kot v oddelku 2. Gamma je bolj primerno , če obstaja veliko vezani opažanja . Prav tako je nekoliko lažje razumeti .
Hi-kvadrat

Chi- square predpostavlja samo , da so podatki nominalno , ki nima notranje naročilo. Na primer , če vprašate ljudi o njihovi etnični skupini , in odločitve so “White “, ” črna “, ” Latino “, ” Asian ” in “Drugo “, potem ni , da bi odzivov . Iz tega razloga , nekateri bi rekli , da je hi – kvadrat ni ravnomerilo korelacije , vendar je zagotovomerilo odnosa med dvema spremenljivkama . Za izračun Chi- square , morajo biti podatki v tabeli ob nepredvidljivih dogodkih . Označi vrstice in stolpce s ​​številkami , nato pa izračunamo pričakovano vrednost v vsaki celici ( vrstic seštevka časovcelotnega kolona , deljeno s skupno vsoto ). Potem , najti razlike med opazovanimi in pričakovanimi frekvencami v vsaki celici , jih kvadriramo , jih delimo s opazovanih frekvenc , in dodamo vse količnike . V nasprotju z drugimi ukrepi , lahko Chi- square prevzamemo nobene pozitivnim predznakom.

Dodaj odgovor