Grad af frihed for uafhængighed i to-vejs tabel

Antallet af grader af frihed for uafhængighed af to kategoriske variabler gives ved en simpel formel: (r - 1)(c - 1). Her r er antallet af rækker og c er antallet af kolonner i tovejs tabel af værdierne for den kategoriske variabel. Læs videre for at lære mere om dette emne og for at forstå, hvorfor denne formel giver det rigtige nummer.

Baggrund

Et skridt i mange processer hypotese test er bestemmelsen af ​​antallet af frihedsgrader. Dette nummer er vigtigt, fordi for sandsynlighedsfordelinger der involverer en familie med distributioner, såsom chi-square distribution, antallet af grader på frihed peger på den nøjagtige fordeling fra familien, som vi skal bruge i vores hypotese prøve.

Grad af frihed repræsenterer antallet af frie valg, som vi kan træffe i en given situation. En af hypotesetestene, der kræver, at vi bestemmer frihedsgrader, er chi-square test for uafhængighed af to kategoriske variabler.

Tests til uafhængighed og to-vejs tabeller

Den chi-kvadratiske test for uafhængighed opfordrer os til at konstruere et to-vejs bord, også kendt som en beredskabstabel. Denne type bord har

instagram viewer
r rækker og c kolonner, der repræsenterer r niveauer af en kategorisk variabel og c niveauer af den anden kategoriske variabel. Så hvis vi ikke tæller den række og søjle, hvor vi registrerer totaler, er der i alt rc celler i tovejs-tabellen.

Den chi-kvadratiske test for uafhængighed giver os mulighed for at teste hypotesen om, at kategorisk variabler er uafhængige af hinanden. Som vi nævnte ovenfor r rækker og c kolonner i tabellen giver os (r - 1)(c - 1) frihedsgrader. Men det er måske ikke umiddelbart klart, hvorfor dette er det rigtige antal frihedsgrader.

Antallet af frihedsgrader

For at se hvorfor (r - 1)(c - 1) er det rigtige nummer, vi vil undersøge denne situation mere detaljeret. Antag, at vi kender de marginale totaler for hvert niveau af vores kategoriske variabler. Med andre ord kender vi det samlede antal for hver række og det samlede antal for hver kolonne. For den første række er der c kolonner i vores tabel, så der er c celler. Når vi først kender værdierne for alle undtagen en af ​​disse celler, er det et simpelt algebra-problem at bestemme værdien af ​​den resterende celle, fordi vi kender summen af ​​alle cellerne. Hvis vi udfyldte disse celler i vores tabel, kunne vi komme ind c - 1 af dem frit, men derefter bestemmes den resterende celle af summen af ​​rækken. Således er der c - 1 frihedsgrader for den første række.

Vi fortsætter på denne måde til den næste række, og der er igen c - 1 frihedsgrader. Denne proces fortsætter, indtil vi kommer til den næstsidste række. Hver af rækkerne undtagen den sidste bidrager c - 1 frihedsgrad til det samlede. På det tidspunkt, hvor vi har alle undtagen den sidste række, så fordi vi kender kolonnesummen, kan vi bestemme alle posterne i den sidste række. Dette giver os r - 1 rækker med c - 1 frihedsgrader i hver af disse i alt (r - 1)(c - 1) frihedsgrader.

Eksempel

Vi ser dette med følgende eksempel. Antag, at vi har en tovejstabel med to kategoriske variabler. Den ene variabel har tre niveauer og den anden har to. Antag endvidere, at vi kender summen af ​​række og kolonne for denne tabel:

Niveau A Niveau B Total
Niveau 1 100
Niveau 2 200
Niveau 3 300
Total 200 400 600

Formlen forudsiger, at der er (3-1) (2-1) = 2 frihedsgrader. Vi ser dette som følger. Antag, at vi udfylder den øverste venstre celle med tallet 80. Dette bestemmer automatisk hele den første række med poster:

Niveau A Niveau B Total
Niveau 1 80 20 100
Niveau 2 200
Niveau 3 300
Total 200 400 600

Hvis vi ved nu, at den første post i den anden række er 50, udfyldes resten af ​​tabellen, fordi vi kender summen af ​​hver række og kolonne:

Niveau A Niveau B Total
Niveau 1 80 20 100
Niveau 2 50 150 200
Niveau 3 70 230 300
Total 200 400 600

Tabellen er helt udfyldt, men vi havde kun to frie valg. Når disse værdier var kendt, blev resten af ​​tabellen bestemt.

Selvom vi typisk ikke har brug for at vide, hvorfor der er så mange frihedsgrader, er det godt at vide, at vi virkelig bare anvender begrebet frihedsgrader til en ny situation.

instagram story viewer