Hvad er en tovejs tabel med kategoriske variabler?

click fraud protection

Et af målene med statistikken er at arrangere data på en meningsfuld måde. To-vejs tabeller er en vigtig måde at organisere en bestemt type parrede data. Som med konstruktionen af ​​grafer eller tabeller i statistikker, er det meget vigtigt at kende de typer variabler, vi arbejder med. Hvis vi har kvantitative data, er en graf som f.eks histogram eller stilk og blad plot skal bruges. Hvis vi har kategoriske data, så er et søjlediagram eller lagkagediagram er passende.

Når vi arbejder med parrede data, skal vi være forsigtige. Der findes en spredningsdiagram for parrede kvantitative data, men hvilken slags graf er der for parret kategorisk data? Hver gang vi har to kategoriske variabler, skal vi bruge en to-vejs tabel.

Beskrivelse af en tovejs tabel

Først husker vi, at kategoriske data vedrører træk eller kategorier. Det er ikke kvantitativt og har ikke numeriske værdier.

En tovejs-tabel involverer en liste over alle værdier eller niveauer for to kategoriske variabler. Alle værdier for en af ​​variablerne er anført i en lodret kolonne. Værdierne for den anden variabel er anført langs en vandret række. Hvis den første variabel har

instagram viewer
m værdier og den anden variabel har n værdier, så er der i alt mn poster i tabellen. Hver af disse poster svarer til en bestemt værdi for hver af de to variabler.

Langs hver række og langs hver søjle er posterne samlet. Disse totaler er vigtige, når der bestemmes marginale og betingede fordelinger. Disse totaler er også vigtige, når vi gennemfører en chi-square test for uafhængighed.

Eksempel på en tovejs tabel

For eksempel vil vi overveje en situation, hvor vi ser på flere sektioner af et statistikforløb på et universitet. Vi ønsker at konstruere en to-vejs tabel for at bestemme, hvilke eventuelle forskelle der er mellem mænd og kvinder i løbet. For at opnå dette, tæller vi antallet af hver bogstavkarakter, der blev optjent af medlemmer af hvert køn.

Vi bemærker, at den første kategoriske variabel er køn, og at der er to mulige værdier i studiet af mandlige og kvindelige. Den anden kategoriske variabel er bogstavkarakteren, og der er fem værdier, der er givet af A, B, C, D og F. Dette betyder, at vi vil have en tovejs-tabel med 2 x 5 = 10 poster, plus en ekstra række og en ekstra kolonne, der er nødvendig for at tabulere række- og kolonnetotalerne.

Vores undersøgelse viser, at:

  • 50 mænd tjente et A, mens 60 hunner tjente et A.
  • 60 mænd tjente en B, og 80 kvinder tjente B.
  • 100 mænd tjente en C, og 50 kvinder tjente en C.
  • 40 mænd tjente D, og ​​50 kvinder tjente D.
  • 30 mænd tjente en F, og 20 kvinder tjente en F.

Disse oplysninger indtastes i to-vejs tabellen nedenfor. Det samlede antal af hver række fortæller os, hvor mange af hver slags karakter der blev optjent. Kolonnetotalerne fortæller os antallet af mænd og antallet af hunner.

Betydningen af ​​to-vejs tabeller

To-vejs tabeller hjælper med at organisere vores data, når vi har to kategoriske variabler. Denne tabel kan bruges til at hjælpe os med at sammenligne mellem to forskellige grupper i vores data. For eksempel kunne vi overveje den relative præstation af mænd i statistikforløbet mod præstationen af ​​kvinder i løbet.

Næste skridt

Efter dannelse af en tovejs-tabel kan det næste trin være at analysere dataene statistisk. Vi kan spørge, om de variabler, der er i undersøgelsen, er uafhængige af hinanden eller ej. For at besvare dette spørgsmål kan vi bruge en chi-square-test på tovejs-tabellen.

To-vejs tabel for karakterer og køn

Han Kvinde Total
EN 50 60 110
B 60 80 140
C 100 50 150
D 40 50 90
F 30 20 50
Total 280 260 540
instagram story viewer