Eksempel på en permutationstest

Et spørgsmål, som det altid er vigtigt at stille i Statistikker er, ”Er det observerede resultat på grund af tilfældet alene, eller er det statistisk signifikant?” En klasse af hypotese test, kaldet permutationstest, giver os mulighed for at teste dette spørgsmål. Oversigten og trin i en sådan test er:

  • Vi delte vores emner op i en kontrol og en eksperimentel gruppe. Nullhypotesen er, at der ikke er nogen forskel mellem disse to grupper.
  • Anvend en behandling til den eksperimentelle gruppe.
  • Mål responsen på behandlingen
  • Overvej enhver mulig konfiguration af den eksperimentelle gruppe og den observerede respons.
  • Beregn en p-værdi baseret på vores observerede respons i forhold til alle de potentielle eksperimentelle grupper.

Dette er en oversigt over en permutation. Til kendetegn ved denne skitsering vil vi bruge tid på at se på et udarbejdet eksempel på en sådan permutationstest i detaljer.

Eksempel

Antag, at vi studerer mus. Især er vi interesseret i, hvor hurtigt musene afslutter en labyrint, som de aldrig har stødt på før. Vi ønsker at fremlægge bevis til fordel for en eksperimentel behandling. Målet er at demonstrere, at mus i behandlingsgruppen vil løse labyrinten hurtigere end ubehandlede mus.

instagram viewer

Vi begynder med vores emner: seks mus. For nemheds skyld henvises musene til bogstaverne A, B, C, D, E, F. Tre af disse mus vælges tilfældigt til den eksperimentelle behandling, og de andre tre sættes i en kontrolgruppe, hvor forsøgspersonerne får en placebo.

Vi vælger næsten tilfældigt den rækkefølge, som musene er valgt til at køre labyrinten. Den tid, der bruges til at afslutte labyrinten for alle musene, vil blive noteret, og et gennemsnit af hver gruppe beregnes.

Antag, at vores tilfældige udvælgelse har mus A, C og E i den eksperimentelle gruppe, med de andre mus i placebo kontrolgruppe. Når behandlingen er implementeret, vælger vi tilfældigt rækkefølgen for musene skal løbe gennem labyrinten.

Køretiderne for hver mus er:

  • Mus A kører løbet på 10 sekunder
  • Mus B kører løbet på 12 sekunder
  • Mus C kører løbet på 9 sekunder
  • Mus D kører løbet på 11 sekunder
  • Mus E kører løbet på 11 sekunder
  • Mus F kører løbet på 13 sekunder.

Den gennemsnitlige tid til at afslutte labyrinten for musene i den eksperimentelle gruppe er 10 sekunder. Den gennemsnitlige tid til at afslutte labyrinten for dem i kontrolgruppen er 12 sekunder.

Vi kunne stille et par spørgsmål. Er behandlingen virkelig årsagen til den hurtigere gennemsnitstid? Eller var vi bare heldige i vores valg af kontrol- og eksperimentgruppe? Behandlingen har måske ikke haft nogen effekt, og vi valgte tilfældigt de langsommere mus til at modtage placebo og hurtigere mus til at modtage behandlingen. En permutationstest vil hjælpe med at besvare disse spørgsmål.

hypoteser

Hypotesen til vores permutationstest er:

  • Det nulhypotesen er erklæringen uden virkning. Til denne specifikke test har vi H0: Der er ingen forskel mellem behandlingsgrupper. Middeltiden for at køre labyrinten for alle mus uden behandling er den samme som gennemsnitstiden for alle mus, der behandles.
  • Den alternative hypotese er, hvad vi forsøger at etablere bevis til fordel for. I dette tilfælde ville vi have H-en: Middeltiden for alle mus med behandlingen vil være hurtigere end gennemsnittet for alle mus uden behandling.

permutationer

Der er seks mus, og der er tre steder i den eksperimentelle gruppe. Dette betyder, at antallet af mulige eksperimentelle grupper er angivet med antallet af kombinationer C (6,3) = 6! / (3! 3!) = 20. De resterende individer ville være en del af kontrolgruppen. Så der er 20 forskellige måder at tilfældigt vælge enkeltpersoner i vores to grupper.

Tildelingen af ​​A, C og E til den eksperimentelle gruppe blev udført tilfældigt. Da der er 20 sådanne konfigurationer, har den specifikke med A, C og E i den eksperimentelle gruppe en sandsynlighed for, at 1/20 = 5% forekommer.

Vi er nødt til at bestemme alle 20 konfigurationer af den eksperimentelle gruppe af individerne i vores undersøgelse.

  1. Eksperimentel gruppe: A B C og kontrolgruppe: D E F
  2. Eksperimentel gruppe: A BD og kontrolgruppe: C E F
  3. Eksperimentel gruppe: A BE og kontrolgruppe: C DF
  4. Eksperimentel gruppe: A BF og kontrolgruppe: CDE
  5. Eksperimentel gruppe: A C D og kontrolgruppe: B E F
  6. Eksperimentel gruppe: A CE og kontrolgruppe: B D F
  7. Eksperimentel gruppe: A CF og kontrolgruppe: B D E
  8. Eksperimentel gruppe: A D E og kontrolgruppe: B C F
  9. Eksperimentel gruppe: A DF og kontrolgruppe: B C E
  10. Eksperimentel gruppe: A F og kontrolgruppe: B C D
  11. Eksperimentel gruppe: B C D og kontrolgruppe: A E F
  12. Eksperimentel gruppe: B CE og kontrolgruppe: A D F
  13. Eksperimentel gruppe: B CF og kontrolgruppe: A D E
  14. Eksperimentel gruppe: BDE og kontrolgruppe: A C F
  15. Eksperimentel gruppe: BDF og kontrolgruppe: A C E
  16. Eksperimentel gruppe: BEF og kontrolgruppe: A C D
  17. Eksperimentel gruppe: CDE og kontrolgruppe: A B F
  18. Eksperimentel gruppe: CDF og kontrolgruppe: A B E
  19. Eksperimentel gruppe: CEF og kontrolgruppe: A B D
  20. Eksperimentel gruppe: D F og kontrolgruppe: A B C

Vi ser derefter på hver konfiguration af eksperimentelle og kontrolgrupper. Vi beregner gennemsnittet for hver af de 20 permutationer i listen ovenfor. For det første har A, B og C tider på henholdsvis 10, 12 og 9. Gennemsnittet af disse tre numre er 10.3333. Også i denne første permutation har D, E og F tider på henholdsvis 11, 11 og 13. Dette har et gennemsnit på 11.6666.

Efter beregning af gennemsnit for hver gruppe, beregner vi forskellen mellem disse midler. Hver af følgende svarer til forskellen mellem de eksperimentelle og kontrolgrupper, der var anført ovenfor.

  1. Placebo - behandling = 1,333333333 sekunder
  2. Placebo - behandling = 0 sekunder
  3. Placebo - behandling = 0 sekunder
  4. Placebo - Behandling = -1.333333333 sekunder
  5. Placebo - behandling = 2 sekunder
  6. Placebo - behandling = 2 sekunder
  7. Placebo - Behandling = 0.666666667 sekunder
  8. Placebo - Behandling = 0.666666667 sekunder
  9. Placebo - Behandling = -0.666666667 sekunder
  10. Placebo - Behandling = -0.666666667 sekunder
  11. Placebo - Behandling = 0.666666667 sekunder
  12. Placebo - Behandling = 0.666666667 sekunder
  13. Placebo - Behandling = -0.666666667 sekunder
  14. Placebo - Behandling = -0.666666667 sekunder
  15. Placebo - behandling = -2 sekunder
  16. Placebo - behandling = -2 sekunder
  17. Placebo - behandling = 1,333333333 sekunder
  18. Placebo - behandling = 0 sekunder
  19. Placebo - behandling = 0 sekunder
  20. Placebo - Behandling = -1.333333333 sekunder

P-værdi

Nu rangerer vi forskellene mellem midlerne fra hver gruppe, som vi bemærkede ovenfor. Vi tabellerer også procentdelen af ​​vores 20 forskellige konfigurationer, der er repræsenteret ved hver forskel i midler. For eksempel havde fire af de 20 ingen forskel mellem midlerne til kontrol- og behandlingsgrupperne. Dette tegner sig for 20% af de 20 konfigurationer, der er nævnt ovenfor.

  • -2 for 10%
  • -1,33 for 10%
  • -0,667 for 20%
  • 0 for 20%
  • 0,666 for 20%
  • 1,33 for 10%
  • 2 for 10%.

Her sammenligner vi denne fortegnelse med vores observerede resultat. Vores tilfældige udvælgelse af mus til behandlings- og kontrolgrupper resulterede i en gennemsnitlig forskel på 2 sekunder. Vi ser også, at denne forskel svarer til 10% af alle mulige prøver. Resultatet er, at vi til denne undersøgelse har en p-værdi på 10%.