Den statistiske praksis for hypotese testning er udbredt ikke kun inden for statistik, men også i natur- og samfundsvidenskab. Når vi udføre en hypotese test der et par ting, der kunne gå galt. Der er to slags fejl, som ved design ikke kan undgås, og vi skal være opmærksomme på, at disse fejl findes. Fejlene gives de ret fodgængernavne af type I og type II fejl. Hvad er type I og type II fejl, og hvordan skelner vi mellem dem? Kort:
- Type I-fejl sker, når vi afviser en sand nulhypotesen
- Type II-fejl opstår, når vi ikke afviser en falsk nulhypotese
Vi vil undersøge mere baggrund bag disse typer fejl med det formål at forstå disse udsagn.
Hypotese testning
Processen med hypotesetestning kan synes at være ret varieret med en lang række teststatistikker. Men den generelle proces er den samme. Hypotese testning involverer udsagnet om en nulhypotese og udvælgelsen af en niveau af betydning. Nullhypotesen er enten sand eller falsk og repræsenterer standardkravet om en behandling eller procedure. For eksempel, når man undersøger effektiviteten af et lægemiddel, ville nulhypotesen være, at lægemidlet ikke har nogen effekt på en sygdom.
Efter formulering af nulhypotesen og valg af et betydningsniveau, henter vi data gennem observation. Statistiske beregninger fortæl os, om vi skal afvise nulhypotesen eller ej.
I en ideel verden ville vi altid afvise nulhypotesen, når den er falsk, og vi ville ikke afvise nulhypotesen, når den faktisk er sand. Men der er to andre scenarier, der er mulige, som hver vil resultere i en fejl.
Type I-fejl
Den første slags fejl, der er mulig, involverer afvisning af en nulhypotese, der faktisk er sand. Denne type fejl kaldes en type I-fejl og kaldes undertiden en fejl af den første art.
Type I-fejl svarer til falske positiver. Lad os gå tilbage til eksemplet med et lægemiddel, der bruges til behandling af en sygdom. Hvis vi afviser nullhypotesen i denne situation, er vores påstand, at stoffet faktisk har en vis effekt på en sygdom. Men hvis nulhypotesen er sand, bekæmper stoffet overhovedet ikke sygdommen. Lægemidlet hævdes falskt at have en positiv effekt på en sygdom.
Type I-fejl kan kontrolleres. Værdien af alfa, der er relateret til niveau af betydning som vi valgte har direkte betydning for type I-fejl. Alpha er den maksimale sandsynlighed for, at vi har en type I-fejl. For et 95% konfidensniveau er værdien af alfa er 0,05. Dette betyder, at der er 5% sandsynlighed for, at vi afviser en ægte nullhypotese. I det lange løb vil en ud af hver 20 hypotese-test, som vi udfører på dette niveau, resultere i en type I-fejl.
Type II-fejl
Den anden form for fejl, der er mulig, opstår, når vi ikke afviser en nulhypotese, der er falsk. Denne type fejl kaldes en type II-fejl og omtales også som en fejl af den anden art.
Type II-fejl svarer til falske negativer. Hvis vi tænker tilbage på scenariet, hvor vi tester et lægemiddel, hvordan ville en type II-fejl så ud? En type II-fejl ville opstå, hvis vi accepterede, at lægemidlet ikke havde nogen indflydelse på en sygdom, men i virkeligheden gjorde det.
Sandsynligheden for en type II-fejl gives med det græske bogstav beta. Dette tal er relateret til kraften eller følsomheden i hypotesetesten, betegnet med 1 - beta.
Sådan undgås fejl
Type I og type II fejl er en del af processen med hypotesetest. Selvom fejlene ikke kan fjernes fuldstændigt, kan vi minimere en type fejl.
Når vi forsøger at mindske sandsynligheden for en type fejl, øges sandsynligheden for den anden type. Vi kunne sænke værdien af alfa fra 0,05 til 0,01, svarende til en 99% niveau af selvtillid. Men hvis alt andet forbliver det samme, vil sandsynligheden for en type II-fejl næsten altid øges.
Mange gange vil den virkelige verdens anvendelse af vores hypotestest bestemme, om vi mere accepterer type I- eller type II-fejl. Dette vil derefter blive brugt, når vi designer vores statistiske eksperiment.