En vigtig del af inferentielle statistikker er hypotetest. Som med at lære noget, der er relateret til matematik, er det nyttigt at arbejde igennem flere eksempler. Følgende undersøger et eksempel på en hypotesetest og beregner sandsynligheden for type I og type II fejl.
Vi antager, at de enkle forhold gælder. Mere specifikt antager vi, at vi har en enkel tilfældig prøve fra en befolkning, der er enten normalt distribueret eller har en stor nok prøvestørrelse, som vi kan anvende centrale grænse sætning. Vi antager også, at vi kender befolkningens standardafvigelse.
Erklæring om problemet
En pose kartoffelchips pakkes efter vægt. I alt købes, vejes i alt ni poser, og middelvægten af disse ni poser er 10,5 ounces. Antag, at standardafvigelsen for populationen af alle sådanne poser med chips er 0,6 ounce. Den angivne vægt på alle pakker er 11 ounce. Indstil et niveau af betydning til 0,01.
Spørgsmål 1
Støtter prøven hypotesen om, at den sande populationsværdi er mindre end 11 ounces?
Vi har en test med lavere haler. Dette ses af udsagnet fra vores null og alternative hypoteser:
- H0: μ=11.
- H-en: μ < 11.
Teststatistikken beregnes med formlen
z = (x-bjælke - μ0)/(σ/√n) = (10.5 - 11)/(0.6/√ 9) = -0.5/0.2 = -2.5.
Vi er nu nødt til at bestemme, hvor sandsynligt denne værdi af z skyldes tilfældet alene. Ved at bruge en tabel med z-scores ser vi, at sandsynligheden for, at z er mindre end eller lig med -2,5 er 0,0062. Da denne p-værdi er mindre end signifikansniveau, afviser vi nulhypotesen og accepterer den alternative hypotese. Middelvægten af alle poser med chips er mindre end 11 ounce.
Spørgsmål 2
Hvad er sandsynligheden for en type I-fejl?
En type I-fejl opstår, når vi afviser en nulhypotese, der er sand. Sandsynligheden for en sådan fejl er lig med betydningsniveauet. I dette tilfælde har vi et betydningsniveau svarende til 0,01, hvilket er sandsynligheden for en type I-fejl.
Spørgsmål 3
Hvis populationens gennemsnit faktisk er 10,75 ounce, hvad er sandsynligheden for en type II-fejl?
Vi begynder med at omformulere vores beslutningsregel med hensyn til stikprøven. For et signifikansniveau på 0,01 afviser vi nulhypotesen hvornår z < -2.33. Ved at tilslutte denne værdi til formlen til teststatistikkerne afviser vi nulhypotesen hvornår
(x-bjælke - 11) / (0,6 / √ 9)
Ligeledes afviser vi nulhypotesen, når 11 - 2.33 (0.2)> x-bar, eller hvornår x-bjælken er mindre end 10.534. Vi undlader at afvise nulhypotesen for x-stang større end eller lig med 10.534. Hvis det ægte befolknings gennemsnit er 10,75, er sandsynligheden for, at x-linjen er større end eller lig med 10.534 svarer til sandsynligheden for, at z er større end eller lig med -0,22. Denne sandsynlighed, som er sandsynligheden for en type II-fejl, er lig med 0,587.