Eksempel på godhed med fit-test

Det chi-square godhed af fit test er et nyttigt at sammenligne a teoretisk model til observerede data. Denne test er en type af den mere generelle chi-square-test. Som med ethvert emne i matematik eller statistik, kan det være nyttigt at arbejde igennem et eksempel for at forstå, hvad der sker, gennem et eksempel på chi-square godhed i fit test.

Overvej en standard pakke mælkechokolade M & Ms. Der er seks forskellige farver: rød, orange, gul, grøn, blå og brun. Antag, at vi er nysgerrige efter fordeling af disse farver og spørger, forekommer alle seks farver i samme forhold? Dette er den type spørgsmål, der kan besvares med en god fit-test.

Indstilling

Vi begynder med at bemærke indstillingen, og hvorfor godhed med fit-test er passende. Vores farvevariabel er kategorisk. Der er seks niveauer af denne variabel, svarende til de seks farver, der er mulige. Vi antager, at M & M'erne, vi tæller, vil være en simpel tilfældig prøve fra populationen af ​​alle M & M'er.

Nul og alternative hypoteser

instagram viewer

Det null og alternative hypoteser for vores godhed af fit-test afspejler den antagelse, vi laver om befolkningen. Da vi tester, om farverne forekommer i samme proportioner, vil vores nulhypotese være, at alle farver forekommer i samme forhold. Mere formelt, hvis p1 er befolkningsandelen af ​​røde slik, p2 er befolkningsandelen af ​​orange slik osv., så er nulhypotesen den p1 = p2 =... = p6 = 1/6.

Den alternative hypotese er, at mindst en af ​​befolkningsforholdene ikke er lig med 1/6.

Faktiske og forventede tællinger

De faktiske tællinger er antallet af slik for hver af de seks farver. Det forventede antal refererer til hvad vi ville forvente, hvis nulhypotesen var sand. Vi lader n være størrelsen på vores prøve. Det forventede antal røde slik er p1 n eller n/6. I dette eksempel er det forventede antal slik for hver af de seks farver faktisk ganske enkelt n gange pjeg, eller n/6.

Chi-square-statistik for god fit

Vi beregner nu en chi-kvadratstatistik for et specifikt eksempel. Antag, at vi har en simpel tilfældig prøve på 600 M&M slik med følgende distribution:

  • 212 af slikene er blå.
  • 147 af slikene er orange.
  • 103 af slikene er grønne.
  • 50 af slikene er røde.
  • 46 af slikene er gule.
  • 42 af slikene er brune.

Hvis nulhypotesen var sand, ville de forventede tællinger for hver af disse farver være (1/6) x 600 = 100. Vi bruger dette nu i vores beregning af chi-kvadratstatistikken.

Vi beregner bidraget til vores statistik ud fra hver af farverne. Hver er af formen (Faktisk - forventet)2/Expected.:

  • For blå har vi (212 - 100)2/100 = 125.44
  • For orange har vi (147 - 100)2/100 = 22.09
  • For grønt har vi (103 - 100)2/100 = 0.09
  • For rød har vi (50 - 100)2/100 = 25
  • For gult har vi (46 - 100)2/100 = 29.16
  • For brun har vi (42 - 100)2/100 = 33.64

Vi sammenlægger derefter alle disse bidrag og bestemmer, at vores chi-square-statistik er 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.

Grader af frihed

Antallet af grader af frihed for en god pasformstest er simpelthen en mindre end antallet af niveauer af vores variabel. Da der var seks farver, har vi 6 - 1 = 5 frihedsgrader.

Chi-kvadratisk tabel og P-værdi

Chi-kvadratstatistikken på 235,42, som vi beregnet, svarer til en bestemt placering på en chi-kvadratfordeling med fem frihedsgrader. Vi har nu brug for en p-værdi, for at bestemme sandsynligheden for at opnå en teststatistik mindst så ekstrem som 235.42, mens man antager, at nulhypotesen er sand.

Microsofts Excel kan bruges til denne beregning. Vi finder ud af, at vores teststatistik med fem frihedsgrader har en p-værdi på 7,29 x 10-49. Dette er en ekstrem lille p-værdi.

Afgørelsesregel

Vi tager vores beslutning om, hvorvidt nulhypotesen skal afvises, baseret på størrelsen på p-værdien. Da vi har en meget lille p-værdi, afviser vi nullhypotesen. Vi konkluderer, at M & M'er ikke er jævnt fordelt mellem de seks forskellige farver. En opfølgningsanalyse kunne bruges til at bestemme et konfidensinterval for befolkningsandelen af ​​en bestemt farve.