Tillidsintervaller: 4 almindelige fejl

Tillidsintervaller er en vigtig del af inferentielle statistikker. Vi kan bruge en vis sandsynlighed og information fra a Sandsynlighedsfordeling at estimere en populationsparameter med brug af en prøve. Udsagnet om a konfidensinterval gøres på en sådan måde, at det let misforstås. Vi vil se på den korrekte fortolkning af tillidsintervaller og undersøge fire fejl, der er begået med hensyn til dette statistikområde.

Hvad er et tillidsinterval?

Et konfidensinterval kan udtrykkes enten som et interval af værdier eller i følgende form:

Anslå ± Fejlmargen

Et konfidensinterval er typisk angivet med et niveau af selvtillid.Fælles tillidsniveauer er 90%, 95% og 99%.

Vi vil se på et eksempel, hvor vi vil bruge et gennemsnit for at udlede gennemsnittet for en befolkning. Antag, at dette resulterer i et konfidensinterval fra 25 til 30. Hvis vi siger, at vi er 95% sikre på, at den ukendte befolkning betyde er indeholdt i dette interval, så siger vi virkelig, at vi fandt intervallet ved hjælp af en metode, der har succes med at give de rigtige resultater 95% af tiden. I det lange løb vil vores metode være succesrig 5% af tiden. Med andre ord vil vi undlade at fange den ægte befolkning, men kun en ud af hver 20 gange.

instagram viewer

Fejl nr. 1

Vi vil nu se på en række forskellige fejl, der kan gøres, når vi håndterer tillidsintervaller. Én forkert erklæring, der ofte fremsættes om et konfidensinterval på et 95% -niveau af tillid, er, at der er en 95% chance for, at konfidensintervallet indeholder det sande gennemsnit af befolkningen.

Årsagen til at dette er en fejl er faktisk ganske subtil. Den centrale idé ved et konfidensinterval er, at den anvendte sandsynlighed kommer ind i billedet med den metode, der bruges til at bestemme konfidensintervallet, er, at den henviser til den metode, der er Brugt.

Fejl nr. 2

En anden fejl er at fortolke et 95% konfidensinterval som at sige, at 95% af alle dataværdier i befolkningen falder inden for intervallet. Igen taler 95% til metoden for testen.

For at se, hvorfor ovenstående udsagn er forkert, kunne vi overveje en normal befolkning med en standardafvigelse på 1 og et gennemsnit på 5. En prøve, der havde to datapunkter, hver med værdier på 6, har et eksempelmiddelværdi på 6. Et 95% konfidensinterval for befolkningsgennemsnittet ville være 4,6 til 7,4. Dette overlapper klart ikke 95% af Normal fordeling, så den vil ikke indeholde 95% af befolkningen.

Fejl nr. 3

En tredje fejl er at sige, at et konfidensinterval på 95% indebærer, at 95% af alle mulige prøvemidler falder inden for intervallet. Genovervej eksemplet fra det sidste afsnit. Enhver prøve af størrelse to, der kun bestod af værdier mindre end 4,6, ville have et gennemsnit, der var mindre end 4,6. Således vil disse prøveorganer falde uden for dette særlige tillidsinterval. Prøver, der matcher denne beskrivelse, tegner sig for mere end 5% af det samlede beløb. Så det er en fejltagelse at sige, at dette konfidensinterval indfanger 95% af alle eksempler.

Fejl nr. 4

En fjerde fejl i håndteringen af tillidsintervaller er at tro, at de er den eneste kilde til fejl. Selvom der er en fejlmargin forbundet med et konfidensinterval, er der andre steder, hvor fejl kan krybe ind i en statistisk analyse. Et par eksempler på denne type fejl kan være fra en forkert design af eksperimentet, bias i sampling eller en manglende evne til at hente data fra en bestemt undergruppe af befolkningen.