En af de vigtigste dele af inferentielle statistikker er udviklingen af måder at beregne på tillidsintervaller. Tillidsintervaller giver os en måde at estimere en befolkning på parameter. I stedet for at sige, at parameteren er lig med en nøjagtig værdi, siger vi, at parameteren falder inden for et værdiområde. Dette interval af værdier er typisk et estimat sammen med en fejlmargin, som vi tilføjer og trækker fra estimatet.
Ved hvert interval er der et selvtillidsniveau. Niveauet af tillid giver en måling af, hvor ofte på lang sigt den metode, der bruges til at opnå vores konfidensinterval, indfanger den sande populationsparameter.
Det er nyttigt, når man lærer om statistik, at se nogle eksempler, der er udarbejdet. Nedenfor vil vi se på flere eksempler på tillidsintervaller omkring et befolknings middelværdi. Vi vil se, at den metode, vi bruger til at konstruere et konfidensinterval om et middel, afhænger af yderligere information om vores befolkning. Specifikt afhænger den tilgang, vi tager, af, om vi kender befolkningens standardafvigelse eller ej.
Erklæring om problemer
Vi starter med en simpel tilfældig prøve på 25 en bestemt art af myrer og måler deres haler. Den gennemsnitlige halelængde på vores prøve er 5 cm.
- Hvis vi ved, at 0,2 cm er standardafvigelsen for halelængderne for alle newts i befolkningen, hvad er da et 90% konfidensinterval for den gennemsnitlige halelængde for alle newts i befolkningen?
- Hvis vi ved, at 0,2 cm er standardafvigelsen for halelængderne for alle newts i befolkningen, hvad er da et 95% konfidensinterval for den gennemsnitlige halelængde for alle newts i befolkningen?
- Hvis vi finder ud af, at 0,2 cm er standardafvigelsen for halelængderne til murterne i vores prøve, er befolkning, hvad er derefter et 90% konfidensinterval for den gennemsnitlige halelængde for alle newts i befolkning?
- Hvis vi finder ud af, at 0,2 cm er standardafvigelsen for halelængderne til murterne i vores prøve, er befolkning, hvad er et 95% konfidensinterval for den gennemsnitlige halelængde for alle newts i befolkning?
Diskussion af problemerne
Vi begynder med at analysere hvert af disse problemer. I de to første problemer vi kend værdien af befolkningens standardafvigelse. Forskellen mellem disse to problemer er, at tillidsniveauet er større i nr. 2 end hvad det er for nr. 1.
I de to andre problemer populationsstandardafvigelsen er ukendt. For disse to problemer estimerer vi denne parameter med prøven standardafvigelse. Som vi så i de to første problemer, har vi også forskellige tillidsniveauer.
Løsninger
Vi beregner løsninger for hvert af ovenstående problemer.
- Da vi kender populationsstandardafvigelsen, bruger vi en tabel med z-scores. Værdien af z der svarer til et 90% konfidensinterval er 1.645. Ved at bruge formel for fejlmargen vi har et konfidensinterval på 5 - 1.645 (0.2 / 5) til 5 + 1.645 (0.2 / 5). (De 5 i nævneren her er fordi vi har taget kvadratroten af 25). Efter at have udført aritmetikken har vi 4.934 cm til 5.066 cm som et konfidensinterval for befolkningsgennemsnittet.
- Da vi kender populationsstandardafvigelsen, bruger vi en tabel med z-scores. Værdien af z der svarer til et 95% konfidensinterval er 1,96. Ved at bruge formlen til fejlmargenen har vi et konfidensinterval på 5 - 1,96 (0,2 / 5) til 5 + 1,96 (0,2 / 5). Efter at have udført aritmetikken har vi 4.922 cm til 5.078 cm som et konfidensinterval for befolkningsgennemsnittet.
- Her kender vi ikke populationsstandardafvigelsen, kun prøvestandardafvigelsen. Således vil vi bruge en tabel med t-score. Når vi bruger en tabel med t score, vi har brug for at vide, hvor mange frihedsgrader vi har. I dette tilfælde er der 24 frihedsgrader, hvilket er en mindre end prøvestørrelse på 25. Værdien af t der svarer til et 90% konfidensinterval er 1,71. Ved at bruge formlen til fejlmargenen har vi et konfidensinterval på 5 - 1,71 (0,2 / 5) til 5 + 1,71 (0,2 / 5). Efter at have udført aritmetikken har vi 4.932 cm til 5.068 cm som et konfidensinterval for befolkningsgennemsnittet.
- Her kender vi ikke populationsstandardafvigelsen, kun prøvestandardafvigelsen. Således vil vi igen bruge en tabel med t-score. Der er 24 frihedsgrader, hvilket er en mindre end prøvestørrelse på 25. Værdien af t der svarer til et 95% konfidensinterval er 2,06. Ved at bruge formlen til fejlmargenen har vi et konfidensinterval på 5 - 2,06 (0,2 / 5) til 5 + 2,06 (0,2 / 5). Efter at have udført aritmetikken har vi 4,912 cm til 5,082 cm som et konfidensinterval for befolkningsgennemsnittet.
Diskussion af løsningen
Der er et par ting at bemærke ved sammenligning af disse løsninger. Den første er, at i hvert tilfælde, når vores tillidsniveau steg, jo større er værdien af z eller t som vi endte med. Årsagen hertil er, at vi har brug for et bredere interval for at være mere sikre på, at vi virkelig fangede befolkningsværdien i vores tillidsinterval.
Den anden funktion, der skal bemærkes, er, at for et bestemt konfidensinterval, dem, der bruger t er bredere end dem med z. Årsagen hertil er, at t distribution har større variation i halerne end en normal normal distribution.
Nøglen til at rette løsninger på disse typer problemer er, at hvis vi kender befolkningens standardafvigelse, bruger vi en tabel med z-scores. Hvis vi ikke kender populationsstandardafvigelsen, bruger vi en tabel med t scorer.