Eksempel på tillidsinterval for variation

click fraud protection

Befolkningsvariansen giver en indikation af, hvordan man spreder et datasæt. Desværre er det typisk umuligt at vide nøjagtigt, hvad denne populationsparameter er. For at kompensere for vores manglende viden bruger vi et emne fra kaldet inferential statistik tillidsintervaller. Vi vil se et eksempel på, hvordan man beregner et konfidensinterval for en befolkningsvarians.

Formel for tillidsinterval

Formlen for (1 - α) tillidsinterval om befolkningsvariansen. Gives af følgende streng af uligheder:

[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / EN.

Her n er prøvestørrelsen, s2 er prøvevariansen. Nummeret EN er punktet i chi-square distribution med n -1 frihedsgrader, hvor nøjagtigt α / 2 af området under kurven er til venstre for EN. På lignende måde antallet B er punktet for den samme chi-kvadratfordeling med nøjagtigt α / 2 af området under kurven til højre for B.

indledende

Vi begynder med et datasæt med 10 værdier. Dette sæt af dataværdier blev opnået ved en simpel tilfældig prøve:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

instagram viewer

Der ville være behov for nogen sonderende dataanalyse for at vise, at der ikke er nogen outliers. Ved at konstruere en stilk og blad plot vi ser, at disse data sandsynligvis kommer fra en distribution, der er omtrent normalt distribueret. Dette betyder, at vi kan fortsætte med at finde et 95% konfidensinterval for befolkningsvariansen.

Prøvevariation

Vi er nødt til at estimere populationsvariansen med prøvevariansen, der er angivet med s2. Så vi begynder med at beregne denne statistik. Grundlæggende gennemsnit vi summen af ​​de kvadratiske afvigelser fra gennemsnittet. I stedet for at dele dette beløb med n vi deler det efter n - 1.

Vi finder ud af, at eksempeldelen er 104,2. Ved hjælp af dette har vi summen af ​​kvadratiske afvigelser fra gennemsnittet givet af:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Vi deler denne sum med 10 - 1 = 9 for at opnå en prøvevarians på 277.

Chi-Square distribution

Vi henvender os nu til vores chi-square distribution. Da vi har 10 dataværdier, har vi 9 grader af frihed. Da vi ønsker de midterste 95% af vores distribution, har vi brug for 2,5% i hvert af de to haler. Vi konsulterer en chi-square tabel eller software og ser, at tabelværdierne på 2.7004 og 19.023 omslutter 95% af distributionens område. Disse tal er EN og B, henholdsvis.

Vi har nu alt, hvad vi har brug for, og vi er klar til at samle vores tillidsinterval. Formlen for det venstre slutpunkt er [(n - 1)s2] / B. Dette betyder, at vores venstre slutpunkt er:

(9 x 277) /19,023 = 133

Det rigtige slutpunkt findes ved udskiftning B med EN:

(9 x 277) / 2.7004 = 923

Og derfor er vi 95% sikre på, at befolkningsvariationen ligger mellem 133 og 923.

Befolkningsstandardafvigelse

Da standardafvigelsen er kvadratroten af ​​variationen, kunne denne metode naturligvis bruges til at konstruere et konfidensinterval for populationsstandardafvigelsen. Det eneste, vi skulle gøre, er at tage firkantede rødder af slutpunkterne. Resultatet ville være et 95% konfidensinterval for standardafvigelse.

instagram story viewer