Eksempel på to prøve T-test og tillidsinterval

Nogle gange i statistikker er det nyttigt at se udarbejdede eksempler på problemer. Disse eksempler kan hjælpe os med at finde ud af lignende problemer. I denne artikel vil vi gennemgå processen med at udføre inferentielle statistikker for et resultat, der vedrører to populationsmidler. Ikke kun vil vi se, hvordan man udfører en hypotese test om forskellen mellem to befolkningsmidler, vil vi også konstruere en konfidensinterval for denne forskel. De metoder, vi bruger, kaldes undertiden en to-prøve t-test og et to-prøve-t-konfidensinterval.

Erklæringen om problemet

Antag, at vi ønsker at teste den matematiske egnethed hos skolebørn. Et spørgsmål, som vi måske har, er, hvis niveauer af højere kvalitet har højere gennemsnitlige testresultater.

En simpel tilfældig prøve på 27 tredje klassinger får en matematikprøve, deres svar scores, og resultaterne viser sig at have en gennemsnitlig score på 75 point med en prøve standardafvigelse af 3 point.

En simpel tilfældig prøve på 20 femteklassinger får den samme matematikprøve, og deres svar scores. Den gennemsnitlige score for femteklassinger er 84 point med en prøvestandardafvigelse på 5 point.

instagram viewer

I lyset af dette scenarie stiller vi følgende spørgsmål:

Leverer eksempeldata os bevis for, at den gennemsnitlige test score for befolkningen i alle femteklassinger overstiger den gennemsnitlige test score for befolkningen i alle tredje klassinger?
Hvad er et 95% konfidensinterval for forskellen i gennemsnitlige testresultater mellem populationerne i 3. klassinger og femteklassinger?

Betingelser og procedurer

Vi skal vælge, hvilken procedure vi skal bruge. Ved at gøre dette skal vi sørge for og kontrollere, at betingelserne for denne procedure er opfyldt. Vi bliver bedt om at sammenligne to populationsmidler. En samling af metoder, der kan bruges til at gøre dette, er dem til to-prøve-t-procedurer.

For at bruge disse t-procedurer til to prøver, er vi nødt til at sikre, at følgende betingelser gælder:

Vi har to enkle tilfældige prøver fra de to populationer af interesse.
Vores enkle tilfældige prøver udgør ikke mere end 5% af befolkningen.
De to prøver er uafhængige af hinanden, og der er ingen matching mellem forsøgspersoner.
Variablen fordeles normalt.
Både populationens gennemsnit og standardafvigelse er ukendt for begge befolkninger.

Vi ser, at de fleste af disse betingelser er opfyldt. Vi fik at vide, at vi har enkle tilfældige prøver. Befolkningen, som vi studerer, er stor, da der er millioner af studerende på disse klassetrin.

Betingelsen for, at vi ikke automatisk kan antage, er, hvis testresultaterne normalt distribueres. Da vi har en stor tilstrækkelig prøvestørrelse, behøver vi ikke robustet af vores t-procedurer, at variablen normalt skal distribueres.

Da betingelserne er opfyldt, udfører vi et par foreløbige beregninger.

Standard fejl

Standardfejlen er et skøn over en standardafvigelse. Til denne statistik tilføjer vi prøvevariansen for prøverne og tager derefter kvadratroten. Dette giver formlen:

(s₁² / n₁ + s₂² / n₂)^1/2

Ved at bruge værdierne ovenfor ser vi, at værdien af standardfejlen er

(3²/ 27+ 5²/ 20)^1/2 =(1 / 3 + 5 / 4 )^1/2 = 1.2583

Grader af frihed

Vi kan bruge den konservative tilnærmelse til vores grader af frihed. Dette kan undervurdere antallet af frihedsgrader, men det er meget lettere at beregne end at bruge Welchs formel. Vi bruger den mindste af de to prøvestørrelser og trækker derefter en fra dette nummer.

For vores eksempel er den mindste af de to prøver 20. Dette betyder, at antallet af frihedsgrader er 20 - 1 = 19.

Hypotestest

Vi ønsker at teste hypotesen om, at elever på femte klasse har en gennemsnitlig testresultat, der er større end gennemsnitskarakteren for studerende i tredje klasse. Lad μ₁ være den gennemsnitlige score for befolkningen i alle femteklassinger. Tilsvarende lader vi μ₂ være den gennemsnitlige score for befolkningen i alle tredje klassinger.

Hypoteserne er som følger:

H₀: μ₁ - μ₂ = 0
H_-en: μ₁ - μ₂ > 0

Teststatistikken er forskellen mellem prøveorganerne, der derefter divideres med standardfejlen. Da vi bruger prøvestandardafvigelser til at estimere populationsstandardafvigelsen, er teststatistikken fra t-fordelingen.

Værdien af teststatistikken er (84 - 75) /1.2583. Dette er cirka 7.15.

Vi bestemmer nu, hvad p-værdien er for denne hypotesetest. Vi ser på værdien af teststatistikken, og hvor denne er placeret på en t-fordeling med 19 frihedsgrader. Til denne distribution har vi 4,2 x 10^-7 som vores p-værdi. (En måde at bestemme dette på er at bruge funktionen T.DIST.RT i Excel.)

Da vi har en sådan lille p-værdi, afviser vi nullhypotesen. Konklusionen er, at den gennemsnitlige test score for femteklassinger er højere end den gennemsnitlige test score for tredje klassinger.

Konfidensinterval

Da vi har konstateret, at der er en forskel mellem gennemsnitskaraktererne, bestemmer vi nu et konfidensinterval for forskellen mellem disse to midler. Vi har allerede meget af det, vi har brug for. Konfidensintervallet for forskellen skal have både et estimat og en fejlmargin.

Estimatet for forskellen på to midler er ligetil at beregne. Vi finder simpelthen forskellen i eksempelmidlerne. Denne forskel i stikprøven betyder estimerer forskellen i populationen.

For vores data er forskellen i prøveeksempler 84 - 75 = 9.

Fejlmargenen er lidt vanskeligere at beregne. Til dette skal vi multiplicere den korrekte statistik med standardfejlen. Den statistik, vi har brug for, findes ved at konsultere en tabel eller statistisk software.

Igen ved at bruge den konservative tilnærmelse har vi 19 grader af frihed. For et 95% konfidensinterval ser vi, at t^* = 2.09. Vi kunne bruge T.INV-funktion i Excel for at beregne denne værdi.

Vi sætter nu alt sammen og ser, at vores fejlmargin er 2,09 x 1,2583, hvilket er cirka 2,63. Konfidensintervallet er 9 ± 2,63. Intervallet er 6,37 til 11,63 point på den test, som femte og tredje klassinger valgte.