Microsofts Excel er nyttigt til at udføre basale beregninger i statistikker. Nogle gange er det nyttigt at kende alle de funktioner, der er tilgængelige for at arbejde med et bestemt emne. Her vil vi overveje de funktioner i Excel, der er relateret til den studerendes t-distribution. Ud over at lave direkte beregninger med t-distributionen, kan Excel også beregne tillidsintervaller og udføre hypotese test.
Funktioner vedrørende T-distribution
Der er flere funktioner i Excel, der fungerer direkte med t-distributionen. Givet en værdi langs t-fordelingen returnerer følgende funktioner alle andelen af fordelingen, der er i den specificerede hale.
En andel i halen kan også fortolkes som en sandsynlighed. Disse halesandsynligheder kan bruges til p-værdier i hypotesetest.
- T.DIST-funktionen returnerer den venstre hale i Studentens t-distribution. Denne funktion kan også bruges til at få y-værdi for ethvert punkt langs densitetskurven.
- T.DIST.RT-funktionen returnerer den højre hale i Studentens t-distribution.
- T.DIST.2T-funktionen returnerer begge haler i den studerendes t-distribution.
Disse funktioner har alle lignende argumenter. Disse argumenter er i rækkefølge:
- Værdien x, der angiver, hvor langs x akse vi er langs fordelingen
- Antallet af grader af frihed.
- T.DIST-funktionen har et tredje argument, som giver os mulighed for at vælge mellem en kumulativ fordeling (ved at indtaste en 1) eller ikke (ved at indtaste en 0). Hvis vi indtaster en 1, returnerer denne funktion en p-værdi. Hvis vi indtaster en 0, returnerer denne funktion y-værdi af densitetskurven for det givne x.
Inverse funktioner
Alle funktionerne T.DIST, T.DIST.RT og T.DIST.2T deler en fælles egenskab. Vi ser, hvordan alle disse funktioner starter med en værdi langs t-fordelingen og derefter returnerer en andel. Der er lejligheder, hvor vi gerne vil vende denne proces. Vi starter med en andel og ønsker at vide værdien af t, der svarer til denne andel. I dette tilfælde bruger vi den passende inverse funktion i Excel.
- Funktionen T.INV returnerer den venstre hale invers af Students T-distribution.
- Funktionen T.INV.2T returnerer de to halerede inverse af Students T-distribution.
Der er to argumenter for hver af disse funktioner. Den første er sandsynligheden eller andelen af fordelingen. Det andet er antallet af frihedsgrader for den særlige distribution, som vi er nysgerrige efter.
Eksempel på T.INV
Vi vil se et eksempel på både T.INV- og T.INV.2T-funktionerne. Antag, at vi arbejder med en t-distribution med 12 frihedsgrader. Hvis vi vil vide punktet langs fordelingen, der tegner sig for 10% af arealet under kurven til venstre for dette punkt, indtaster vi = T.INV (0.1,12) i en tom celle. Excel returnerer værdien -1.356.
Hvis vi i stedet bruger T.INV.2T-funktionen, ser vi, at indtastning = T.INV.2T (0.1,12) returnerer værdien 1.782. Dette betyder, at 10% af arealet under diagrammet for fordelingsfunktionen er til venstre for -1.782 og til højre for 1.782.
Generelt ved symmetrien af t-fordelingen for en sandsynlighed P og frihedsgrader d vi har T.INV.2T (P, d) = ABS (T.INV (P/2,d), hvor ABS er den absolutte værdi funktion i Excel.
Tillidsintervaller
Et af emnerne om inferentiel statistik involverer estimering af en populationsparameter. Dette estimat har form af et konfidensinterval. F.eks. Er skønnet over et populationsmiddel et gennemsnit. Estimatet har også en fejlmargin, som Excel beregner. For denne fejlmargin skal vi bruge CONFIDENCE.T-funktionen.
Excel's dokumentation siger, at funktionen BEKRÆFTELSE.T siges at returnere konfidensintervallet ved hjælp af Students t-distribution. Denne funktion returnerer fejlmargenen. Argumenterne for denne funktion er i den rækkefølge, de skal indtastes:
- Alpha - dette er niveau af betydning. Alpha er også 1 - C, hvor C betegner tillidsniveauet. For eksempel, hvis vi ønsker 95% tillid, skal vi indtaste 0,05 for alfa.
- Standardafvigelse - dette er prøve standardafvigelse fra vores datasæt.
- Prøvestørrelse.
Formlen, som Excel bruger til denne beregning, er:
M = t*s/ √n
Her er M for margin, t* er den kritiske værdi, der svarer til niveauet af selvtillid, s er prøven standardafvigelse og n er prøvestørrelsen.
Eksempel på tillidsinterval
Antag, at vi har en simpel tilfældig prøve på 16 cookies, og vi vejer dem. Vi finder ud af, at deres gennemsnitlige vægt er 3 gram med en standardafvigelse på 0,25 gram. Hvad er et 90% konfidensinterval for middelvægten af alle cookies i dette mærke?
Her skriver vi blot følgende i en tom celle:
= CONFIDENCE.T (0.1,0.25,16)
Excel returnerer 0.109565647. Dette er fejlmargenen. Vi fratrækker og tilføjer dette også til vores prøveværdi, og derfor er vores konfidensinterval 2,89 gram til 3,11 gram.
Test af betydning
Excel udfører også hypotetests, der er relateret til t-distributionen. Funktionen T.TEST returnerer p-værdi til flere forskellige test af betydning. Argumenterne for T.TEST-funktionen er:
- Array 1, der giver det første sæt prøvedata.
- Array 2, der giver det andet sæt prøvedata
- Hale, hvor vi kan indtaste enten 1 eller 2.
- Type - 1 betegner en parret t-test, 2 en to-prøve-test med den samme populationsvarians og 3 en to-prøve-test med forskellige populationsvariationer.