Grader af frihed i statistik og matematik

I statistikker bruges frihedsgrader til at definere antallet af uafhængige mængder, der kan tildeles en statistisk fordeling. Dette tal henviser typisk til et positivt heltal, der angiver den manglende begrænsning af en persons evne til at beregne manglende faktorer fra statistiske problemer.

Frihedsgrader fungerer som variabler i den endelige beregning af en statistik og bruges til at bestemme resultatet af forskellige scenarier i et system og i matematiske frihedsgrader definerer antallet af dimensioner i et domæne, der er nødvendigt for at bestemme fuld vektor.

For at illustrere begrebet frihedsgrad vil vi se på en grundlæggende beregning vedrørende prøven middel, og for at finde gennemsnittet af en liste med data, tilføjer vi alle data og dividerer med det samlede antal af værdier.

En illustration med et eksempelværdi

Antag et øjeblik, at vi kender betyde af et datasæt er 25, og at værdierne i dette sæt er 20, 10, 50 og et ukendt antal. Formlen for et eksempelmiddel giver os ligningen

instagram viewer

(20 + 10 + 50 + x) / 4 = 25, hvor x betegner det ukendte ved hjælp af nogle grundlæggende algebra, kan man derefter bestemme, at det manglende antal, x, er lig med 20.

Lad os ændre dette scenario lidt. Igen antager vi, at vi ved gennemsnittet af et datasæt er 25. Denne gang er værdierne i datasættet imidlertid 20, 10 og to ukendte værdier. Disse ukendte kan være forskellige, så vi bruger to forskellige variabler, x, og y, at betegne dette. Den resulterende ligning er (20 + 10 + x + y) / 4 = 25. Med nogle algebra opnår vi y = 70- x. Formlen er skrevet i denne form for at vise, at når vi først vælger en værdi for x, værdien for y er helt bestemt. Vi har et valg at træffe, og det viser, at der er et grad af frihed.

Nu skal vi se på en prøvestørrelse på hundrede. Hvis vi ved, at gennemsnittet af disse eksempeldata er 20, men ikke kender værdierne for nogen af dataene, er der 99 grader af frihed. Alle værdier skal tilføje op til i alt 20 x 100 = 2000. Når vi først har værdierne for 99 elementer i datasættet, er den sidste blevet bestemt.

Student t-score og Chi-Square distribution

Grad af frihed spiller en vigtig rolle, når man bruger Studerende t-score bord. Der er faktisk flere t-score distributioner. Vi skelner mellem disse fordelinger ved hjælp af grader af frihed.

Her Sandsynlighedsfordeling som vi bruger afhænger af størrelsen på vores prøve. Hvis vores prøve størrelse er n, så er antallet af frihedsgrader n-1. For eksempel vil en prøvestørrelse på 22 kræve, at vi bruger række af t-score bord med 21 frihedsgrader.

Brugen af en chi-square distribution kræver også brug af grader af frihed. Her på en identisk måde som med t-score distribution, prøvestørrelsen bestemmer, hvilken distribution der skal bruges. Hvis prøvestørrelsen er n, så er der n-1 grader af frihed.

Standardafvigelse og avancerede teknikker

Et andet sted, hvor grader af frihed dukker op, er formlen for standardafvigelsen. Denne begivenhed er ikke så åben, men vi kan se den, hvis vi ved, hvor vi skal se. Til finde en standardafvigelse vi leder efter den "gennemsnitlige" afvigelse fra gennemsnittet. Efter at have trukket gennemsnittet fra hver dataværdi og kvadratet forskellene, ender vi dog med n-1 hellere end n som vi kunne forvente.

Tilstedeværelsen af n-1 kommer fra antallet af frihedsgrader. Siden n dataværdier og eksempelmidlet bruges i formlen, der er n-1 grader af frihed.

Mere avancerede statistiske teknikker bruger mere komplicerede måder at tælle graderne af frihed. Ved beregning af teststatistikken for to midler med uafhængige prøver af n₁ og n₂ elementer, antallet af frihedsgrader har en ganske kompliceret formel. Det kan estimeres ved hjælp af det mindste af n₁-1 og n₂-1

Et andet eksempel på en anden måde at tælle frihedsgrader kommer med en F prøve. Ved udførelse af en F test vi har k prøver af hver størrelse n—Graden af frihed i tælleren er k-1 og i nævneren er k(n-1).