Hvad er den normale standardfordeling i statistikker?

Klokke kurver vises i hele statistikken. Forskellige målinger såsom diametre af frø, længder af fiskefinner, scoringer på SAT og vægte på individuelle ark af et papirramme danner alle klokkekurver, når de er graferet. Den generelle form for alle disse kurver er den samme. Men alle disse kurver er forskellige, fordi det er meget usandsynligt, at nogen af ​​dem har samme gennemsnit eller standardafvigelse. Klokkekurver med store standardafvigelser er brede, og klokkekurver med små standardafvigelser er tynde. Klokkekurver med større midler forskydes mere til højre end dem med mindre midler.

Et eksempel

For at gøre dette lidt mere konkret, lad os lade som om vi måler diametrerne på 500 kornkorn. Derefter registrerer vi, analyserer og tegner vi disse data. Det konstateres, at datasættet er formet som en klokkekurve og har et gennemsnit på 1,2 cm med en standardafvigelse på 4 cm. Antag nu, at vi gør det samme med 500 bønner, og vi finder ud af, at de har en gennemsnitlig diameter på 0,8 cm med en standardafvigelse på 0,04 cm.

instagram viewer

Klokkekurverne fra begge disse datasæt er afbildet ovenfor. Den røde kurve svarer til majsdataene, og den grønne kurve svarer til bønnedataene. Som vi kan se, er centret og spændene for disse to kurver forskellige.

Dette er helt klart to forskellige klokkekurver. De er forskellige, fordi deres midler og standardafvigelser stemmer ikke. Da ethvert interessant datasæt, vi støder på, kan have et hvilket som helst positivt tal som en standardafvigelse, og ethvert tal for et middel, skraber vi virkelig bare overfladen på uendelig antal klokkekurver. Det er en masse kurver og alt for mange at tackle. Hvad er løsningen?

En meget speciel klokkekurve

Et mål med matematik er at generalisere ting, når det er muligt. Nogle gange er flere individuelle problemer specielle tilfælde af et enkelt problem. Denne situation, der involverer klokkekurver, er en fantastisk illustration af det. I stedet for at beskæftige os med et uendeligt antal klokkekurver, kan vi relatere dem alle til en enkelt kurve. Denne specielle klokkekurve kaldes standard klokkekurve eller standard normalfordeling.

Standardklokkekurven har et gennemsnit på nul og en standardafvigelse på en. Enhver anden klokkekurve kan sammenlignes med denne standard ved hjælp af en ligetil beregning.

Funktioner i standard normal distribution

Alle egenskaber ved en hvilken som helst klokkekurve holder for den normale normalfordeling.

  • Standard normalfordeling har ikke kun et gennemsnit på nul, men også en median og en tilstand af nul. Dette er midten af ​​kurven.
  • Standard normalfordeling viser spejlsymmetri ved nul. Halvdelen af ​​kurven er til venstre for nul, og halvdelen af ​​kurven er til højre. Hvis kurven blev foldet langs en lodret linje ved nul, ville begge halvdele matche perfekt.
  • Standard normalfordeling følger 68-95-99.7-reglen, som giver os en nem måde at estimere følgende:
    • Cirka 68% af alle data er mellem -1 og 1.
    • Cirka 95% af alle data er mellem -2 og 2.
    • Cirka 99,7% af alle data er mellem -3 og 3.

Hvorfor vi bryder os

På dette tidspunkt spørger vi måske: ”Hvorfor gider det med en standard klokkekurve?” Det kan virke som en unødvendig komplikation, men standard klokkekurven vil være fordelagtig, når vi fortsætter i statistikken.

Vi finder ud af, at en type problem i statistikker kræver, at vi finder områder under dele af enhver klokkekurve, som vi støder på. Klokkekurven er ikke en dejlig form for områder. Det er ikke som et rektangel eller højre trekant der har let arealformler. At finde områder af dele af en klokkekurve kan være vanskeligt, så svært, faktisk, at vi bliver nødt til at bruge noget beregning. Hvis vi ikke standardiserer vores klokkekurver, er vi nødt til at lave en beregning, hver gang vi ønsker at finde et område. Hvis vi standardiserer vores kurver, er alt arbejde med beregning af områder blevet udført for os.