Hvad er kurtose i statistikken?

Fordeling af data og sandsynlighedsfordelinger er ikke alle de samme. Nogle er asymmetriske og skæv til venstre eller til højre. Andre fordelinger er bimodal og har to toppe. En anden funktion, man skal overveje, når man taler om en fordeling er formen på halerne i fordelingen længst til venstre og helt til højre. Kurtosis er målet for tykkelsen eller tyngden af ​​halerne i en fordeling. Kurtosen af ​​en fordeling er i en af ​​tre kategorier af klassificering:

  • mesokurtisk
  • Leptokurtic
  • Platykurtic

Vi vil overveje hver af disse klassificeringer på sin side. Vores undersøgelse af disse kategorier vil ikke være så præcis, som vi kunne være, hvis vi brugte den tekniske matematiske definition af kurtose.

mesokurtisk

Kurtose måles typisk med hensyn til Normal fordeling. En fordeling, der har haler formet på omtrent samme måde som enhver normal distribution, ikke kun standard normal distribution, siges at være mesokurtisk. Kurtosen ved en mesokurtisk distribution er hverken høj eller lav, snarere betragtes den som en basislinje for de to andre klassifikationer.

instagram viewer

Udover normale fordelinger, binomiale fordelinger, for hvilke p er tæt på 1/2 betragtes som mesokurtisk.

Leptokurtic

En leptokurtisk distribution er en, der har kurtose større end en mesokurtisk distribution. Leptokurtiske fordelinger identificeres undertiden ved toppe, der er tynde og høje. Halene på disse fordelinger, både til højre og venstre, er tykke og tunge. Leptokurtiske fordelinger er navngivet med præfikset "lepto", der betyder "mager."

Der er mange eksempler på leptokurtiske fordelinger. En af de mest kendte leptokurtiske fordelinger er Studerendes t distribution.

Platykurtic

Den tredje klassificering for kurtose er platykurtisk. Platykurtiske fordelinger er dem, der har slanke haler. Mange gange har de en top, der er lavere end en mesokurtisk distribution. Navnet på disse typer distributioner kommer fra betydningen af ​​præfikset "platy", der betyder "bredt."

Alle uniform fordelinger er platykurtiske. Ud over dette kommer diskrete sandsynlighedsfordeling fra en enkelt flip af en mønt er platykurtisk.

Beregning af Kurtosis

Disse klassificeringer af kurtose er stadig noget subjektive og kvalitative. Selvom vi muligvis kan se, at en distribution har tykkere haler end en normal distribution, hvad nu hvis vi ikke har grafen for en normal distribution at sammenligne med? Hvad hvis vi vil sige, at en distribution er mere leptokurtisk end en anden?

For at besvare disse slags spørgsmål har vi ikke kun brug for en kvalitativ beskrivelse af kurtose, men et kvantitativt mål. Den anvendte formel er μ44 hvor μ4 er Pearsons fjerde øjeblik om middelværdien og sigma er standardafvigelsen.

Overskydende kurtose

Nu hvor vi har en måde at beregne kurtose på, kan vi sammenligne de opnåede værdier snarere end former. Den normale fordeling viser sig at have en kurtose på tre. Dette bliver nu vores grundlag for mesokurtiske fordelinger. En fordeling med kurtose større end tre er leptokurtisk, og en fordeling med kurtose mindre end tre er platykurtisk.

Da vi behandler en mesokurtisk fordeling som en basislinje for vores andre fordelinger, kan vi trække tre fra vores standardberegning for kurtose. Formlen μ44 - 3 er formlen for overskydende kurtose. Vi kunne derefter klassificere en fordeling fra dens overskydende kurtose:

  • Mesokurtiske fordelinger har overskydende kurtose på nul.
  • Platykurtiske fordelinger har negativ overskydende kurtose.
  • Leptokurtiske fordelinger har positiv overskydende kurtose.

En note om navnet

Ordet "kurtosis" synes underligt ved første eller anden læsning. Det giver faktisk mening, men vi er nødt til at kende græsk for at genkende dette. Kurtosis stammer fra en translitteration af det græske ord kurtos. Dette græske ord har betydningen "buet" eller "svulmende", hvilket gør det til en passende beskrivelse af begrebet kendt som kurtose.