Hvad er sammendraget af 5 numre?

click fraud protection

Der er en række beskrivende statistikker. Tal som middelværdien, median, tilstand, skævhed, kurtosis, standardafvigelse, første kvartil og tredje kvartil, for at nævne nogle få, hver fortæller os noget om vores data. I stedet for at se på disse beskrivende statistik individuelt hjælper nogle gange at kombinere dem med at give os et komplet billede. Med dette mål for øje er sammenfatning af fem numre en praktisk måde at kombinere fem beskrivende statistikker på.

Hvilke fem numre?

Det er tydeligt, at der skal være fem numre i vores resume, men hvilke fem? De valgte numre er for at hjælpe os med at kende centrum for vores data såvel som hvor spredt datapunkterne er. Med dette i tankerne består sammendraget af fem numre af følgende:

  • Minimumet - dette er den mindste værdi i vores datasæt.
  • Den første kvartil - dette nummer er angivet Q1 og 25% af vores data falder til under den første kvartil.
  • Medianen - dette er dataene midtvejs. 50% af alle data falder under medianen.
  • Den tredje kvartil - dette nummer er angivet Q3 og 75% af vores data falder til under den tredje kvartil.
  • instagram viewer
  • Det maksimale - dette er den største værdi i vores datasæt.

Middel- og standardafvigelsen kan også bruges sammen til at formidle centrum og spredningen af ​​et datasæt. Begge disse statistikker er dog modtagelige for outliers. Median, første kvartil og tredje kvartil er ikke så stærkt påvirket af outliers.

Et eksempel

I betragtning af følgende datasæt rapporterer vi det fem numre resume:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Der er i alt tyve punkter i datasættet. Medianen er således gennemsnittet af tiende og ellevte dataværdier eller:

(7 + 8)/2 = 7.5.

Medianen for den nederste halvdel af dataene er den første kvartil. Den nederste halvdel er:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Således beregner viQ1= (4 + 6)/2 = 5.

Medianen for den øverste halvdel af det originale datasæt er den tredje kvartil. Vi er nødt til at finde medianen af:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Således beregner viQ3= (15 + 15)/2 = 15.

Vi samler alle ovennævnte resultater sammen og rapporterer, at det fem numre resume for ovennævnte datasæt er 1, 5, 7.5, 12, 20.

Grafisk repræsentation

Fem taloversigter kan sammenlignes med hinanden. Vi finder ud af, at to sæt med de samme midler og standardafvigelser kan have meget forskellige femtaloversigter. For let at sammenligne to fem nummeroversigter på et øjeblik, kan vi bruge en boxplot, eller boks og whiskers-graf.

instagram story viewer