I konstruktionen af en histogram, der er flere trin som vi skal påtage os, før vi rent faktisk tegner vores graf. Efter opsætning af klasser som vi vil bruge, tildeler vi hver af vores dataværdier til en af disse klasser, tæller derefter antallet af dataværdier, der falder ind i hver klasse og tegner højderne på bjælkerne. Disse højder kan bestemmes på to forskellige måder, der er indbyrdes forbundet: frekvens eller relativ frekvens.
Frekvensen for en klasse er antallet af, hvor mange dataværdier falder ind i en bestemt klasse, hvor klasser med større frekvenser har højere søjler, og klasser med mindre frekvenser har lavere søjler. På den anden side kræver relativ frekvens et yderligere trin, da det er målet for, hvilken andel eller procent af dataværdierne falder inden for en bestemt klasse.
En ligetil beregning bestemmer den relative frekvens fra frekvensen ved at tilføje alle klassernes frekvenser og dele antallet af hver klasse med summen af disse frekvenser.
Forskellen mellem frekvens og relativ frekvens
For at se forskellen mellem frekvens og relativ frekvens vil vi overveje følgende eksempel. Lad os antage, at vi ser på studerendes historie i 10. klasse og har de klasser, der svarer til bogstavkarakterer: A, B, C, D, F. Antallet af hver af disse karakterer giver os en frekvens for hver klasse:
- 7 studerende med en F
- 9 studerende med en D
- 18 studerende med en C
- 12 studerende med en B
- 4 studerende med A
For at bestemme den relative frekvens for hver klasse tilføjer vi først det samlede antal datapunkter: 7 + 9 + 18 + 12 + 4 = 50. Derefter deler vi hver frekvens med denne sum 50.
- 0,14 = 14% studerende med en F
- 0,18 = 18% studerende med en D
- 0,36 = 36% studerende med en C
- 0,24 = 24% studerende med en B
- 0,08 = 8% studerende med A
De oprindelige data angivet ovenfor med antallet af studerende, der falder ind i hver klasse (bogstavkarakter) ville være indikativ for frekvensen, mens procentdelen i det andet datasæt repræsenterer den relative frekvens af disse kvaliteter.
En nem måde at definere forskellen mellem frekvens og relativ frekvens er, at frekvensen er afhængig af de faktiske værdier for hver klasse i et statistisk datasæt, mens den relative frekvens sammenligner disse individuelle værdier med de samlede summer for alle berørte klasser i en data sæt.
histogrammer
Enten frekvenser eller relative frekvenser kan bruges til et histogram. Selvom tallene langs den lodrette akse vil være forskellige, forbliver den samlede form af histogrammet uændret. Dette skyldes, at højderne i forhold til hinanden er de samme, uanset om vi bruger frekvenser eller relative frekvenser.
Relative frekvenshistogrammer er vigtige, fordi højderne kan fortolkes som sandsynligheder. Disse sandsynlighedshistogrammer giver en grafisk visning af a Sandsynlighedsfordeling, som kan bruges til at bestemme sandsynligheden for, at visse resultater forekommer inden for en given population.
Histogrammer er nyttige værktøjer til hurtigt at observere tendenser i populationer med henblik på statistikere, lovgivere og samfundsarrangører for at være i stand til at bestemme det bedste handlingsforløb for at påvirke flest mennesker i en given befolkning.