Et datasæt er bimodalt, hvis det har to tilstande. Dette betyder, at der ikke er en enkelt dataværdi, der forekommer med den højeste frekvens. I stedet er der to dataværdier, der binder for at have den højeste frekvens.
Eksempel på et Bimodal-datasæt
For at hjælpe med at give mening om denne definition vil vi se på et eksempel på et sæt med en tilstand og derefter kontrastere dette med et bimodalt datasæt. Antag, at vi har følgende datasæt:
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10
Vi tæller hyppigheden af hvert tal i datasættet:
- 1 forekommer i sættet tre gange
- 2 forekommer i sættet fire gange
- 3 forekommer i den indstillede én gang
- 4 forekommer i den indstillede én gang
- 5 forekommer i sættet to gange
- 6 forekommer i sættet tre gange
- 7 forekommer i sættet tre gange
- 8 forekommer i den indstillede én gang
- 9 forekommer i de indstillede nul gange
- 10 forekommer i sættet to gange
Her ser vi, at 2 forekommer oftest, og det er således tilstanden for datasættet.
Vi kontrasterer dette eksempel til følgende
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10
Vi tæller hyppigheden af hvert tal i datasættet:
- 1 forekommer i sættet tre gange
- 2 forekommer i sættet fire gange
- 3 forekommer i den indstillede én gang
- 4 forekommer i den indstillede én gang
- 5 forekommer i sættet to gange
- 6 forekommer i sættet tre gange
- 7 forekommer i sættet fem gange
- 8 forekommer i den indstillede én gang
- 9 forekommer i de indstillede nul gange
- 10 forekommer i sættet fem gange
Her forekommer 7 og 10 fem gange. Dette er højere end nogen af de andre dataværdier. Således siger vi, at datasættet er bimodalt, hvilket betyder, at det har to tilstande. Ethvert eksempel på et bimodalt datasæt ligner dette.
Implikationer af en Bimodal distribution
Tilstanden er en måde at gøre det på måle centrum af et sæt data. Undertiden er den gennemsnitlige værdi af en variabel den, der forekommer oftest. Af denne grund er det vigtigt at se, om et datasæt er bimodalt. I stedet for en enkelt tilstand, ville vi have to.
En væsentlig implikation af et bimodalt datasæt er, at det kan afsløre for os, at der er to forskellige typer individer, der er repræsenteret i et datasæt. EN histogram af et bimodalt datasæt udviser to toppe eller hump.
For eksempel vil et histogram af testresultater, der er bimodalt, have to toppe. Disse toppe svarer til, hvor den højeste hyppighed af studerende scorede. Hvis der er to tilstande, kan dette vise, at der er to typer studerende: dem, der var forberedt til prøven, og dem, der ikke var forberedt.