Middel, median og tilstand

Målinger af central tendens er tal, der beskriver, hvad der er gennemsnitligt eller typisk inden for en fordeling af data. Der er tre hovedmål for central tendens: middel, medianog tilstand. Mens de alle er mål med central tendens, beregnes hver forskel og måler noget andet end de andre.

Middelværdien

Gennemsnittet er det mest almindelige mål for central tendens, som forskere og mennesker bruger i alle slags erhverv. Det er målet for den centrale tendens, der også kaldes gennemsnit. En forsker kan bruge middelet til at beskrive datadistributionen af variabler målt som intervaller eller forhold. Dette er variabler, der inkluderer numerisk tilsvarende kategorier eller intervaller (som race, klasse, køn, eller uddannelsesniveau), såvel som variabler målt numerisk fra en skala, der begynder med nul (som husstandsindkomst eller antallet af børn i en familie).

Et middel er meget let at beregne. Man skal blot tilføje alle dataværdier eller "scores" og derefter dele denne sum med det samlede antal scoringer i fordelingen af ​​data. For eksempel, hvis fem familier har henholdsvis 0, 2, 2, 3 og 5 børn, er det gennemsnitlige antal børn er (0 + 2 + 2 + 3 + 5) / 5 = 12/5 = 2,4. Det betyder, at de fem husstande har et gennemsnit på 2,4 børn.

instagram viewer

Medianen

Medianen er værdien i midten af ​​en fordeling af data, når disse data er organiseret fra den laveste til den højeste værdi. Dette mål for central tendens kan beregnes for variabler, der måles med ordinale, intervaller eller forhold skalaer.

Beregningen af ​​medianen er også temmelig enkel. Lad os antage, at vi har følgende liste over numre: 5, 7, 10, 43, 2, 69, 31, 6, 22. Først skal vi arrangere numrene i rækkefølge fra laveste til højeste. Resultatet er dette: 2, 5, 6, 7, 10, 22, 31, 43, 69. Medianen er 10, fordi det er det nøjagtige mellemnummer. Der er fire numre under 10 og fire numre over 10.

Hvis din datadistribution har et jævnt antal tilfælde, hvilket betyder, at der ikke er nogen nøjagtig midtvejs, justerer du simpelthen dataområdet lidt for at beregne medianen. For eksempel, hvis vi tilføjer tallet 87 til slutningen af ​​vores liste over numre ovenfor, har vi 10 samlede numre i vores distribution, så der er ikke et enkelt midterste tal. I dette tilfælde tager man gennemsnittet af scoringerne for de to midterste numre. På vores nye liste er de to midterste numre 10 og 22. Så vi tager gennemsnittet af disse to tal: (10 + 22) / 2 = 16. Vores median er nu 16.

Funktionen

Denne tilstand er målet for den centrale tendens, der identificerer den kategori eller score, der hyppigst forekommer inden for distribution af data. Med andre ord er det den mest almindelige score eller score, der vises det højeste antal gange i en fordeling. Funktionen kan beregnes for alle typer data, inklusive dem, der måles som nominelle variabler, eller med navn.

Lad os sige, at vi ser på kæledyr, der ejes af 100 familier, og distributionen ser sådan ud:

DyrAntal familier, der ejer det

  • Hund: 60
  • Kat: 35
  • Fisk: 17
  • Hamster: 13
  • Slange: 3

Tilstanden her er "hund", da flere familier ejer en hund end noget andet dyr. Bemærk, at tilstanden altid udtrykkes som kategori eller score, ikke hyppigheden af ​​denne score. F.eks. Er ovenstående eksempel tilstanden "hund", ikke 60, hvilket er antallet af gange, hund vises.

Nogle distributioner har overhovedet ikke en tilstand. Dette sker, når hver kategori har den samme frekvens. Andre distributioner kan have mere end en tilstand. For eksempel, når en distribution har to scoringer eller kategorier med den samme højeste frekvens, kaldes den ofte for "bimodal."

instagram story viewer