Hvad er medianen i statistikken?

click fraud protection

Det er midnattsvisning af den nyeste hitfilm. Mennesker er stilt op uden for teatret og venter på at komme ind. Antag, at du bliver bedt om at finde midten af ​​linjen. Hvordan ville du gøre dette?

Der er et par forskellige måder at gå omkring på at løse dette problem. I sidste ende bliver du nødt til at finde ud af, hvor mange mennesker der var i linjen og derefter tage halvdelen af ​​dette antal. Hvis det samlede antal er lige, ville midten af ​​linjen være mellem to personer. Hvis det samlede antal er ulige, ville centret være en enkelt person.

Du kan spørge: "Hvad har det at finde midten af ​​en linje at gøre med Statistikker? "Denne idé om at finde centret er nøjagtigt det, der bruges, når man beregner medianen for et datasæt.

Hvad er medianen?

Medianen er en af ​​de tre primære måder at finde gennemsnittet på statistiske data. Det er sværere at beregne end tilstanden, men ikke så arbejdskrævende som at beregne middelværdien. Det er centrum på meget samme måde som at finde midten af ​​en række mennesker. Efter at have opstillet dataværdierne i stigende rækkefølge, er median dataværdien med det samme antal dataværdier over det og under det.

instagram viewer

Tilfælde et: et ulige antal værdier

Elleve batterier testes for at se, hvor længe de holder. Deres levetid, i timer, er givet af 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Hvad er median levetid? Da der er et ulige antal dataværdier, svarer det til en linje med et ulige antal mennesker. Centret vil være den midterste værdi.

Der er elleve dataværdier, så den sjette er i midten. Derfor er medianbatteriets levetid den sjette værdi på denne liste, eller 105 timer. Bemærk, at medianen er en af ​​dataværdierne.

Sag to: et jævnt antal værdier

Tyve katte vejes. Deres vægt, i pund, er angivet med 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Hvad er den gennemsnitlige kattevægt? Da der er et jævnt antal dataværdier, svarer dette til linjen med et lige antal mennesker. Centret er mellem de to midtværdier.

I dette tilfælde ligger centret mellem den tiende og den ellevte dataværdi. For at finde medianen beregner vi middelværdien af ​​disse to værdier og opnår (7 + 8) / 2 = 7,5. Her er medianen ikke en af ​​dataværdierne.

Eventuelle andre sager?

De eneste to muligheder er at have et jævnt eller ulige antal dataværdier. Så de to ovenstående eksempler er de eneste mulige måder at beregne medianen på. Enten vil medianen være den midterste værdi, eller medianen vil være den middelværdi af de to midtværdier. Typisk er datasæt meget større end dem, vi kiggede på ovenfor, men processen med at finde medianen er den samme som disse to eksempler.

Effekten af ​​Outliers

Middelværdien og tilstanden er yderst følsom over for outliers. Hvad dette betyder er, at tilstedeværelsen af ​​en udligger dramatisk vil påvirke begge disse mål for centret. En fordel ved medianen er, at den ikke påvirkes så meget af en outlier.

For at se dette skal du overveje datasættet 3, 4, 5, 5, 6. Middelværdien er (3 + 4 + 5 + 5 + 6) / 5 = 4,6, og medianen er 5. Hold nu det samme datasæt, men tilføj værdien 100: 3, 4, 5, 5, 6, 100. 100 er en outlier, da den er meget større end alle de andre værdier. Gennemsnittet af det nye sæt er nu (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Dog median for det nye sæt er 5. Selvom

Anvendelse af medianen

På grund af det, vi har set ovenfor, er medianen det foretrukne mål for gennemsnittet, når dataene indeholder outliers. Når indkomst indberettes, er en typisk tilgang at rapportere medianindkomsten. Dette gøres, fordi middelindkomsten er skæv af et lille antal mennesker med meget høje indkomster (tænk Bill Gates og Oprah).

instagram story viewer