Her er, hvordan man laver en boksplot

Boxplots får deres navn fra det, de ligner. De benævnes undertiden kasse- og whisker-plot. Disse typer grafer bruges til at vise intervallet, median, og kvartiler. Når de er færdige, indeholder en boks første og tredje kvartil. Whiskers strækker sig fra boksen til minimums- og maksimumværdierne for dataene.

De følgende sider viser, hvordan man laver en boksdiagram til et datasæt med mindst 20, første kvartil 25, median 32, tredje kvartil 35 og maksimalt 43.

Tegn fem lodrette linjer over talelinjen, en for hver af værdierne for minimum, første kvartil, median, tredje kvartil og maksimum. Linierne for minimum og maksimum er typisk kortere end linierne for kvartiler og median.

For vores data er minimum 20, den første kvartil er 25, medianen er 32, den tredje kvartil er 35 og den maksimale er 43. Linjerne svarende til disse værdier er tegnet ovenfor.

Dernæst tegner vi en kasse og bruger nogle af linjerne til at guide os. Den første kvartil er den venstre side af vores kasse. Den tredje kvartil er højre side af vores kasse. Medianen falder overalt inden i boksen.

instagram viewer

Ved definitionen af ​​det første og det tredje kvartil er halvdelen af ​​alle dataværdier indeholdt i boksen.

Nu ser vi, hvordan en boks og whisker-graf får den anden del af navnet. Whiskers tegnes for at demonstrere dataintervidden. Tegn en vandret linje fra linjen for minimum til venstre side af boksen ved det første kvartil. Dette er en af ​​vores whiskers. Tegn en anden vandret linje fra højre side af boksen ved tredje kvartil til linjen, der repræsenterer det maksimale af dataene. Dette er vores anden whisker.

Vores boks og whisker-graf, eller boxplot, er nu komplet. På et øjeblik kan vi bestemme rækkevidden for dataværdierne, og graden af, hvordan alt sammen er samlet. Det næste trin viser, hvordan vi kan sammenligne og kontrastere to boksplot.

Graf- og boksegrafer viser sammendraget af fem numre for et datasæt. To forskellige datasæt kan således sammenlignes ved at undersøge deres boxplots sammen. Over en anden kasseplot er tegnet over den, vi har konstrueret.

Der er et par funktioner, som fortjener omtale. Den første er, at medianerne i begge datasæt er identiske. Den lodrette linje inden i begge kasser er på samme sted på talelinjen. Den anden ting at bemærke om de to boks- og whisker-grafer er, at det øverste plot ikke er så spredt i bunden. Den øverste boks er mindre, og vispene strækker sig ikke så langt.

At tegne to boksplotter over den samme talelinje antager, at dataene bag hver fortjener at blive sammenlignet. Det ville ikke give mening at sammenligne en kasse med højder fra 3. klassinger med vægte af hunde i et lokalt husly. Selvom begge indeholder data i forholdet målingsniveau, er der ingen grund til at sammenligne dataene.

På den anden side ville det være fornuftigt at sammenligne kasseplaner med 3. klassingers højder, hvis man plot repræsenterede dataene fra drengene i en skole, og det andet plot repræsenterede dataene fra pigerne i skolen.