Hvad er første og tredje kvartil?

Det første og det tredje kvartil er beskrivende statistikker, der er målinger af positionen i et datasæt. I lighed med hvordan medianen angiver midtvejspunktet for et datasæt, markerer den første kvartil kvartalet eller 25% point. Cirka 25% af dataværdierne er mindre end eller lig med den første kvartil. Den tredje kvartil er ens, men for de øvre 25% af dataværdierne. Vi vil undersøge disse ideer mere detaljeret i det følgende.

Medianen

Der er flere måder at måle centrum af et sæt data. Middelværdien, medianen, tilstand og mellemtone har alle deres fordele og begrænsninger ved at udtrykke midten af ​​dataene. Af alle disse måder at finde gennemsnittet på median er den mest modstandsdygtige over for outliers. Det markerer midten af ​​dataene i den forstand, at halvdelen af ​​dataene er mindre end medianen.

Den første kvartil

Der er ingen grund til, at vi er nødt til at stoppe med at finde bare midten. Hvad hvis vi besluttede at fortsætte denne proces? Vi kunne beregne medianen for den nederste halvdel af vores data. Halvdelen af ​​50% er 25%. Halvdelen af ​​halvdelen eller en fjerdedel af dataene ville således ligge under dette. Da vi har at gøre med en fjerdedel af det originale sæt, kaldes denne median for den nederste halvdel af dataene den første kvartil og betegnes med

instagram viewer
Q1.

Den tredje kvartil

Der er ingen grund til, at vi kiggede på den nederste halvdel af dataene. I stedet kunne vi have set på den øverste halvdel og udført de samme trin som ovenfor. Medianen for denne halvdel, som vi vil betegne ved Q3 opdeler også datasættet i kvartaler. Dette nummer angiver imidlertid den øverste fjerdedel af dataene. Derfor er tre fjerdedele af dataene under vores antal Q3. Dette er grunden til, at vi kalder Q3 den tredje kvartil.

Et eksempel

Lad os se på et eksempel for at gøre dette klart. Det kan være nyttigt at først gennemgå, hvordan man beregner medianen for nogle data. Start med følgende datasæt:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Der er i alt tyve datapunkter i sættet. Vi begynder med at finde medianen. Da der er et jævnt antal dataværdier, er median gennemsnittet af den tiende og den ellevte værdi. Med andre ord er medianen:

(7 + 8)/2 = 7.5.

Se nu på den nederste halvdel af dataene. Medianen for denne halvdel findes mellem den femte og den sjette værdi af:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Det viser sig, at den første kvartil er ligelig Q1 = (4 + 6)/2 = 5

For at finde den tredje kvartil skal du se på den øverste halvdel af det originale datasæt. Vi er nødt til at finde medianen af:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Her er medianen (15 + 15) / 2 = 15. Således den tredje kvartil Q3 = 15.

Interkvartil rækkevidde og femnumersammendrag

Kvartiler er med til at give os et mere fuldstændigt billede af vores datasæt som helhed. Den første og tredje kvartil giver os information om den interne struktur af vores data. Den midterste halvdel af dataene falder mellem det første og det tredje kvartil og er centreret omkring medianen. Forskellen mellem første og tredje kvartil, kaldet interkvartil rækkevidde, viser, hvordan dataene er arrangeret om medianen. Et lille interkvartilt interval angiver data, der er samlet om medianen. Et større interkvartilt interval viser, at dataene er mere spredt.

Et mere detaljeret billede af dataene kan opnås ved at kende den højeste værdi, kaldet den maksimale værdi, og den laveste værdi, kaldet minimumsværdien. Minimum, første kvartil, median, tredje kvartil og maksimum er et sæt af fem værdier, der kaldes fem numre resume. En effektiv måde at vise disse fem numre kaldes a boxplot eller box og whisker-graf.