I Statistikker, percentiler bruges til at forstå og fortolke data. Det nth percentilen af et datasæt er den værdi, hvormed n procent af dataene er under dem. I hverdagen bruges percentiler til at forstå værdier som testresultater, sundhedsindikatorer og andre målinger. For eksempel er en 18-årig mand, der er seks og en halv meter høj, i den 99. percentil for sin højde. Dette betyder, at af alle 18-årige mænd har 99 procent en højde, der er lig med eller mindre end seks og en halv meter. En 18-årig mand, der kun er fem og en halv meter høj, er på den anden side i det 16. percentil for sin højde, hvilket betyder, at kun 16 procent af mændene på hans alder er den samme højde eller kortere.
Nøglefakta: procentvis
• Percentiles bruges til at forstå og fortolke data. De angiver de værdier, hvorunder en bestemt procentdel af dataene i et datasæt findes.
• Procentdel kan beregnes ved hjælp af formlen n = (P / 100) x N, hvor P = percentil, N = antal værdier i et datasæt (sorteret fra den mindste til den største) og n = ordinal rang for en given værdi.
• Percentiler bruges ofte til at forstå testresultater og biometriske målinger.
Procentiler skal ikke forveksles med procenter. Sidstnævnte bruges til at udtrykke brøkdele af en helhed, mens percentiler er de værdier, under hvilke der findes en vis procentdel af dataene i et datasæt. Rent praktisk er der en betydelig forskel mellem de to. For eksempel kan en studerende, der tager en vanskelig eksamen, tjene en score på 75 procent. Det betyder, at han korrekt besvarede hvert tredje ud af fire spørgsmål. En studerende, der scorer i 75. percentilen, har imidlertid opnået et andet resultat. Denne procentdel betyder, at den studerende opnåede en højere score end 75 procent af de andre studerende, der tog eksamen. Med andre ord, den procentvise score afspejler, hvor godt den studerende klarede sig til selve eksamenen; percentilscoren afspejler, hvor godt han gjorde det i sammenligning med andre studerende.
hvor N = antal værdier i datasættet, P = percentil og n = ordinal rang for en given værdi (med værdierne i datasættet sorteret fra den mindste til den største). Tag for eksempel en klasse på 20 studerende, der opnåede følgende score på deres seneste test: 75, 77, 78, 78, 80, 81, 81, 82, 83, 84, 84, 84, 85, 87, 87, 88, 88, 88, 89, 90. Disse scoringer kan repræsenteres som et datasæt med 20 værdier: {75, 77, 78, 78, 80, 81, 81, 82, 83, 84, 84, 84, 85, 87, 87, 88, 88, 88, 89, 90}.
Den fjerde værdi i datasættet er scoren 78. Dette betyder, at 78 markerer den 20. procentdel; af de studerende i klassen, tjente 20 procent en score på 78 eller lavere.
I betragtning af et datasæt, der er bestilt i stigende omfang, blev median, første kvartil og tredje kvartil kan bruges opdele dataene i fire stykker. Den første kvartil er det punkt, hvor en fjerdedel af dataene ligger under det. Medianen er placeret nøjagtigt midt i datasættet med halvdelen af alle dataene under. Den tredje kvartil er stedet, hvor tre fjerdedele af dataene ligger under det.
Median, første kvartil og tredje kvartil kan alle angives i procentdel. Da halvdelen af dataene er mindre end medianen, og halvdelen er lig med 50 procent, markerer medianen den 50. percentil. En fjerdedel er lig med 25 procent, så den første kvartil markerer den 25. percentil. Den tredje kvartil markerer den 75. percentil.
Foruden kvartiler er en forholdsvis almindelig måde at arrangere et datasæt af deciler. Hver decil inkluderer 10 procent af datasættet. Dette betyder, at den første decil er den 10. percentil, den anden decil er den 20. percentil osv. Deciler giver en måde at opdele et datasæt i flere stykker end kvartiler uden at opdele sættet i 100 stykker som med percentiler.
Procentvis score har forskellige anvendelser. Når som helst et datasæt skal opdeles i fordøjelige bunker, er percentiler nyttige. De bruges ofte til at tolke testresultater - såsom SAT-scoringer - så testtagere kan sammenligne deres præstationer med andre studerendes. For eksempel kan en studerende tjene en score på 90 procent på en eksamen. Det lyder ret imponerende; det bliver dog mindre, når en score på 90 procent svarer til den 20. procentdel, hvilket betyder, at kun 20 procent af klassen opnåede en score på 90 procent eller lavere.
Et andet eksempel på percentiler er i børns vækstdiagrammer. Ud over at give en fysisk måling af højden eller vægten angiver børnelæger typisk denne information i form af et percentilscore. En percentil bruges til at sammenligne et barns højde eller vægt med andre børn i samme alder. Dette muliggør et effektivt middel til sammenligning, så forældrene kan vide, om deres barns vækst er typisk eller usædvanlig.