7 grafer, der ofte bruges i statistikker

Et mål for Statistikker er at præsentere data på en meningsfuld måde. Ofte involverer datasæt millioner (hvis ikke milliarder) værdier. Dette er alt for mange til at udskrive i en tidsskriftartikel eller en sidebjælke af en magasinhistorie. Det er her, grafer kan være uvurderlige, så statistikere kan give en visuel fortolkning af komplekse numeriske historier. Syv typer af grafer bruges ofte i statistikker.

Gode ​​grafer overfører information hurtigt og nemt til brugeren. Grafer fremhæver de vigtigste funktioner i dataene. De kan vise forhold, der ikke er indlysende ved at studere en liste over numre. De kan også give en bekvem måde at sammenligne forskellige datasæt.

Forskellige situationer kræver forskellige typer grafer, og det hjælper med at have et godt kendskab til, hvilke typer der er tilgængelige. Datatypen bestemmer ofte, hvilken graf der er passende at bruge. Kvalitative data, kvantitative data, og parrede data hver bruger forskellige typer af grafer.

EN Pareto-diagram eller søjlediagram er en måde at visuelt repræsentere kvalitative data. Data vises enten vandret eller lodret og giver seerne mulighed for at sammenligne emner, såsom mængder, egenskaber, tidspunkter og frekvens. Søjlerne er arrangeret i rækkefølge efter frekvens, så vigtigere kategorier fremhæves. Ved at se på alle søjler er det let at se med et øjeblik, hvilke kategorier i et datasæt dominerer de andre.

instagram viewer
Søjlediagrammer kan være enten enkelt, stablet eller grupperet.

Vilfredo Pareto (1848–1923) udviklede søjlediagrammet, da han forsøgte at give økonomisk beslutningstagning et mere "menneskeligt" ansigt plotte data på grafisk papir med indkomst på en akse og antallet af mennesker på forskellige indkomstniveauer på Andet. Resultaterne var slående: De viste dramatisk forskellen mellem rige og fattige i hver æra gennem århundreder.

En anden almindelig måde at repræsentere data grafisk er en lagkagediagram. Det får sit navn fra den måde, det ser ud, ligesom en cirkulær tærte der er skåret i flere skiver. Denne type graf er nyttigt, når man tegner kvalitative data, hvor informationen beskriver en egenskab eller attribut og ikke er numerisk. Hver skive tærte repræsenterer en anden kategori, og hver egenskab svarer til en anden skive af tærten; nogle skiver er normalt mærkbart større end andre. Ved at se på alle cirkelstykker kan du sammenligne hvor meget af data der passer i hver kategori eller skive.

EN histogram i en anden form for graf, der bruger søjler på displayet. Denne type graf bruges sammen med kvantitative data. Værdiområder, kaldet klasser, er anført nederst, og klasserne med større frekvenser har højere bjælker.

Et histogram ligner ofte en søjlediagram, men de er forskellige på grund af målingsniveau af dataene. Søjlediagrammer måler frekvensen af ​​kategoriske data. En kategorisk variabel er en, der har to eller flere kategorier, såsom køn eller hårfarve. Histogrammer derimod bruges til data, der involverer ordinale variabler, eller ting, der ikke let kan kvantificeres, som følelser eller meninger.

EN stilk og blad plot bryder hver værdi af et kvantitativt datasæt i to stykker: en stilk, typisk for den højeste stedværdi, og et blad for de andre stedværdier. Det giver en måde at liste alle dataværdier i en kompakt form. Hvis du f.eks. Bruger denne graf til at gennemgå testtests for studerende på 84, 65, 78, 75, 89, 90, 88, 83, 72, 91 og 90, ville stilkene være 6, 7, 8 og 9, svarende til tiernes placering af data. Bladene - talene til højre for en solid linje - ville være 0, 0, 1 ved siden af ​​9; 3, 4, 8, 9 ved siden af ​​8; 2, 5, 8 ved siden af ​​7; og 2 ved siden af ​​6.

Dette viser dig, at fire studerende scorede i 90. pladsen percentil, tre studerende i den 80. percentil, to i den 70. og kun en i den 60. Du vil endda være i stand til at se, hvor godt studerende i hver procentdel har fungeret, hvilket gør dette til en god graf for at forstå, hvor godt studerende forstår materialet.

EN dot plot er en hybrid mellem et histogram og en stilk og blad plot. Hver kvantitative dataværdi bliver et punktum eller punkt, der er placeret over de relevante klasseværdier. Hvor histogrammer bruger rektangler - eller bjælker - bruger disse grafer prikker, som derefter sammenføjes med en simpel linje, siger statisticshowto.com. Punktpladser er en god måde at sammenligne hvor lang tid det tager en gruppe på seks eller syv personer at lave morgenmad, for eksempel eller for at vise procentdelen af ​​mennesker i forskellige lande, der har adgang til elektricitet, i henhold til MathIsFun.

EN scatterplot viser data, der er parret ved hjælp af en vandret akse (x-aksen) og en lodret akse (y-aksen). De statistiske værktøjer til korrelation og regression bruges derefter til at vise tendenser på scatterplot. En scatterplot ligner normalt en linje eller en kurve, der bevæger sig op eller ned fra venstre mod højre langs grafen med punkter "spredt" langs linjen. Scatterplot hjælper dig med at afdække mere information om ethvert datasæt, herunder:

EN tidsserie graf viser data på forskellige tidspunkter, så det er en anden slags graf, der skal bruges til bestemte slags parrede data. Som navnet antyder, måler denne type graf tendenser over tid, men tidsrammen kan være minutter, timer, dage, måneder, år, årtier eller århundreder. For eksempel kan du bruge denne type graf til at kortlægge befolkningen i USA i løbet af et århundrede. Y-aksen viser en liste over den voksende befolkning, mens x-aksen viser årene, f.eks. 1900, 1950, 2000.

instagram story viewer