Hvad er en spredningsdiagram i statistik?

Et af målene med statistik er organisering og visning af data. Mange gange en måde at gøre dette på er at bruge en kurve, diagram eller tabel. Når du arbejder med parrede data, en nyttig type graf er en scatterplot. Denne type graf giver os mulighed for let og effektivt at udforske vores data ved at undersøge en spredning af punkter i planet.

Parrede data

Det er værd at fremhæve, at en scatterplot er en type graf, der bruges til parrede data. Dette er en type datasæt, hvor hvert af vores datapunkter har to numre tilknyttet. Almindelige eksempler på sådanne sammenkoblinger inkluderer:

  • En måling før og efter en behandling. Dette kan tage form af en studerendes præstation på et forprøve og derefter senere en posttest.
  • Et matchende par eksperimentelt design. Her er et individ i kontrolgruppen, og et andet lignende individ er i behandlingsgruppen.
  • To målinger fra samme person. F.eks. Registrerer vi måske 100 menneskers vægt og højde.

2D-grafer

Det tomme lærred, som vi vil starte med til vores scatterplot, er det kartesiske koordinatsystem. Dette kaldes også det rektangulære koordinatsystem på grund af det faktum, at hvert punkt kan placeres ved at tegne et bestemt rektangel. Et rektangulært koordinatsystem kan opsættes af:

instagram viewer

  1. Start med en vandret talelinje. Dette kaldes x-akse.
  2. Tilføj en lodret talelinje. Skær krydset x-akse på en sådan måde, at nulpunktet fra begge linjer skærer hinanden. Denne anden talelinje kaldes y-akse.
  3. Det punkt, hvor nulene på vores talelinje krydser kaldes oprindelsen.

Nu kan vi plotte vores datapunkter. Det første nummer i vores par er x-koordinere. Det er den vandrette afstand fra y-aksen og dermed også oprindelsen. Vi bevæger os til højre for positive værdier af x og til venstre for oprindelsen for negative værdier af x.

Det andet nummer i vores par er y-koordinere. Det er den lodrette afstand fra x-aksen. Fra det oprindelige punkt på x-ax, bevæg dig op for positive værdier af y og ned for negative værdier på y.

Placeringen på vores graf markeres derefter med en prik. Vi gentager denne proces igen og igen for hvert punkt i vores datasæt. Resultatet er en spredning af punkter, der giver scatterplot navnet.

Forklarende og respons

En vigtig instruktion, der er tilbage, er at være forsigtig med hvilken variabel der er på hvilken akse. Hvis vores parrede data består af en forklarende og svar parring, vises den forklarende variabel på x-aksen. Hvis begge variabler anses for at være forklarende, kan vi vælge, hvilken der skal afbildes på x-aksen, og hvilken på y-akse.

Funktioner i en Scatterplot

Der er flere vigtige funktioner i en scatterplot. Ved at identificere disse træk kan vi afsløre mere information om vores datasæt. Disse funktioner inkluderer:

  • Den overordnede tendens blandt vores variabler. Når vi læser fra venstre til højre, hvad er det store billede? Et opadgående mønster, nedad eller cyklisk?
  • Eventuelle outliers fra den samlede tendens. Er disse outliers fra resten af ​​vores data, eller er det indflydelsesrige punkter?
  • Formen på enhver trend. Er dette lineært, eksponentielt, logaritmisk eller noget andet?
  • Styrken af ​​enhver trend. Hvor tæt passer dataene på det samlede mønster, vi identificerede?

Relaterede emner

Scatterplots, der udviser en lineær tendens, kan analyseres med de statistiske teknikker aflineær regression og korrelation. Regression kan udføres for andre typer tendenser, der er ikke-lineære.

instagram story viewer