Parrede data i statistikker, ofte benævnt ordnede par, henviser til to variabler hos individerne i en population, der er knyttet sammen for at bestemme sammenhængen mellem dem. For at et datasæt kan betragtes som parrede data, skal begge disse dataværdier være knyttet eller knyttet til hinanden og ikke betragtes separat.
Ideen om parrede data kontrasteres med den sædvanlige tilknytning af et tal til hvert datapunkt som i et andet kvantitative data sætter i, at hvert individuelt datapunkt er knyttet til to tal, hvilket giver en graf, der giver statistikere mulighed for at observere forholdet mellem disse variabler i en population.
Denne metode til sammenkoblede data bruges, når en undersøgelse håber at sammenligne to variabler hos individer i befolkningen for at drage en slags konklusion om den observerede korrelation. Når man observerer disse datapunkter, er rækkefølgen af sammenkoblingen vigtig, fordi det første tal er et mål på en ting, mens det andet er et mål på noget helt andet.
Eksempel på parrede data
For at se et eksempel på sammenkoblede data skal du antage, at en lærer tæller antallet af lektieopgaver hver studerende slået til for en bestemt enhed og parer derefter dette nummer med hver enkelt elevs procentdel på enhedstesten. Parene er som følger:
- En person, der gennemførte 10 opgaver, tjente 95% på sin prøve. (10, 95%)
- En person, der gennemførte 5 opgaver, tjente 80% på sin prøve. (5, 80%)
- En person, der gennemførte 9 opgaver, tjente 85% på sin prøve. (9, 85%)
- En person, der gennemførte 2 opgaver, tjente 50% på sin prøve. (2, 50%)
- En person, der gennemførte 5 opgaver, tjente 60% på sin prøve. (5, 60%)
- En person, der gennemførte 3 opgaver, tjente 70% på sin prøve. (3, 70%)
I hvert af disse sæt parrede data kan vi se, at antallet af opgaver altid kommer først i bestilte par, mens den procentdel, der er tjent på testen, kommer i anden række, som det ses i første omgang af (10, 95%).
Mens en statistisk analyse af disse data også kunne bruges til at beregne det gennemsnitlige antal på hjemmearbejdeopgaver, eller den gennemsnitlige testresultat, kan der være andre spørgsmål at stille spørgsmål til dataene. I dette tilfælde ønsker læreren at vide, om der er nogen forbindelse mellem antallet af lektieopgaver slået til og gennemførte testen, og læreren skulle have dataene sammenkoblet for at besvare dette spørgsmål.
Analyse af parrede data
Det statistiske teknikker af korrelation og regression bruges til at analysere parrede data, hvori korrelationskoefficient kvantificerer hvor tæt dataene ligger langs en lige linje og måler styrken af det lineære forhold.
På den anden side bruges regression til flere applikationer, herunder bestemmelse af, hvilken linje der passer bedst til vores datasæt. Denne linje kan derefter igen bruges til at estimere eller forudsige y værdier for værdier af x der ikke var en del af vores originale datasæt.
Der er en speciel type graf, der er specielt velegnet til parrede data kaldet en scatterplot. Heri type graf, en koordinatakse repræsenterer en mængde af de parrede data, mens den anden koordinatakse repræsenterer den anden mængde af de parrede data.
En scatterplot for de ovennævnte data ville have x-aksen til at angive antallet af tildelte aktiverede, mens y-aksen ville angive scoringerne på enhedstesten.