Pålidelighed er den grad, i hvilket et måleinstrument giver de samme resultater, hver gang det bruges, forudsat at den underliggende ting, der måles, ikke ændrer sig.
Key takeaways: pålidelighed
- Hvis et måleinstrument leverer lignende resultater, hver gang det bruges (forudsat at alt, hvad der måles, forbliver det samme over tid), siges det at det har stor pålidelighed.
- Gode måleinstrumenter skal have både høj pålidelighed og høj nøjagtighed.
- Fire metoder, som sociologer kan bruge til at vurdere pålidelighed, er test-gentest-proceduren, den alternative formprocedure, split-halveringsproceduren og den interne konsistensprocedure.
Et eksempel
Forestil dig, at du prøver at vurdere pålideligheden af et termometer i dit hjem. Hvis temperaturen i et rum forbliver den samme, giver et pålideligt termometer altid den samme aflæsning. Et termometer, der mangler pålidelighed, ville ændre sig, selv når temperaturen ikke gør det. Bemærk dog, at termometeret ikke behøver at være nøjagtigt for at være pålideligt. Det registrerer måske altid tre grader for højt. Dets grad af pålidelighed har i stedet at gøre med forudsigeligheden af dets forhold til det, der testes.
Metoder til vurdering af pålidelighed
For at vurdere pålideligheden skal den ting, der måles, måles mere end én gang. Hvis du f.eks. Ville måle længden på en sofa for at sikre, at den passede gennem en dør, måler du den måske to gange. Hvis du får en identisk måling to gange, kan du være sikker på, at du målte pålideligt.
Der er fire procedurer til vurdering af en testes pålidelighed. (Her refererer udtrykket "test" til en gruppe udsagn på et spørgeskema, en observatørs kvantitativ eller kvalitativ evaluering eller en kombination af de to.)
Test-gentest-proceduren
Her gives den samme test to eller flere gange. For eksempel kan du måske oprette et spørgeskema med et sæt på ti udsagn til vurdering af tillid. Disse ti udsagn gives derefter til et emne to gange på to forskellige tidspunkter. Hvis respondenten giver lignende svar begge gange, kan du antage de spørgsmål, der vurderes emnets svar pålideligt.
En fordel ved denne metode er, at der kun skal udvikles en test til denne procedure. Der er dog et par ulemper ved test-testen igen. Der kan forekomme hændelser mellem testtider, der påvirker respondenternes svar; svar kan ændre sig over tid, simpelthen fordi folk ændrer sig og vokser med tiden; og emnet kan tilpasse sig testen anden gang, tænke mere dybt over spørgsmålene og revurdere deres svar. I eksemplet ovenfor kan nogle af respondenterne måske være blevet mere sikre på det første og anden testsession, hvilket ville gøre det vanskeligere at fortolke resultaterne af test-testen procedure.
Procedure for alternative formularer
I proceduren med alternative former (kaldes også parallelle former pålidelighed) gives to prøver. For eksempel kan du oprette to sæt med fem udsagn, der måler tillid. Motiverne bliver bedt om at tage hver af de fem-erklæringsspørgeskemaer. Hvis personen giver lignende svar til begge test, kan du antage, at du måler konceptet pålideligt. En fordel er, at cueing vil være mindre af en faktor, fordi de to test er forskellige. Det er dog vigtigt at sikre, at begge alternative versioner af testen måler den samme ting.
Proceduren med opdelt halvdel
I denne procedure gives der en enkelt test en gang. En karakter tildeles hver halvdel separat, og karakterer sammenlignes fra hver halvdel. For eksempel kan du have et sæt på ti udsagn på et spørgeskema for at vurdere tillid. Respondenterne tager testen, og spørgsmålene opdeles derefter i to delprøver på fem emner hver. Hvis scoringen i den første halvdel spejler scoren i den anden halvdel, kan du antage, at testen målte konceptet pålideligt. På plussiden er historie, modning og kø ikke spillet. Resultaterne kan dog variere meget afhængigt af den måde, hvorpå testen er opdelt i halvdele.
Proceduren for intern konsistens
Her administreres den samme test en gang, og scoren er baseret på gennemsnitlig lighed af svarene. For eksempel i et spørgeskema med ti udsagn til måling af tillid kan hvert svar ses som en sub-test med én erklæring. Ligheden i svarene på hver af de ti udsagn bruges til at vurdere pålideligheden. Hvis respondenten ikke besvarer alle ti udsagn på en lignende måde, kan man antage, at testen ikke er pålidelig. En måde, forskere kan vurdere intern konsistens på, er ved at bruge statistisk software at beregne Cronbachs alfa.
Med den interne konsistensprocedure er historie, modning og kø ikke en overvejelse. Antallet af udsagn i testen kan dog påvirke vurderingen af pålidelighed, når den internt vurderes.