Analyse af variation, eller ANOVA kort sagt, er en statistisk test, der ser efter signifikante forskelle mellem midler på en bestemt foranstaltning. For eksempel kan du sige, at du er interesseret i at studere uddannelsesniveauet for atleter i et samfund, så du undersøger folk på forskellige hold. Du begynder dog at undre dig over, om uddannelsesniveauet er forskelligt mellem de forskellige hold. Du kan bruge en ANOVA til at bestemme, om det gennemsnitlige uddannelsesniveau er forskelligt blandt softballholdet mod rugbyholdet kontra Ultimate Frisbee teamet.
Key takeaways: analyse af variation (ANOVA)
- Forskere udfører en ANOVA, når de er interesseret i at afgøre, om to grupper adskiller sig markant på en bestemt måling eller test.
- Der er fire grundlæggende typer ANOVA-modeller: envejs mellem grupper, gentagne målinger, tovejs mellem grupper og gentagne målinger.
- Statistiske softwareprogrammer kan bruges til at gøre udførelsen af en ANOVA lettere og mere effektiv.
ANOVA-modeller
Der er fire typer basale ANOVA-modeller (selvom det også er muligt at udføre mere komplekse ANOVA-tests). Følgende er beskrivelser og eksempler på hver.
Envej mellem grupper ANOVA
En envejs mellem grupper ANOVA bruges, når du vil teste forskellen mellem to eller flere grupper. Eksemplet ovenfor, på uddannelsesniveau blandt forskellige sportshold, ville være et eksempel på denne type modeller. Det kaldes en envejs ANOVA, fordi der kun er en variabel (type sport, der spilles), der bruges til at opdele deltagere i forskellige grupper.
Gentagen envejs måler ANOVA
Hvis du er interesseret i at vurdere en enkelt gruppe på mere end et tidspunkt, skal du bruge en envejs gentagen måling ANOVA. For eksempel, hvis du ville teste elevernes forståelse af et emne, kunne du administrere den samme test i begyndelsen af kurset, midt på kurset og i slutningen af kurset. Ved at gennemføre en envejs gentagen måling ANOVA ville du kunne finde ud af, om elevernes testresultater ændrede sig markant fra begyndelsen til slutningen af kurset.
To-vejs mellem grupper ANOVA
Forestil dig nu, at du har to forskellige måder, du vil gruppere dine deltagere på (eller, statistisk set, har du to forskellige uafhængige variabler). Forestil dig for eksempel, at du var interesseret i at teste, om testresultater var forskellige mellem studerende atleter og ikke-atleter, såvel som for nybegynderne mod seniorer. I dette tilfælde ville du foretage en tovej mellem ANOVA-grupper. Du vil have tre effekter fra denne ANOVA - to hovedeffekter og en interaktionseffekt. Hovedeffekterne er effekten af at være atlet og effekten af klasseåret. Interaktionseffekten ser på virkningen af begge at være en atlet og klasseår. Hver af hovedeffekterne er en envejs test. Interaktionseffekten spørger simpelthen, om de to hovedeffekter påvirker hinanden: for eksempel hvis studerende atleter scorede anderledes end ikke-atleter gjorde, men dette var kun tilfældet, når man studerede nybegynder, ville der være et samspil mellem klasseår og at være en atlet.
Gentagen tovejs måling ANOVA
Hvis du vil se på, hvordan forskellige grupper ændrer sig over tid, kan du bruge en tovejs gentagen måling ANOVA. Forestil dig, at du er interesseret i at se på, hvordan testresultater ændrer sig over tid (som i eksemplet ovenfor for en envejs gentagen måling af ANOVA). Denne gang er du imidlertid også interesseret i at vurdere køn. For eksempel forbedrer mænd og kvinder deres testresultater i samme takt, eller er der en kønsforskel? En gentaget to-vejs mål ANOVA kan bruges til at besvare disse typer spørgsmål.
Antagelser om ANOVA
Følgende antagelser findes, når du udfører en variansanalyse:
- Det forventede værdier af fejlene er nul.
- Varianterne af alle fejl er lig med hinanden.
- Fejlene er uafhængige af hinanden.
- Fejlene er normalt distribueret.
Sådan gøres en ANOVA
- Gennemsnittet beregnes for hver af dine grupper. Ved hjælp af eksemplet med uddannelses- og sportshold fra introduktionen i første afsnit ovenfor beregnes det gennemsnitlige uddannelsesniveau for hvert sportshold.
- Det samlede gennemsnit beregnes derefter for alle de samlede grupper.
- Inden for hver gruppe beregnes den samlede afvigelse af den enkeltes score fra gruppemedelen. Dette fortæller os, om individerne i gruppen har en tendens til at have lignende score, eller om der er stor variation mellem forskellige mennesker i den samme gruppe. Statistikere kalder dette inden for gruppevariation.
- Derefter beregnes hvor meget hver gruppe middel afviger fra det samlede gennemsnit. Dette kaldes mellem gruppevariation.
- Endelig beregnes en F-statistik, som er forholdet mellem mellem gruppevariation til inden for gruppevariation.
Hvis der er markant større mellem gruppevariation end inden for gruppevariation (med andre ord, når F-statistikken er større), er det sandsynligt, at forskellen mellem grupperne er statistisk signifikant. Statistisk software kan bruges til at beregne F-statistikken og bestemme, om den er signifikant eller ej.
Alle typer ANOVA følger de grundlæggende principper, der er beskrevet ovenfor. Efterhånden som antallet af grupper og interaktionseffekterne stiger, vil variationskilderne imidlertid blive mere komplekse.
Udfører en ANOVA
Da udførelse af en ANOVA i hånden er en tidskrævende proces, bruger de fleste forskere statistiske softwareprogrammer, når de er interesseret i at udføre en ANOVA. SPSS kan også bruges til at udføre ANOVA'er R, et gratis softwareprogram. I Excel kan du gøre en ANOVA ved hjælp af tilføjelsen Data Analyse. SAS, STATA, Minitab og andet statistiske softwareprogrammer der er udstyret til at håndtere større og mere komplekse datasæt, kan også bruges til at udføre en ANOVA.
Referencer
Monash University. Analyse af variation (ANOVA). http://www.csse.monash.edu.au/~smarkham/resources/anova.htm