Mange gange når vi studerer en gruppe, sammenligner vi virkelig to populationer. Afhængig af parameter i denne gruppe er vi interesseret i, og de forhold, vi har at gøre med, der er flere tilgængelige teknikker. Statistisk følgeslutning procedurer, der vedrører sammenligning af to populationer, kan normalt ikke anvendes til tre eller flere populationer. For at studere mere end to populationer på én gang har vi brug for forskellige typer statistiske værktøjer. Variansanalyse, eller ANOVA, er en teknik fra statistisk interferens, der giver os mulighed for at håndtere flere populationer.
Sammenligning af midler
For at se, hvilke problemer der opstår, og hvorfor vi har brug for ANOVA, vil vi overveje et eksempel. Antag, at vi prøver at afgøre, om betyde vægte af grønne, røde, blå og orange M&M-slik er forskellige fra hinanden. Vi vil angive middelvægten for hver af disse populationer, μ1, μ2, μ3 μ4 og henholdsvis. Vi bruger muligvis det relevante hypotese test flere gange, og test C (4,2), eller seks forskellige null hypoteser:
- H0: μ1 = μ2 for at kontrollere, om middelvægten af bestanden af de røde slik er forskellig end middelvægten af befolkningen i de blå slik.
- H0: μ2 = μ3 for at kontrollere, om middelvægten af befolkningen i de blå karameller er forskellig end middelvægten af befolkningen i de grønne slik.
- H0: μ3 = μ4 for at kontrollere, om middelvægten af befolkningen i de grønne slik er forskellig end middelvægten af befolkningen i de orange slik.
- H0: μ4 = μ1 for at kontrollere, om middelvægten af befolkningen i de orange slik er forskellig end middelvægten af befolkningen i de røde slik.
- H0: μ1 = μ3 for at kontrollere, om middelvægten af befolkningen i de røde slik er forskellig end middelvægten af befolkningen i de grønne slik.
- H0: μ2 = μ4 for at kontrollere, om middelvægten af befolkningen i de blå slik er forskellig end middelvægten af befolkningen i de orange slik.
Der er mange problemer med denne form for analyse. Vi har seks p-værdier. Selvom vi måske test hver på en 95% niveau af selvtillid, er vores tillid til den overordnede proces mindre end dette, fordi sandsynlighederne multiplicerer: 0,95 x 0,95 x 0,95 x 0,95 x 0,95 x 0,95 er cirka 0,74, eller et 74% niveau af tillid. Således er sandsynligheden for en type I-fejl steget.
På et mere grundlæggende niveau kan vi ikke sammenligne disse fire parametre som helhed ved at sammenligne dem to ad gangen. Midlerne på de røde og blå M & M'er kan være signifikante, idet middelvægten af rød er relativt større end middelvægten af de blå. Når vi overvejer middelvægten for alle fire slags slik, er der muligvis ikke nogen signifikant forskel.
Analyse af variation
For at håndtere situationer, hvor vi er nødt til at foretage flere sammenligninger, bruger vi ANOVA. Denne test giver os mulighed for at overveje parametrene for flere populationer på én gang uden at komme ind på nogle af de problemer, vi konfronterer med udførelse af hypotesetest på to parametre ad gangen.
For at udføre ANOVA med M & M-eksemplet ovenfor, ville vi teste nulhypotesen H0:μ1 = μ2 = μ3= μ4. Dette siger, at der ikke er nogen forskel mellem middelvægten af de røde, blå og grønne M & M'er. Den alternative hypotese er, at der findes nogen forskel mellem middelvægten på de røde, blå, grønne og orange M & M'er. Denne hypotese er virkelig en kombination af flere udsagn H-en:
- Middelvægten af bestanden af røde karameller er ikke lig med den gennemsnitlige vægt af bestanden af blå karameller, ELLER
- Middelvægten af bestanden af blå karameller er ikke lig med gennemsnitsvægten for bestanden af grønne slik, ELLER
- Middelvægten af bestanden af grønne slik er ikke lig med gennemsnitsvægten for bestanden af orange slik, ELLER
- Middelvægten af bestanden af grønne slik er ikke lig med gennemsnitsvægten for bestanden af røde slik, ELLER
- Middelvægten af bestanden af blå slik er ikke lig med gennemsnitsvægten for bestanden af orange slik, ELLER
- Middelvægten af bestanden af blå karameller er ikke lig med middelvægten af bestanden af røde slik.
I dette særlige tilfælde vil vi bruge en til at få vores p-værdi Sandsynlighedsfordeling kendt som F-fordeling. Beregninger, der involverer ANOVA F-testen, kan udføres for hånd, men beregnes typisk med statistisk software.
Flere sammenligninger
Hvad der adskiller ANOVA fra andre statistiske teknikker er, at den bruges til at foretage flere sammenligninger. Dette er almindeligt i statistikkerne, da der er mange gange, hvor vi vil sammenligne mere end blot to grupper. En samlet test tyder typisk på, at der er en slags forskel mellem de parametre, vi studerer. Vi følger derefter denne test med en anden analyse for at bestemme, hvilken parameter der adskiller sig.