Hypotesetest til sammenligning af to portioner

I denne artikel vil vi gennemgå de trin, der er nødvendige for at udføre en hypotese testeller test af betydning for forskellen mellem to befolkningsforhold. Dette giver os mulighed for at sammenligne to ukendte proportioner og udlede, om de ikke er ens med hinanden, eller hvis den ene er større end den anden.

Oversigt og baggrund for hypotesetest

Før vi går nærmere ind på detaljerne i vores hypotesetest, vil vi se på rammen for hypotetests. I en test af betydning forsøger vi at vise, at en erklæring om værdien af ​​en befolkning parameter (eller sommetider selve befolkningens natur) er sandsynligvis sandt.

Vi samler bevis for denne erklæring ved at udføre en statistisk stikprøve. Vi beregner en statistik fra denne prøve. Værdien af ​​denne statistik er det, vi bruger til at bestemme sandheden i den oprindelige udsagn. Denne proces indeholder usikkerhed, men vi er i stand til at kvantificere denne usikkerhed

Den overordnede proces til en hypotesetest er angivet på nedenstående liste:

  1. Sørg for, at de betingelser, der er nødvendige for vores test, er opfyldt.
  2. instagram viewer
  3. Angiv klart null og alternative hypoteser. Den alternative hypotese kan omfatte en ensidig eller en tosidet test. Vi bør også bestemme betydningsniveauet, som vil blive betegnet med det græske bogstav alfa.
  4. Beregn teststatistikken. Den type statistik, vi bruger, afhænger af den bestemte test, vi udfører. Beregningen er afhængig af vores statistiske stik.
  5. Beregn p-værdi. Teststatistikken kan oversættes til en p-værdi. En p-værdi er sandsynligheden for, at tilfældet alene producerer værdien af ​​vores teststatistik under antagelsen af, at nulhypotesen er sand. Den overordnede regel er, at jo mindre p-værdien er, jo større er beviset for nulhypotesen.
  6. Træk en konklusion. Endelig bruger vi værdien af ​​alfa, der allerede var valgt som en tærskelværdi. Afgørelsesreglen er, at hvis p-værdien er mindre end eller lig med alfa, afviser vi nulhypotesen. Ellers vi undlader at afvise nulhypotesen.

Nu, hvor vi har set rammen for en hypotestest, vil vi se specifikationerne for en hypotestest for forskellen mellem to befolkningsforhold.

Betingelserne

En hypotesetest for forskellen mellem to befolkningsforhold kræver, at følgende betingelser er opfyldt:

  • Vi har to enkle tilfældige prøver fra store populationer. Her betyder "stor", at populationen er mindst 20 gange større end størrelsen på prøven. Prøvestørrelser angives med n1 og n2.
  • Individene i vores prøver er valgt uafhængigt af hinanden. Befolkningen selv skal også være uafhængige.
  • Der er mindst 10 succeser og 10 fejl i begge vores prøver.

Så længe disse betingelser er opfyldt, kan vi fortsætte med vores hypotesetest.

Nul og alternative hypoteser

Nu skal vi overveje hypoteserne til vores test af betydning. Nullhypotesen er vores udsagn om ingen virkning. I denne særlige type hypotetestest er vores nulhypotese, at der ikke er nogen forskel mellem de to befolkningsforhold. Vi kan skrive dette som H0: p1 = p2.

Den alternative hypotese er en af ​​tre muligheder, afhængigt af specificiteten af, hvad vi tester for:

  • H-en: p1 er større end p2. Dette er en en-halet eller ensidig test.
  • H-en: p1 er mindre end p2. Dette er også ensidig test.
  • H-en: p1 er ikke lig med p2. Dette er en to-halet eller tosidet test.

For altid at være forsigtige, bør vi bruge den tosidede alternative hypotese, hvis vi ikke har en retning i tankerne, før vi får vores prøve. Årsagen til at gøre dette er, at det er sværere at afvise nulhypotesen med en tosidet test.

De tre hypoteser kan omskrives ved at angive, hvordan p1 - p2 er relateret til værdien nul. For at være mere specifik, ville nulhypotesen blive H0:p1 - p2 = 0. De potentielle alternative hypoteser vil blive skrevet som:

  • H-en: p1 - p2 > 0 svarer til udsagnet "p1 er større end p2."
  • H-en: p1 - p2 <0 svarer til udsagnet "p1 er mindre end p2."
  • H-en: p1 - p2 ≠ 0 svarer til udsagnet "p1 er ikke lig med p2."

Denne ækvivalente formulering viser os faktisk lidt mere af, hvad der sker bag kulisserne. Hvad vi laver i denne hypotesetest er at dreje de to parametre p1 og p2 ind i den enkelte parameter p1 - p2. Vi tester derefter denne nye parameter mod værdien nul.

Teststatistikken

Formlen for teststatistikken er angivet på billedet ovenfor. En forklaring af hvert af betingelserne følger:

  • Prøven fra den første population har størrelse n1. Antallet af succeser fra denne prøve (som ikke direkte ses i formlen ovenfor) er k1.
  • Prøven fra den anden population har størrelse n2. Antallet af succeser fra denne prøve er k2.
  • Prøveforholdene er p1-hat = k1 / n1 og p2-had = k2 / n2 .
  • Vi kombinerer eller samler derefter succeser fra begge disse prøver og opnår: p-hat = (k1 + k2) / (n1 + n2).

Som altid skal du være forsigtig med rækkefølgen af ​​operationer, når du beregner. Alt under radikalet skal beregnes, før der tages firkantet.

P-værdien

Det næste trin er at beregne den p-værdi, der svarer til vores teststatistik. Vi bruger en normal normal distribution til vores statistik og konsulterer en værdistabel eller bruger statistisk software.

Detaljerne i vores p-værdiberegning afhænger af den alternative hypotese, vi bruger:

  • For H-en: p1 - p2 > 0, vi beregner andelen af ​​den normale fordeling, der er større end Z.
  • For H-en: p1 - p2 <0, vi beregner andelen af ​​den normale fordeling, der er mindre end Z.
  • For H-en: p1 - p2 ≠ 0, vi beregner andelen af ​​den normale fordeling, der er større end |Z|, den absolutte værdi af Z. For at redegøre for det faktum, at vi har en test med to haler, fordobler vi derefter andelen.

Afgørelsesregel

Nu træffer vi en beslutning om, hvorvidt nulhypotesen skal afvises (og derved accepteres alternativet), eller om vi ikke undlader at afvise nulhypotesen. Vi træffer denne beslutning ved at sammenligne vores p-værdi med niveauet for betydning alfa.

  • Hvis p-værdien er mindre end eller lig med alfa, afviser vi nullhypotesen. Dette betyder, at vi har et statistisk signifikant resultat, og at vi vil acceptere den alternative hypotese.
  • Hvis p-værdien er større end alfa, undlader vi at afvise nullhypotesen. Dette beviser ikke, at nulhypotesen er sand. I stedet betyder det, at vi ikke opnå overbevisende nok bevis til at afvise nullhypotesen.

Særlig note

Det konfidensinterval for forskellen mellem to befolkningsforhold samler ikke succeserne, hvorimod hypotesetesten gør det. Årsagen til dette er, at vores nulhypotese antager det p1 - p2 = 0. Konfidensintervallet antager ikke dette. Nogle statistikere samler ikke succeserne for denne hypotetestest, og bruger i stedet en let modificeret version af ovenstående teststatistik.

instagram story viewer