Hvad er den normale tilnærmelse til binomial distribution?

click fraud protection

Tilfældige variabler med en binomial fordeling er kendt for at være adskilte. Dette betyder, at der er et tællbart antal resultater, der kan forekomme i en binomial fordeling, med adskillelse mellem disse resultater. For eksempel kan en binomisk variabel have en værdi på tre eller fire, men ikke et tal mellem tre og fire.

Med den binære fordelings diskrete karakter er det noget overraskende, at en kontinuerlig tilfældig variabel kan bruges til at tilnærme en binomial fordeling. For mange binomiale fordelinger, kan vi bruge en normal fordeling til at tilnærme vores binomiale sandsynligheder.

Dette kan ses, når man ser på n møntkast og udlejning x være antallet af hoveder. I denne situation har vi en binomial fordeling med sandsynlighed for succes som p = 0,5. Når vi øger antallet af kast, ser vi, at sandsynligheden histogram bærer større og større lighed med en normal fordeling.

Erklæring om den normale tilnærmelse

Hver normal fordeling er fuldstændigt defineret af to reelle tal. Disse tal er gennemsnittet, der måler midten af ​​fordelingen og

instagram viewer
standardafvigelse, som måler spredningen af ​​distributionen. I en given binomial situation skal vi være i stand til at bestemme, hvilken normal distribution der skal bruges.

Valget af den korrekte normale fordeling bestemmes af antallet af forsøg n i binomial indstilling og konstant sandsynlighed for succes p for hver af disse forsøg. Den normale tilnærmelse til vores binomiale variabel er et gennemsnit af np og en standardafvigelse på (np(1 - p)0.5.

Antag f.eks. At vi gættede på hvert af de 100 spørgsmål i en multiple-choice-test, hvor hvert spørgsmål havde et korrekt svar ud af fire valg. Antallet af rigtige svar x er en binomial tilfældig variabel med n = 100 og p = 0.25. Således har denne tilfældige variabel gennemsnit på 100 (0,25) = 25 og en standardafvigelse på (100 (0,25) (0,75))0.5 = 4.33. En normal fordeling med gennemsnit 25 og standardafvigelse på 4,33 vil arbejde for at tilnærme denne binomiale fordeling.

Hvornår er tilnærmelsen passende?

Ved at bruge noget matematik kan det vises, at der er nogle få betingelser, som vi er nødt til at bruge en normal tilnærmelse til binomial distribution. Antallet af observationer n skal være stor nok, og værdien af p så begge dele np og n(1 - p) er større end eller lig med 10. Dette er en tommelfingerregel, der styres af statistisk praksis. Den normale tilnærmelse kan altid bruges, men hvis disse betingelser ikke er opfyldt, er tilnærmelsen muligvis ikke så god ved en tilnærmelse.

For eksempel, hvis n = 100 og p = 0,25, så er vi berettigede til at bruge den normale tilnærmelse. Dette er fordi np = 25 og n(1 - p) = 75. Da begge disse tal er større end 10, vil den passende normale fordeling gøre et forholdsvis godt stykke arbejde med at estimere binomiale sandsynligheder.

Hvorfor bruge tilnærmelsen?

Binomiale sandsynligheder beregnes ved at bruge en meget ligetil formel til at finde den binomiale koefficient. Desværre på grund af fakulteterne i formlen kan det være meget nemt at finde problemer med computeren binomial formel. Den normale tilnærmelse tillader os at omgå nogen af ​​disse problemer ved at arbejde med en velkendt ven, en tabel med værdier for en standard normalfordeling.

Mange gange er bestemmelsen af ​​en sandsynlighed for, at en binomial tilfældig variabel falder inden for et interval af værdier, kedelig at beregne. Dette skyldes, at for at finde sandsynligheden for, at en binomial variabel x er større end 3 og mindre end 10, er vi nødt til at finde sandsynligheden for, at x er lig med 4, 5, 6, 7, 8 og 9, og tilføj derefter alle disse sandsynligheder sammen. Hvis den normale tilnærmelse kan bruges, bliver vi i stedet nødt til at bestemme z-scorerne svarende til 3 og 10 og derefter bruge en z-score-tabel med sandsynligheder for standard normal distribution.

instagram story viewer