Den negative binomiale fordeling er a Sandsynlighedsfordeling der bruges med diskrete tilfældige variabler. Denne type distribution vedrører antallet af forsøg, der skal forekomme for at have et forudbestemt antal succeser. Som vi vil se, er den negative binomiale fordeling relateret til binomial distribution. Derudover generaliserer denne distribution den geometriske fordeling.
Indstillingen
Vi vil starte med at se på både indstillingen og de forhold, der giver anledning til en negativ binomial fordeling. Mange af disse forhold ligner meget en binomial indstilling.
- Vi har et Bernoulli-eksperiment. Dette betyder, at hver prøve, vi udfører, har en veldefineret succes og fiasko, og at dette er de eneste resultater.
- Sandsynligheden for succes er konstant, uanset hvor mange gange vi udfører eksperimentet. Vi angiver denne konstante sandsynlighed med en s.
- Eksperimentet gentages for x uafhængige forsøg, hvilket betyder, at resultatet af et forsøg ikke har nogen indflydelse på resultatet af et efterfølgende forsøg.
Disse tre forhold er identiske med dem i en binomial distribution. Forskellen er, at en binomial tilfældig variabel har et fast antal forsøg n. De eneste værdier for x er 0, 1, 2,..., n, så dette er en endelig fordeling.
En negativ binomial fordeling angår antallet af forsøg x det skal ske indtil vi har det r succeser. Nummeret r er et helt tal, som vi vælger, inden vi begynder at udføre vores forsøg. Den tilfældige variabel x er stadig diskret. Men nu kan den tilfældige variabel antage værdier for X = r, r + 1, r + 2,... Denne tilfældige variabel er antagelig uendelig, da det kan tage vilkårligt lang tid, før vi får det r succeser.
Eksempel
For at hjælpe med at give mening om en negativ binomial distribution er det værd at overveje et eksempel. Antag, at vi vender en fair mønt, og vi stiller spørgsmålet, "Hvad er sandsynligheden for, at vi får tre hoveder i det første x møntflip? "Dette er en situation, der kræver en negativ binomial distribution.
Møntsvingene har to mulige resultater, sandsynligheden for succes er en konstant 1/2, og forsøgene er de uafhængige af hinanden. Vi beder om sandsynligheden for at få de tre første hoveder efter x mønt flips. Således skal vi vende mønten mindst tre gange. Vi fortsætter derefter med at vende, indtil det tredje hoved vises.
For at beregne sandsynligheder, der er relateret til en negativ binomial fordeling, har vi brug for nogle flere oplysninger. Vi er nødt til at kende sandsynlighedsmassefunktionen.
Sandsynlighed Massefunktion
Sandsynlighedsmassefunktionen for en negativ binomial fordeling kan udvikles med en lille smule tanke. Hver prøve har en sandsynlighed for succes givet af s. Da der kun er to mulige resultater, betyder det, at sandsynligheden for fiasko er konstant (1 - p ).
Det rth succes skal ske for xth og sidste prøve. Den forrige x - 1 forsøg skal indeholde nøjagtigt r - 1 succeser. Antallet af måder, dette kan forekomme, angives af antallet af kombinationer:
C (x - 1, r -1) = (x - 1)! / [(R - 1)! (x - r)!].
Derudover har vi uafhængige begivenheder, og derfor kan vi multiplicere vores sandsynligheder sammen. Ved at sammensætte alt dette får vi sandsynlighedsmassefunktionen
f(x) = C (x - 1, r -1) pr(1 - p)x - r.
Distributionens navn
Vi er nu i stand til at forstå, hvorfor denne tilfældige variabel har en negativ binomial fordeling. Antallet af kombinationer, som vi stød på ovenfor, kan skrives forskelligt ved at indstille x - r = k:
(x - 1)! / [(r - 1)! (x - r)!] = (x + k - 1)! / [(R - 1)! k!] = (r + k - 1)(x + k - 2)... (r + 1) (r) /k! = (-1)k(-r) (- r - 1).. . (- r - (k + 1) / k !.
Her ser vi udseendet af en negativ binomial koefficient, der bruges, når vi hæver et binomialt udtryk (a + b) til en negativ magt.
Betyde
Gennemsnittet af en distribution er vigtigt at vide, fordi det er en måde at betegne fordelingen på. Gennemsnittet for denne type tilfældige variabler angives af dens forventede værdi og er lig med r / p. Vi kan bevise dette omhyggeligt ved hjælp af øjeblik genererende funktion for denne distribution.
Intuition guider os også til dette udtryk. Antag, at vi udfører en række forsøg n1 indtil vi opnår r succeser. Og så gør vi det igen, kun denne gang tager det n2 forsøg. Vi fortsætter dette igen og igen, indtil vi har et stort antal grupper af forsøg N = n1 + n2 +... +nk.
Hver af disse k forsøg indeholder r succeser, og derfor har vi i alt kr succeser. Hvis N er stor, så ville vi forvente at se om Np succeser. Således sidestiller vi disse sammen og har kr = Np.
Vi gør noget algebra og finder det N / k = r / p. Fraktionen på venstre side af denne ligning er det gennemsnitlige antal forsøg, der kræves for hver af vores k grupper af forsøg. Med andre ord, dette er det forventede antal gange, der skal udføres eksperimentet, så vi har i alt r succeser. Dette er nøjagtigt den forventning, vi ønsker at finde. Vi ser, at dette er lig med formlen r / p.
varians
Variationen af den negative binomiale fordeling kan også beregnes ved hjælp af den øjeblik genererende funktion. Når vi gør dette, ser vi, at variationen af denne distribution er givet ved følgende formel:
r (1 - p)/p2
Moment genererende funktion
Det øjeblik, der genererer funktionen for denne type tilfældige variabler, er ret kompliceret. Husk, at den øjeblik, der genererer funktionen er defineret som den forventede værdi E [etX]. Ved at bruge denne definition med vores sandsynlighedsmassefunktion har vi:
M (t) = E [etX] = Σ (x - 1)! / [(R - 1)! (x - r)!] EtXpr(1 - p)x - r
Efter en vis algebra bliver dette M (t) = (pet)r[1- (1- p) et]-r
Forhold til andre distributioner
Vi har set ovenfor, hvordan den negative binomiale fordeling ligner på mange måder den binomiale fordeling. Ud over denne forbindelse er den negative binomiale fordeling en mere generel version af en geometrisk fordeling.
En geometrisk tilfældig variabel x tæller antallet af nødvendige forsøg, før den første succes finder sted. Det er let at se, at dette er nøjagtigt den negative binomiale fordeling, men med r lig med en.
Andre formuleringer af den negative binomiale fordeling findes. Nogle lærebøger definerer x at være antallet af forsøg indtil r der opstår fejl.
Eksempel Problem
Vi vil se på et eksempel på et problem for at se, hvordan man arbejder med negativ binomial distribution. Antag, at en basketballspiller er et 80% frisparkskytte. Antag endvidere, at det frie kast er uafhængigt af det næste. Hvad er sandsynligheden for, at den ottende kurv for denne spiller foretages på det tiende frikast?
Vi ser, at vi har en indstilling for en negativ binomial distribution. Den konstante sandsynlighed for succes er 0,8, og derfor er sandsynligheden for fiasko 0,2. Vi ønsker at bestemme sandsynligheden for X = 10 når r = 8.
Vi tilslutter disse værdier til vores sandsynlighedsmassefunktion:
f (10) = C (10-1, 8 - 1) (0,8)8(0.2)2= 36(0.8)8(0.2)2, hvilket er ca. 24%.
Vi kunne derefter spørge, hvad der er det gennemsnitlige antal gratis kast, der er skudt, før denne spiller laver otte af dem. Da den forventede værdi er 8 / 0,8 = 10, er dette antallet af skud.