Chebyshevs ulighed i sandsynlighed

click fraud protection

Chebyshevs ulighed siger, at mindst 1-1 /K2 af data fra en prøve skal falde inden for K standardafvigelser fra gennemsnittet (her K er noget positivt reelt antal større end én).

Ethvert datasæt, der normalt distribueres eller i form af en klokke kurve, har flere funktioner. En af dem beskæftiger sig med spredningen af ​​data i forhold til antallet af standardafvigelser fra gennemsnittet. I en normal fordeling ved vi, at 68% af dataene er en standardafvigelse fra gennemsnittet, 95% er to standardafvigelser fra gennemsnittet, og cirka 99% er inden for tre standardafvigelser fra gennemsnittet.

Men hvis datasættet ikke er distribueret i form af en klokkekurve, kunne et andet beløb være inden for en standardafvigelse. Chebyshevs ulighed giver en måde at vide, hvilken brøkdel af data der falder inden for K standardafvigelser fra gennemsnittet for nogen datasæt.

Fakta om uligheden

Vi kan også angive uligheden ovenfor ved at erstatte udtrykket "data fra en prøve" med Sandsynlighedsfordeling. Dette skyldes, at Chebyshevs ulighed er et resultat af sandsynlighed, som derefter kan anvendes på statistikker.

instagram viewer

Det er vigtigt at bemærke, at denne ulighed er et resultat, der er bevist matematisk. Det er ikke som empirisk forhold mellem middel og tilstand eller tommelfingerregel der forbinder rækkevidde og standardafvigelse.

Illustration af uligheden

For at illustrere uligheden vil vi se på den for et par værdier af K:

  • Til K = 2 vi har 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Så Chebyshevs ulighed siger, at mindst 75% af dataværdierne for enhver distribution skal være inden for to standardafvigelser for gennemsnittet.
  • Til K = 3 vi har 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Så Chebyshevs ulighed siger, at mindst 89% af dataværdierne for enhver distribution skal være inden for tre standardafvigelser for gennemsnittet.
  • Til K = 4 vi har 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Så Chebyshevs ulighed siger, at mindst 93,75% af dataværdierne for enhver distribution skal være inden for to standardafvigelser for gennemsnittet.

Eksempel

Antag, at vi har udtaget prøver af hundevægte i det lokale dyrehospital og fundet, at vores prøve har et gennemsnit på 20 pund med en standardafvigelse på 3 pund. Med brugen af ​​Chebyshevs ulighed, ved vi, at mindst 75% af de hunde, som vi indtager, har vægte, der er to standardafvigelser fra gennemsnittet. To gange standardafvigelsen giver os 2 x 3 = 6. Træk og tilføj dette fra gennemsnittet af 20. Dette fortæller os, at 75% af hundene har vægt fra 14 til 26 pund.

Brug af uligheden

Hvis vi ved mere om den distribution, vi arbejder med, kan vi som regel garantere, at flere data er et vist antal standardafvigelser væk fra gennemsnittet. For eksempel, hvis vi ved, at vi har en normal fordeling, er 95% af dataene to standardafvigelser fra gennemsnittet. Chebyshevs ulighed siger, at vi ved denne situation i det mindste 75% af dataene er to standardafvigelser fra gennemsnittet. Som vi kan se i dette tilfælde, kan det være meget mere end disse 75%.

Værdien af ​​uligheden er, at det giver os et ”værre tilfælde” -scenarie, hvor de eneste ting, vi ved om vores eksempeldata (eller sandsynlighedsfordeling), er middelværdien og standardafvigelse. Når vi ikke ved noget andet om vores data, giver Chebyshevs ulighed en vis yderligere indsigt i, hvor spredt datasættet er.

Historien om uligheden

Uligheden er opkaldt efter den russiske matematiker Pafnuty Chebyshev, der først erklærede uligheden uden bevis i 1874. Ti år senere blev uligheden beviset af Markov i hans ph.d. afhandling. På grund af afvigelser i, hvordan man repræsenterer det russiske alfabet på engelsk, er det Chebyshev også stavet som Tchebysheff.

instagram story viewer