Løbetest for tilfældige sekvenser

click fraud protection

Givet en sekvens af data, et spørgsmål, som vi måske undrer os over, er, om sekvensen opstod ved tilfældige fænomener, eller om dataene ikke er tilfældige. Tilfældighed er svært at identificere, da det er meget vanskeligt at blot se på data og bestemme, om de blev produceret tilfældigt alene. En metode, der kan bruges til at hjælpe med at bestemme, om en sekvens virkelig optrådte ved en tilfældighed kaldes kørestesten.

Kørestesten er en test af betydning eller hypotese test. Proceduren for denne test er baseret på et kørsel eller en sekvens af data, der har en særlig egenskab. For at forstå, hvordan løbetesten fungerer, skal vi først undersøge begrebet løb.

Sekvenser af data

Vi begynder med at se på et eksempel på løb. Overvej følgende rækkefølge af tilfældige cifre:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

En måde at klassificere disse cifre på er at opdele dem i to kategorier, enten lige (inklusive cifrene 0, 2, 4, 6 og 8) eller ulige (inklusive cifrene 1, 3, 5, 7 og 9). Vi ser på rækkefølgen af ​​tilfældige cifre og betegner de lige tal som E og ulige tal som O:

instagram viewer

E E O E E O O E O E E E E E E O E E O O

Løbene er lettere at se, om vi omskriver dette, så alle Os er sammen og alle Es er sammen:

EE O EE OO E O EEEEE O EE OO

Vi tæller antallet af blokke med lige eller ulige tal og ser, at der i alt er ti kørsler til dataene. Fire løb har længde en, fem har længde to og en har længde fem

Betingelser

Med enhver test af betydning, er det vigtigt at vide, hvilke betingelser der er nødvendige for at gennemføre testen. Til kørselstesten vil vi være i stand til at klassificere hver dataværdi fra prøven i en af ​​to kategorier. Vi tæller det samlede antal kørsler i forhold til antallet af antallet af dataværdier, der falder ind i hver kategori.

Testen vil være en tosidet test. Årsagen til dette er, at for få kørsler betyder, at der sandsynligvis ikke er nok variation, og antallet af kørsler, der ville forekomme fra en tilfældig proces. For mange kørsler vil resultere, når en proces skifter mellem kategorierne for ofte til at blive beskrevet tilfældigt.

Hypoteser og P-værdier

Hver test af betydning har en null og en alternativ hypotese. For kørselstesten er nulhypotesen, at sekvensen er en tilfældig sekvens. Den alternative hypotese er, at sekvensen af ​​eksempeldata ikke er tilfældig.

Statistisk software kan beregne p-værdi der svarer til en bestemt teststatistik. Der er også tabeller, der giver kritiske tal på et bestemt niveau af betydning for det samlede antal løb.

Kører testeksempel

Vi arbejder gennem følgende eksempel for at se, hvordan testen til kørsler fungerer. Antag, at en studerende til en opgave bliver bedt om at vende en mønt 16 gange og notere rækkefølgen på hoveder og haler, der dukkede op. Hvis vi ender med dette datasæt:

H T H H H T T H T T H T H T H H

Vi kan måske spørge, om den studerende rent faktisk gjorde sit hjemmearbejde, eller snyder han og skrev en række H og T, der ser tilfældige ud? Kørselstesten kan hjælpe os. Antagelserne er opfyldt for kørselstesten, da dataene kan klassificeres i to grupper, enten som et hoved eller en hale. Vi fortsætter ved at tælle antallet af løb. Omgruppering, vi ser følgende:

H T HHH TT H TT H T H T HH

Der er ti kørsler for vores data med syv haler er ni hoveder.

Nullhypotesen er, at dataene er tilfældige. Alternativet er, at det ikke er tilfældigt. For et betydningsniveau af alfa, der er lig med 0,05, ser vi ved at konsultere den rigtige tabel, at vi afviser nulhypotesen, når antallet af kørsler enten er mindre end 4 eller større end 16. Da der er ti kørsler i vores data, vi undlader at afvise nulhypotesen H0.

Normal tilnærmelse

Kørestesten er et nyttigt værktøj til at bestemme, om en sekvens sandsynligvis er tilfældig eller ej. For et stort datasæt er det undertiden muligt at bruge en normal tilnærmelse. Denne normale tilnærmelse kræver, at vi bruger antallet af elementer i hver kategori og derefter beregner middel- og standardafvigelsen for det relevante Normal fordeling.

instagram story viewer