C Programmeringsvejledning om håndtering af tilfældig adgang til filer

Bortset fra de enkleste applikationer er de fleste programmer nødt til at læse eller skrive filer. Det kan være lige til at læse en konfigurationsfil, eller en tekstparser eller noget mere sofistikeret. Denne tutorial fokuserer på at bruge filer med tilfældig adgang i C.

Programmering af tilfældig adgangsfil I / O i C

binær fil
D3Damon / Getty Images

De grundlæggende filhandlinger er:

  • fopen - åbn en fil - specificer, hvordan den åbnes (læse / skrive) og type (binær / tekst)
  • fclose - luk en åbnet fil
  • fread - læst fra en fil
  • fwrite - skriv til en fil
  • fseek / fsetpos - flyt en filmarkør til et sted i en fil
  • ftell / fgetpos - fortæl dig, hvor filmarkøren er placeret

De to grundlæggende filtyper er tekst og binær. Af disse to er binære filer normalt enklere at håndtere. Af den grund og det faktum, at tilfældig adgang på en tekstfil ikke er noget, du skal gøre ofte, er denne tutorial begrænset til binære filer. De første fire operationer, der er anført ovenfor, er til både tekst- og tilfældig adgangsfiler. De sidste to bare for tilfældig adgang.

instagram viewer

Tilfældig adgang betyder, at du kan flytte til en hvilken som helst del af en fil og læse eller skrive data fra den uden at skulle læse igennem hele filen. For mange år siden blev data gemt på store hjul af computertape. Den eneste måde at komme til et punkt på båndet var ved at læse hele vejen igennem båndet. Så kom diske med, og nu kan du læse en hvilken som helst del af en fil direkte.

Programmering med binære filer

En binær fil er en fil af en hvilken som helst længde, der indeholder bytes med værdier i området 0 til 255. Disse bytes har ingen anden betydning i modsætning til i en tekstfil, hvor en værdi på 13 betyder vognretur, 10 betyder linjeskift og 26 betyder slutningen af ​​filen. Software, der læser tekstfiler, skal håndtere disse andre betydninger.

Binære filer en strøm af bytes og moderne sprog har tendens til at arbejde med strømme i stedet for filer. Den vigtige del er datastrømmen snarere end hvor den kom fra. I C, kan du tænke på dataene enten som filer eller streams. Med tilfældig adgang kan du læse eller skrive til enhver del af filen eller strømmen. Med sekventiel adgang, skal du loop igennem filen eller streame fra starten som et stort bånd.

Denne kodeeksempe viser en simpel binær fil, der åbnes til skrivning, hvor der skrives en tekststreng (char *). Normalt ser du dette med en tekstfil, men du kan skrive tekst til en binær fil.

Dette eksempel åbner en binær fil til skrivning og skriver derefter en char * (streng) i den. Variablen FILE returneres fra opkaldet fopen (). Hvis dette mislykkes (filen kan findes og være åben eller skrivebeskyttet, eller der kan være en fejl med filnavnet), returnerer den 0.

Kommandoen fopen () forsøger at åbne den specificerede fil. I dette tilfælde er det test.txt i den samme mappe som applikationen. Hvis filen indeholder en sti, skal alle backslasts fordobles. "c: \ mappe \ test.txt" er forkert; skal du bruge "c: \\ folder \\ test.txt".

Da filtilstanden er "wb", skriver denne kode til en binær fil. Filen oprettes, hvis den ikke findes, og hvis den gør det, slettes alt, hvad der var i den. Hvis opkaldet til fopen mislykkes, måske fordi filen var åben eller navnet indeholder ugyldige tegn eller en ugyldig sti, returnerer fopen værdien 0.

Selvom du bare kunne kontrollere, at ft ikke er nul (succes), har dette eksempel en FileSuccess () -funktion til at gøre dette eksplicit. I Windows udsender det opkaldets og filnavns succes / fiasko. Det er lidt hårdt, hvis du er ude efter performance, så du kan begrænse dette til fejlfinding. På Windows er der lidt overhead-output, der sender tekst til systemfejleren.

Fwrite () opkald udsender den specificerede tekst. Den anden og tredje parameter er størrelsen på tegnene og længden på strengen. Begge er defineret som værende størrelse_t, som er usigneret heltal. Resultatet af dette opkald er at skrive tælleelementer med den specificerede størrelse. Bemærk, at med binære filer, selvom du skriver en streng (char *), tilføjes det ikke nogen vognretur eller linjefødetegn. Hvis du vil have dem, skal du eksplicit inkludere dem i strengen.

Filtilstande til læsning og skrivning af filer

Når du åbner en fil, specificerer du, hvordan den skal åbnes - om du vil oprette den fra ny eller overskrive den, og om den er tekst eller binær, læse eller skrive, og om du vil tilføje den. Dette gøres ved hjælp af en eller flere filtilstandsspecifikationer, der er enkeltbogstaver "r", "b", "w", "a" og "+" i kombination med de andre bogstaver.

  • r - Åbner filen til læsning. Dette mislykkes, hvis filen ikke findes eller ikke kan findes.
  • w - Åbner filen som en tom fil til skrivning. Hvis filen findes, ødelægges dens indhold.
  • a - Åbner filen til skrivning i slutningen af ​​filen (vedhæftet) uden at fjerne EOF-markøren, før du skriver nye data til filen; dette opretter filen først, hvis den ikke findes.

Tilføjelse af "+" til filtilstanden skaber tre nye tilstande:

  • r + - Åbner filen til både læsning og skrivning. (Filen skal findes.)
  • w + - Åbner filen som en tom fil til både læsning og skrivning. Hvis filen findes, ødelægges dens indhold.
  • a + - Åbner filen til læsning og vedhæftning; den vedhæftede operation inkluderer fjernelse af EOF-markøren, før nye data skrives til filen, og EOF-markøren gendannes, når skrivningen er afsluttet. Det opretter filen først, hvis den ikke findes. Åbner filen til læsning og vedhæftning; den vedhæftede operation inkluderer fjernelse af EOF-markøren, før nye data skrives til filen, og EOF-markøren gendannes, når skrivningen er afsluttet. Det opretter filen først, hvis den ikke findes.

Filtilstandskombinationer

Denne tabel viser kombination af filtilstand til både tekst- og binære filer. Generelt læser du enten fra eller skriver til en tekstfil, men ikke begge på samme tid. Med en binær fil kan du både læse og skrive til den samme fil. Tabellen herunder viser, hvad du kan gøre med hver kombination.

  • r tekst - læst
  • rb + binær - læse
  • r + tekst - læse, skriv
  • r + b binær - læse, skriv
  • rb + binær - læse, skriv
  • w tekst - skriv, opret, trunker
  • wb binær - skriv, opret, trunker
  • w + tekst - læse, skrive, oprette, afkort
  • w + b binær - læse, skrive, oprette, afkort
  • wb + binær - læse, skrive, oprette, afkort
  • en tekst - skriv, opret
  • ab binær - skriv, opret
  • a + tekst - læse, skrive, oprette
  • a + b binær - skriv, opret
  • ab + binær - skriv, opret

Medmindre du bare opretter en fil (brug "wb") eller kun læser en (brug "rb"), kan du slippe af med at bruge "w + b".

Nogle implementeringer tillader også andre breve. Microsofttillader for eksempel:

  • t - teksttilstand
  • c - forpligte
  • n - ikke forpligtende
  • S - optimering af cache til sekventiel adgang
  • R - caching ikke-sekventiel (tilfældig adgang)
  • T - midlertidig
  • D - slet / midlertidigt, som dræber filen, når den er lukket.

Disse er ikke bærbare, så brug dem til din egen fare.

Eksempel på lager af tilfældig adgang

Hovedårsagen til at bruge binære filer er den fleksibilitet, der giver dig mulighed for at læse eller skrive hvor som helst i filen. Tekstfiler lader dig kun læse eller skrive sekventielt. Med udbredelsen af ​​billige eller gratis databaser som f.eks SQLite og MySQL, reducerer behovet for at bruge tilfældig adgang på binære filer. Tilfældig adgang til filposter er dog lidt gammeldags, men stadig nyttig.

Undersøgelse af et eksempel

Antag, at eksemplet viser et indeks- og datafilpar, der lagrer strenge i en tilfældig adgangsfil. Strengene har forskellige længder og indekseres efter position 0, 1 og så videre.

Der er to tomrumsfunktioner: CreateFiles () og ShowRecord (int recnum). CreateFiles bruger en char * -buffer i størrelse 1100 til at indeholde en midlertidig streng, der består af formatstrengen msg efterfulgt af n stjerner, hvor n varierer fra 5 til 1004. To FILE * oprettes begge ved hjælp af wb filemode i variablerne ftindex og ftdata. Efter oprettelsen bruges disse til at manipulere filerne. De to filer er

  • index.dat
  • Data.dat

Indeksfilen indeholder 1000 poster af typen indextype; dette er den strukturelle uafhængige type, der har de to medlemmer pos (af typen fpos_t) og størrelse. Den første del af løkken:

udfylder strengen msg på denne måde.

og så videre. Så dette:

udfylder strukturen med længden på strengen og punktet i datafilen, hvor strengen skrives.

På dette tidspunkt kan både indeksfilstrukturen og datafilstrengen skrives til deres respektive filer. Selvom dette er binære filer, skrives de sekventielt. I teorien kunne du skrive poster til en position ud over den nuværende slutning af filen, men det er ikke en god teknik at bruge og sandsynligvis slet ikke bærbar.

Den sidste del er at lukke begge filer. Dette sikrer, at den sidste del af filen skrives til disk. Under filskrivning går mange af skrivene ikke direkte til disk, men opbevares i buffere i fast størrelse. Når en skrivning er fyldt bufferen, skrives hele indholdet af bufferen til disk.

En filskylningsfunktion tvinger til at skylle, og du kan også specificere filskylningsstrategier, men disse er beregnet til tekstfiler.

ShowRecord-funktion

For at teste, at en hvilken som helst specificeret post fra datafilen kan hentes, skal du vide to ting: hvor den starter i datafilen, og hvor stor den er.

Dette er, hvad indeksfilen gør. ShowRecord-funktionen åbner begge filer, søger til det korrekte punkt (recnum * størrelse af (indextype) og henter et antal bytes = størrelse af (indeks)).

SEEK_SET er en konstant, der specificerer, hvor fseek udføres fra. Der er to andre konstanter defineret til dette.

  • SEEK_CUR - søg i forhold til den aktuelle position
  • SEEK_END - søg absolut fra slutningen af ​​filen
  • SEEK_SET - søg absolut fra filstart

Du kan bruge SEEK_CUR til at flytte filmarkøren frem efter størrelse af (indeks).

Efter at have opnået størrelsen og placeringen af ​​dataene, er det bare at hente dem.

Brug her fsetpos () på grund af typen index.pos, som er fpos_t. En alternativ måde er at bruge ftell i stedet for fgetpos og fsek i stedet for fgetpos. Parret fseek og ftell fungerer med int, mens fgetpos og fsetpos bruger fpos_t.

Efter at have læst posten i hukommelsen tilføjes et nulkarakter \ 0 for at gøre det til et korrekt c-string. Glem det ikke, ellers får du et styrt. Som tidligere kaldes fclose på begge filer. Selvom du ikke mister nogen data, hvis du glemmer fclose (i modsætning til ved at skrive), vil du have en hukommelseslækage.

instagram story viewer