Sådan bruges Meta Charset-tags til tegnkodning i HTML5

click fraud protection

Før introduktionen af HTML5, hvis du indstiller tegnkodningen på et dokument med et element, krævede du at du skriver den lidt detaljerede linje, der ses nedenfor. Dette er Meta Charset-elementerne, hvis du brugte HTML4 på din webside:


Det, der er vigtigt at bemærke i denne kode, er de anførselstegn, du ser omkring indhold attribut: indhold ="tekst / html; tegnsæt = iso-8859-1". Som alle HTML-attributter definerer disse anførselstegn værdien af ​​attributten, hvilket indikerer, at hele strengen tekst / html; tegnsæt = iso-8959-1 er indhold af dette element. Dette er korrekt HTML, og det er sådan, denne streng var beregnet til at blive skrevet. Det er også uhåndterligt langt og grimt! Det er heller ikke noget, du sandsynligvis vil huske fra toppen af ​​dit hoved!

I de fleste tilfælde bliver webudviklere nødt til at kopiere og indsætte denne kode fra et websted i ethvert nyt, de udviklede, fordi det var meget at bede om at skrive dette fra bunden.

HTML5 skærer ekstra "ting" ud

HTML5 tilføjede ikke kun nogle nye elementer til sproget, men det forenklede også meget af HTML-syntaksen, inklusive Meta Charset-elementet. Med HTML5 kan du tilføje din karakterkodning med den meget lettere at huske syntaks for 

instagram viewer
META element, som du ser nedenfor:


Sammenlign den forenklede syntaks med det, vi skrev i starten af ​​denne artikel, den gamle syntaks, der blev brugt til HTML4, og du vil se, hvor meget lettere det er at skrive og huske HTML5-versionen. I stedet for at skulle kopiere og indsætte dette fra et eksisterende sted i en hvilken som helst ny, du arbejdede med, er dette absolut noget, som du som en front-end webudvikler kunne huske. Denne tidsbesparelse er muligvis ikke meget, men når du overvejer de andre syntaksområder, som HTML5 har forenklet, tilføjes besparelserne!

Inkluder altid tegnkodning

Du skal altid medtage tegnkodning til dine websider, selvom du ikke nogensinde har til hensigt at bruge nogen specialtegn. Hvis du ikke inkluderer en tegnkodning, bliver dit websted sårbart over for et scriptingangreb på tværs af websteder ved hjælp af UTF-7.

I dette scenarie ser en angriber, at dit websted ikke har defineret karakterkodning, så det narrer browseren til at tro, at tegnskodningen på siden er UTF-7. Dernæst injicerer angriberen UTF-7-kodede scripts på websiden, og dit websted er hacket. Dette er problematisk for alle involverede, lige fra din virksomhed til dine besøgende. Den gode nyhed er, at det er et simpelt problem at undgå - sørg for at tilføje tegnkodning til alle dine websider.

Hvor skal man tilføje tegnkodning

Tegnkodningen for en webside skal være den første linje i dine HTML'er

element. Dette sikrer, at browseren ved, hvad tegnkodningen er, før den gør noget andet på siden end at bestemme doktypen og identificere, at det er en HTML-side. Din HTML skal lyde:




...

Brug af HTTP-headere til ekstra sikkerhed

Du kan også angive tegnkodningen i HTTP-overskrifterne. Dette er endnu mere sikkert end at tilføje det til HTML-siden, men du skal have adgang til serverkonfigurationerne eller .htaccess filer, hvilket betyder, at du muligvis skal arbejde med dit websteds hostingudbyder for at få denne form for adgang eller få dem til at foretage ændringerne du. Adgang er udfordringen her. Selve ændringen er enkel, så enhver hostingudbyder skal være i stand til at foretage denne ændring for dig med relativ lethed.

Hvis du bruger Apache, kan du indstille standard tegnsæt for hele dit websted ved at tilføje: AddDefaultCharset UTF-8 til din rod .htaccess fil. Apache's standard tegnsæt er ISO-8859-1.

instagram story viewer