Når du videregiver oplysninger gennem en URL, skal strengen kun bruge specifikke tilladte tegn. Disse tilladte tegn inkluderer alfabetiske tegn, tal og et par specialtegn, der har betydning i URL-strengen. Alle andre tegn, der skal føjes til en URL, skal være kodet, så de ikke forårsager problemer under browserens rejse til at finde de sider og ressourcer, du leder efter.
Kodning af en URL
Kodning tager kun et særligt tegn og erstatter det med dets kodede alternativ. Strengen ser rodet ud, men resultatet er let for computere at læse, og du risikerer ikke URL-misdirections.
For eksempel at linke til en fil med titlen mit CV.pdf kræver URL-kodning for at rumme mellemrummet min og Genoptag. Resultatet er min% 20resume.pdf. Uden kodning til rumsymbolet antager webbrowseren, at URL'en slutter i slutningen af ordet min, med CV.pdf kasseres som overflødige data. I en sådan situation ville du aldrig finde din fil!
Hvad skal kodes?
Ethvert tegn, der ikke er et alfabetisk tegn, et tal eller et specialtegn, der bruges uden for sin normale kontekst, skal være kodet på din side. Nedenfor er en tabel med almindelige tegn i webadresser og deres kodning:
Reserverede tegn URL-kodning
Karakter | Formål i URL | Indkodning |
: | Separat protokol (http) fra adresse | % 3B |
/ | Separat domæne og mapper | % 2F |
# | Separate ankre | %23 |
? | Separat forespørgselsstreng | % 3F |
& | Separate forespørgselselementer | %24 |
@ | Adskil brugernavn og adgangskode fra domænet | %40 |
% | Angiver et kodet tegn | %25 |
+ | Angiver et mellemrum | % 2B |
Anbefales ikke i webadresser | % 20 eller + |
Disse kodede eksempler er forskellige fra det, du finder med HTML-specialtegn. Brug f.eks. For at kode en URL med et ampersand-tegn %24. Brug dog enten i HTML & eller &, som begge ville skrive ampersand på HTML-siden.
Disse forskellige kodningsordninger er ikke så modstridende, som de ser ud. Det ene sæt styrer webadresser, mens det andet styrer indholdet på den side, som webadressen peger på.