Înainte de introducerea HTML5, setarea codării caracterelor pe un document cu un element necesită scrierea liniei oarecum detaliate văzute mai jos. Acestea sunt elementele Meta Charset dacă utilizați HTML4 în pagina dvs. web:
Ceea ce este important de observat în acest cod sunt ghilimelele pe care le vedeți în jurul conţinut atribut: content ="text / html; charset = iso-8859-1". La fel ca toate atributele HTML, aceste ghilimele definesc valoarea atributului, indicând faptul că întregul șir text / html; charset = iso-8959-1 este conţinut a acestui element. Acesta este HTML adecvat și așa a fost menit să fie scris acest șir. Este, de asemenea, lung și neplăcut! De asemenea, nu este ceva ce probabil ți-ai aminti de pe cap!
În majoritatea cazurilor, dezvoltatorii web ar trebui să copieze și să lipească acest cod de pe un site în oricare altul nou pe care îl dezvoltau deoarece scrierea asta de la zero cerea foarte mult.
HTML5 Elimină „Lucrurile” suplimentare
HTML5 nu numai că a adăugat câteva elemente noi limbajului, dar a simplificat foarte mult o mare parte a sintaxei HTML, inclusiv elementul Meta Charset. Cu HTML5, puteți adăuga codarea caracterelor cu sintaxa mult mai ușor de reținut pentru
META element pe care îl vedeți mai jos:Comparați această sintaxă simplificată cu ceea ce am scris la începutul acestui articol, vechea sintaxă utilizată pentru HTML4 și veți vedea cât de ușor este să scrieți și să vă amintiți versiunea HTML5. În loc să trebuiască să copiați și să inserați acest lucru de pe un site existent în oricare altul nou la care lucrați, acest lucru este absolut ceva pe care, ca dezvoltator web frontal, l-ați putea aminti. Este posibil ca această economie de timp să nu fie prea mare, dar când luați în considerare celelalte domenii de sintaxă pe care HTML5 le-a simplificat, economiile se adună!
Includeți întotdeauna codificarea caracterelor
Ar trebui să includeți întotdeauna codificarea caracterelor pentru paginile dvs. web, chiar dacă nu intenționați vreodată să utilizați niciuna personaje speciale. Dacă nu includeți o codificare a caracterelor, site-ul dvs. devine vulnerabil la un atac de scriptare între site-uri folosind UTF-7.
În acest scenariu, un atacator vede că site-ul dvs. nu are o codificare a caracterelor definită, așa că îl păcălește pe browser să creadă că codificarea caracterelor paginii este UTF-7. Apoi, atacatorul injectează scripturi codate UTF-7 în pagina web, iar site-ul dvs. este piratat. Acest lucru este problematic pentru toți cei implicați, de la compania dvs. la vizitatorii dvs. Vestea bună este că este o problemă simplă de evitat - asigurați-vă că adăugați codificarea caracterelor la toate paginile dvs. web.
Unde se adaugă codarea caracterelor
Codificarea caracterelor pentru o pagină web ar trebui să fie prima linie a HTML-ului dvs.
element. Acest lucru asigură că browserul știe care este codificarea caracterelor înainte de a face orice altceva pe pagină, în afară de a determina tipul de documente și de a identifica că este o pagină HTML. Codul dvs. HTML ar trebui să citească:
...
Utilizarea antetelor HTTP pentru securitate suplimentară
De asemenea, puteți specifica codificarea caracterelor în anteturile HTTP. Acest lucru este chiar mai sigur decât adăugarea acestuia la pagina HTML, dar ar trebui să aveți acces la configurațiile serverului sau la .htaccess fișiere, ceea ce înseamnă că este posibil să trebuiască să colaborați cu furnizorul de găzduire a site-ului dvs. web pentru a obține acest tip de acces sau pentru ca aceștia să facă modificările tu. Accesul este provocarea aici. Schimbarea în sine este simplă, astfel încât orice furnizor de găzduire ar trebui să poată face această schimbare pentru dvs. cu relativă ușurință.
Dacă utilizați Apache, puteți seta setul de caractere implicit pentru întregul site adăugând: AddDefaultCharset UTF-8 la rădăcina ta .htaccess fişier. Setul de caractere implicit al lui Apache este ISO-8859-1.