Université on line - Supports en ligne sur le réseau
Université on line dot

Supports -> XHTML

Forum Plan du site

tabgbc Résumé du cours tabbcbf Liens tabbfbf PDFs tabbfbf Biblio tabbfbf Dico tabdbf

tabgbf Le cours tabdbf

Codages et langues

Le jeu de caractères utilisé dans la page XHTML est indiqué comme suit :
<?xml version="1.0" encoding="UTF-8"?>
Pour des raisons de compatibilité, on peut doubler cette déclaration dans une balise met :
<meta http-equiv= "content-type" content= "text/html ;charset=utf-8 " />
Il est bien sûr possible d'utiliser un autre jeu de caractères que l'Unicode UTF-8.

Afin d'effectuer des traitements en série de documents comme une recherche avancée ou encore une traduction automatique, il est souvent nécessaire de connaître la langue d'un texte, cela évite les confusions et erreurs.

Ce type de meta-information sur le document peut s'indiquer de deux manières différentes :

  • La langue majoritaire du document est spécifiée à l'intérieur de la balise <html>, la norme XHTML étant intermédiaire, la redondance des attributs est de mise :
    <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">...</html>
  • Pour une portion de texte dans une autre langue, on peut utiliser la balise <div> ou <span> :
    <p>Vin rouge en Breton se dit <span lang="br" xml:lang="br">gwin ru</span>.</p>
    Bien que non obligatoire, cette spécification n'est pas anodine car elle permet de faire lentement évoluer le web vers une nécessaire internationalisation des langues et donc des cultures.

prec

suite
tabgbf Lien tabdbf
Pour consulter la liste des codages ISO 639 des langues du monde, vous pouvez télécharger le pdf correspondant:

Liste des codages des langues


Cours - Liens - PDFs - Biblio - Dico

Copies ou reproductions strictement réservées à l'usage privé ou pédagogique dans un cercle de classe.

"Supports de cours sur le réseau"
Jean-Marc Loisil [universite@online.fr]
 

Valid XHTML 1.0!