Accueil | Technique | Liens | Actualités | Formation | Emploi | Forums | Base de données
DOSSIER cerig.efpg.inpg.fr 
Vous êtes ici : Accueil > Technique > La typographie du web > Genèse et performances du HTML      J.C.Sohm       Révision : 07 novembre 2001
 
LA TYPOGRAPHIE du WEB
2- Genèse et performances du HTML
 
 La genèse du HTML

Version PDF
pour impression

Fallait-il créer pour le web un nouveau langage de description de pages, alors qu'il y en existe déjà tant ? Car tous les logiciels qui manipulent du texte d'une manière ou d'une autre en utilise un : traitements de texte (ex : Word, WordPerfect), logiciels de mise en page (ex : XPress, PageMaker), tableurs (ex : Excel), intégrés (ex : Works), etc. Les formats d'échange entre plates-formes (ex : RTF, PDF), ceux destinés aux imageuses et aux imprimantes (PostScript, PCL), ainsi que le SGML, en font partie.

 

Tim Berners-Lee, le père du web et du HTML, avait de bonnes raisons. Il lui fallait faire :

 
 
    simple, de telle sorte que n'importe qui -- ou presque -- puisse rédiger facilement une page web ;
  léger, parce qu'Internet était un petit tuyau lorsque le web s'est développé il y a une dizaine d'années (la situation ne s'est guère améliorée depuis) ;
  ouvert, en évitant les langages de description de page qui sont la propriété des éditeurs, à cause des problèmes que soulèvent la conclusion d'accords de licence, et le payement des droits d'usage correspondants.
 
 

Certes, la mise en page et la typographie permises par le HTML apparaissent comme restreintes comparées à ce que fournissent des logiciels tels que XPress ou PageMaker. Mais plus un langage de description de page est perfectionné, plus la taille du fichier qu'il crée est élevée. Il n'y a pas de miracle : seuls les fichiers générés par un langage de description de page aussi simple que le HTML sont assez légers pour être facilement véhiculés sur Internet. En contrepartie, il ne faut pas s'attendre à trouver sur le web toutes les possibilités qui sont offertes par la PAO en matière de typographie. La typographie du web ne peut offrir que des possibilités limitées.

 
 

La solution de remplacement consistant à créer du texte avec un bon logiciel de mise en page, puis à le transformer en image avant de le transmettre à l'internaute, est impraticable parce que la taille du fichier correspondant est trop forte (voir ci-dessous). Seuls de petits fragments de texte (titre, élément de navigation, lettrine) peuvent être traités comme des images au format GIF (le mode de compression du format JPEG n'est pas adapté au texte).

 
 
 Performances comparées du HTML et des autres formats

On se rend compte des performances du HTML en matière de taille du fichier en enregistrant la même page web sous différents formats. Nous avons pour cela utilisé le début du présent chapitre, dans sa version initiale. Les résultats comparatifs figurent dans le tableau ci-dessous.

 
Type de fichier Nom Poids Remarques
HTML test.htm 4,8 Ko fichier d'origine
ASCII test.txt 2,0 Ko plus de liens,
ni de mise en page
WORD test.doc 26,5 Ko dont logo de 2,6 Ko
RTF test.rtf 31,3 Ko dont logo de 2,6 Ko
PDF test.pdf 15,6 Ko dont logo de 2,6 Ko
GIF test.gif 50,7 Ko dont logo de 2,6 Ko
plus de liens
SWF test.swf 15,3 Ko dont logo de 2,6 Ko,
plus de liens
Tableau : taille du fichier d'une page web enregistrée sous différents formats
 
 
 

Attention ! La visualisation (dans une nouvelle fenêtre) de certains fichiers du tableau ci-dessus requiert des conditions particulières :

 
 
    le fichier Word. Le logiciel Word de Microsoft doit être présent sur la machine. Si vous utilisez Internet Explorer, le fichier s'affichera dans la fenêtre du navigateur. Si vous utilisez Navigator, le fichier s'affichera dans Word (PC), ou sera déchargé sur le disque (Mac) et vous devrez l'introduire vous-même dans Word ;
  le fichier RTF. Un fichier RTF est affichable dans n'importe quel traitement de texte, ou presque. Le navigateur se servira de celui qui se trouve sur votre machine ;
  le fichier PDF. Sa lecture s'effectue dans la fenêtre du navigateur, mais il faut que le module externe (plug-in) "Acrobat Reader" soit installé. Vous pouvez le télécharger gratuitement sur le site de l'éditeur Adobe, en cliquant sur l'image située à droite ;
    le fichier SWF. Sa lecture s'effectue dans la fenêtre du navigateur, mais il faut que le module externe "Flash Player" soit installé (il l'est par défaut dans les versions récentes du navigateur de Netscape). Sinon, vous pouvez télécharger ce module gratuitement sur le site de l'éditeur Macromedia en cliquant sur l'image située à droite -- si son clignotement vous énerve, appuyez sur la touche "Arrêter" de votre navigateur). Exception : sur Mac, IE4 télécharge le fichier Flash et le dépose sur le bureau, mais ne l'affiche pas -- du moins est-ce ainsi que les choses se passent au CERIG ! La version 5, par contre, se comporte tout à fait normalement.
 
 

Remarque : les utilisateurs d'Internet Explorer version 6 risquent fort d'avoir une surprise en visualisant l'image gif ci-dessus. Le résultat parait très mauvais, parce que le navigateur adapte la taille de l'image à celle de la fenêtre. Le remède consiste à placer le curseur sur l'image, et à cliquer sur l'icône qui s'affiche, laquellei possède l'allure ci-contre. L'image gif s'affiche alors avec sa taille réelle, et le texte devient lisible.

 
 

Les conversions du fichier HTML initial ont été opérées de la manière suivante :

 
 
  du fichier HTML vers le fichier ASCII. Par copier-coller, de l'éditeur de pages web (FrontPage, en mode "normal") vers le bloc-notes de Windows, on obtient un fichier texte complètement débarrassé des balises HTML. Bien entendu, la typographie, la mise en page, et les liens, sont perdus. Pour que le texte soit lisible, nous avons introduit des retours à la ligne. En éditant le fichier source, on constate qu'il n'y a effectivement plus de balises -- ce qui n'empêche pas le navigateur d'afficher la page. D'une manière générale, les navigateurs affichent tout texte ASCII qu'ils rencontrent, pourvu qu'il ne comporte pas de caractères < et > ;
  du fichier HTML vers le fichier Word. En ouvrant la page web dans Word 97 , et en l'enregistrant dans le format natif de ce traitement de texte, on obtient un résultat assez médiocre (avec Word 2000, le résultat devrait être nettement meilleur). Nous avons transformé les tableaux en texte, et retravaillé la mise en page. La taille du fichier obtenu est telle, comparée à celle du fichier HTML de départ, que l'on comprend pourquoi il est très rare de trouver des fichiers Word dans les sites web. Ces fichiers sont par contre de plus en plus fréquents sur les intranets, parce que le débit des réseaux locaux le permet, et que l'on peut s'assurer que chaque utilisateur possède un exemplaire de Word ;
  du fichier Word vers le fichier RTF. Par enregistrement du fichier ".doc" au format ".rtf" ;
  du fichier HTML vers le fichier PDF. Par utilisation du logiciel Acrobat de l'éditeur Adobe, nous avons transformé la page web initiale en un fichier PDF aussi simple, et donc aussi léger, que possible ;
  du fichier PDF vers le fichier GIF. Le fichier PDF précédent a été ouvert dans Photoshop, converti en image matricielle (pixellisation), puis enregistré au format GIF (avec codage de la couleur sur 6 bits). La même image enregistrée au format JPEG pèserait environ deux fois plus lourd, même compressée au maximum (qualité la plus basse). On peut également afficher le fichier HTML dans un navigateur, effectuer une copie d'écran, récupérer l'image dans Photoshop, la recadrer, et l'enregistrer au format GIF. La taille du fichier gif est si grande, comparée à celle du fichier HTML de départ, que l'on comprend pourquoi on ne peut transformer en image que de petits blocs de texte ;
  du fichier HTML vers le fichier Flash. On peut copier-coller du texte de FrontPage vers Flash, mais sous forme ASCII seulement. De ce fait, la typographie, la mise en page, et les liens hypertextes, sont tous perdus. Nous n'avons pas rétabli les liens, qui ne sont faciles à créer que sous forme de boutons.
 
 
 Conclusion : pour le web, HTML est irremplaçable

Le tableau ci-dessus parle de lui-même : pour créer des fichiers légers, le format HTML est imbattable. On peut dire, écrire, et penser tout le mal que l'on veut du HTML, ce langage de description de page a encore de beaux jours devant lui. Faute d'une solution de remplacement, il faut se contenter des possibilités qu'offre actuellement le HTML pour la typographie du web.

 

Deux autres formats ont également de l'avenir sur le web : PDF et FLASH, en complément du HTML. Nous reparlerons de PDF au chapitre 6 et de Flash au chapitre 7.

 
Chapitre précédent
Chapitre précédent
       Retour au sommaire
Retour au sommaire
       Chapitre suivant
Chapitre suivant
  Accueil | Technique | Liens | Actualités | Formation | Emploi | Forums | Base de données  
 

Copyright © CERIG/EFPG 1996-2000