Ces dernières années ont vu une remarquable augmentation du nombre de prestataires SEO (optimisation pour les moteurs de recherche) prêchant l'importance vitale de la conformité des sites web aux normes du W3C pour une promotion internet bien plus efficace. Mais ce code de conformité est-il réellement "la potion magique de la SEO" que tant de prestataires SEO essaient de le faire croire ?
Le World Wide Web Consortium (W3C)
Pour ceux qui ne sont pas familiers avec ce terme, un site internet en conformité avec le W3C est un site internet qui adhère aux standards de codage fixés par le World Wide Web Consortium, une organisation de plus de 400 membres incluant tous les moteurs de recherche majeurs et sociétés internationales comme AT&T, HP et Toshiba, pour ne citer qu'elles. Dirigé par Sir Timothy Berners-Lee, l'inventeur de l'Internet tel qu'on le connait aujourd'hui, le W3C a travaillé pour fournir un jeu de normes destiné à préserver l'évolution d'un Internet cohérent depuis la mise en place du Consortium en 1994.
Bien que le W3C soit devenu une réalité Internet, la prise de conscience générale de cette entité de référence a mis quelques temps à émerger. En effet, C'est seulement après 2 à 3 ans d'existence que le terme Conformité W3C est sorti de l'ombre pour devenir une expression à la mode dans les activités de création de sites internet et de SEO.
Bien que personnellement, j'eusse été un loyal partisan des standards du Consortium pendant très longtemps, je ne peux pas m'empêcher d'estimer que leur importance ait été quelque peu exagérée par certaines sociétés de référencement, celles qui ont clamé que la Conformité W3C était le "remède à tous les maux" pour les sites internet ayant une mauvaise visibilité sur les moteurs de recherche.
Alors cette conformité aux normes du W3C est-elle vraiment le remède miracle universel comme on le clame encore aujourd'hui ?
Jetons un coup d'oeil rapide à quelques arguments employés couramment par les prestataires en référencement et les web designers.
Les navigateurs tels que Firefox, Opera et Lynx n'afficheront pas votre site internet correctement
Le problème de la compatibilité des navigateurs est probablement l'une des raisons les plus fréquemment citées dans la mise en conformité aux normes du W3C, Firefox étant la cible privilégiée de ces revendications. Par expérience personnelle, Firefox affichera tout y compris la plupart des lignes de code cassé avec un succès raisonnable. En réalité, le problème principal de ce navigateur semble plutôt être lié à l'occasionnelle incapacité de correctement interpréter les positions à l'écran des couches successives (les balises DIV qui causent souvent un chevauchement des textes), même si elles sont bien conçues, que dans dans son incapacité à traiter le code cassé.
En ce qui concerne Lynx, un peu plus fragile de Firefox, la plupart des problèmes rencontrés par ce navigateur uniquement textuel semblent surtout provenir d'un contenu sémantique incorrect (paragraphes dans le désordre) et d'une faible structure du code.
Les Moteurs de Recherche auront des problèmes pour indexer votre site internet
Certains prestataires SEO prétendent farouchement que les robots d'indexation des moteurs de recherche éprouvent des difficultés dans l'indexation des pages non conformes au W3C. Toujours par expérience personnelle, il y a une certaine part de vérité dans cette revendication : ce n'est pas le nombre d'erreurs rencontré qui cause un "dépression nerveuse" au robot, mais le type d'erreur rencontré. Tant que le validateur de code du W3C sera capable de faire l'analyse syntaxique (*) du code source d'une page du début à la fin, un robot d'indexation sera très probablement capable d'indexer une page et de classerr son contenu. Dans l'ensemble, les problèmes d'indexation surviennent quand les erreurs de code empêchent spécifiquement l'analyse syntaxique du code source d'une page, et certainement pas quand des erreurs "non-critiques" permettent au processus de continuer.
(*) L'analyse syntaxique (parser) permet de traiter un fichier pour extraire les informations souhaitées. L'analyse syntaxique linguistique peut reconnaître des mots et des expressions ou même des modèles de discours dans un contenu textuel.
Les mal-voyants ou non-voyants ne pourront pas utiliser votre site internet
L'inévitable, mais cependant faible, contre-argument de ce point est que seulement un faible pourcentage des internautes font partie de cette population. En revanche, c'est un fait que des navigateurs comme Lynx ou Jaws verront le code d'une page de la même manière qu'un robot d'indexation. Dans cette perspective, nous revenons à la différence entre les erreurs de conformité W3C critiques et non-critiques. Aussi longtemps qu'un outil/navigateur/robot d'indexation sera capable d'extraire le contenu textuel du code d'une page, il sera capable de poursuivre sa tâche, et donc l'utilisateur sera également probablement capable de "voir" la page de façon satisfaisante.
Un de mes confrères au Japon vient justement de mener une étude intitulée : W3C Validation : Who cares ? (Qui se soucie de la validité W3C ?), testant l'importance générale de la conformité W3C pour les sites internet sur le long-terme. Les résultats montrent que même la page web la moins conforme au monde n'altère pas la capacité d'un moteur de recherche à indexer et à classer une page web. Avec ces résultats, je pense plutôt que des études plus poussées doivent être menées pour réellement établir les effets de cette expérience sur le long-terme.
Au moment où j'écris cet article, la page expliquant cette étude se positionne très bien sur Google pour les requêtes non spécifiques suivantes : "Does Google care about validation" et "Google care validation". Pas si mal pour une page web qui est supposée être entièrement "inindexable". Alors quelle est la réponse à l'énigme de la conformité W3C ?
En Conclusion
Je dirais qu'ignorer les conformités du World Wide Web Consortium aujourd'hui pourrait avoir des conséquences néfastes sur le long-terme, comme l'évolution de la cohérence d'Internet va probablement placer l'accent sur les bonnes pratiques de codage dans l'avenir. Cela dit, je dirais également que la valeur et l'importance actuelles de la conformité W3C ont été grandement exagérées par les professionnels de la création de sites internet et de la SEO.
Davantage d'études sur les effets de la non-conformité devraient donc être nécessaires.