Ce magazine online est dédié à l’industrie du Web. Il vous informe, vous conseille sur la réussite de votre visibilité online, au travers d’articles, d’interviews et de sa revue de presse internationale
Par Matt Jackson, le 30 janvier 2007, traduit par Christophe Da Silva
L'optimisation pour les moteurs de recherche a toujours été considérée comme une science de haut vol. En effectuant une recherche sur Google, les résultats qui apparaissent sont généralement optimisés pour un mot ou une expression exacte. Cependant, dans son combat pour proposer des résultats plus pertinents tout autant que naturels et contenant une information utile, Google a inséré l'Indexation Sémantique Latente (LSI) dans ses algorithmes.
La LSI est une nouvelle méthode d'indexation qui rapproche Google d'un être humain dans sa manière de penser. Si nous recherchions manuellement sur chaque page web pour trouver l'information en relation avec un mot ou une expression donnée, nous serions capables de générer nos propres résultats de recherche basés sur le thème réel de tel ou tel site, ce qui rendrait par là même les résultats de recherche bien plus pertinents. Mais ce travail serait titanesque, d'où l'existence des algorithmes. Jusqu'alors, les robots d'indexation vérifiaient davantage la présence du mot ou de l'expression dans une page.
La forme extrêmement rigide de l'indexation par mots-clés facilite l'utilisation de techniques détournées d'optimisation. Ainsi, les moteurs de recherche peuvent être manipulés de sorte qu'une page sur-optimisée pour un mot ou une expression donnée puisse très bien se positionner dans les résultats pour la recherche de ce même mot ou expression. Les algorithmes prennent également en compte les liens vers cette page, et on note que ces backlinks jouent davantage que la densité de mots-clés, en ce qui concerne Google. Ce qui permet donc de manipuler les robots d'indexation en échangeant des liens avec des dizaines, des centaines, voire des milliers de sites web.
Les liens réciproques ont perdu de leur importance sur Google, et dans une moindre mesure sur Yahoo et MSN, au profit des liens à sens unique. L'indexation sémantique est une autre méthode, particulièrement performante, de faire apparaître une page web de manière la plus naturelle possible, et dont son contenu a été mis en place de manière naturelle (sans sur-optimisation).
L'introduction de la LSI a déjà permis des changements drastiques dans les résultats de Google. Les sites qui se positionnaient plutôt bien grâce à une importante masse de backlinks basés sur un seul mot-clé ont vu leurs pages être déclassées. Les autres pages dont l'ancre texte (le texte servant de lien) des backlinks était variée ont remonté dans les résultats pour des termes de recherche pour lesquels elles n'avaient pas été spécifiquement optimisées.
La LSI est en train de changer la face de la SEO. En ce qui concerne Google, l'optimisation d'un site web réside de moins en moins dans la densité de mots-clés et dans le placement de ces derniers dans une page. En revanche, les techniques d'échange de liens devront prendre en compte dorénavant l'algorithme de la LSI pour maximiser la pertinence d'un backlink.
Si vous optimisez seulement pour Google alors une page web doit théoriquement être écrite de manière naturelle. Sans parler d'écrire pour Internet, lorsque nous écrivons, nous insérons instinctivement les mots-clés appropriés dans notre texte. Afin d'éviter les répétitions (optimisation de mots-clés), nous proposons une forme alternative de ces mots-clés (et expressions) en employant des termes ayant la même signification. Nous employons naturellement le singulier et le pluriel d'un mot-clé aussi bien que nous diversifions les temps de conjugaison. Tout ce qui repose en fait sur la racine d'un mot. Et aux yeux des algorithmes de LSI, c'est une bonne chose.
La pertinence d'un lien va reposer à terme exclusivement sur la variation des ancres texte (les mots-clés servant à lier une page de votre site depuis un autre site). Ce n'est une raison pour paniquer si vous disposez de centaines de backlinks avec la même ancre texte (en général le mot-clé primaire de votre site). Mais à partir de maintenant, vous devriez dresser une liste de vos mots-clés et leur trouver une variante (synonymes, pluriels, mots conjugués...). Ainsi, vous maximiserez la pertinence de chaque backlink (sans oublier de bien choisir la page où votre lien apparaîtra).
Du point de vue des utilisateurs (ceux qui recherchent sur les moteurs de recherche), la LSI offre des avantages d'indexation avant-gardistes. Par exemple, la LSI reconnait que le mot "moteur" dans l'expression "moteur de recherche" n'est pas en relation avec "moteur à explosion" ou 'moteur thermique". En théorie, la LSI donne des résultats plus précis dans les résultats de recherche, aussi bien que des résultats plus adaptés à un thème spécifique.
Il est reconnu que Google est le premier moteur de recherche à employer l'indexation sémantique. Il tente ainsi de fournir des résultats de recherche de plus en plus pertinents, véritables et utiles. La LSI lui fournit donc une avance considérable face aux autres moteurs de recherche.
Pour le moment, Yahoo et MSN semblent s'accommoder de l'indexation spécifique de mots-clés, bien que l'on remarque que Yahoo prenne en compte les variations des singuliers et pluriels, ainsi que la racine d'un mot-clé pour le calcul de la densité de mots-clés.
La manière dont la LSI affecte les webmasters dépend de la manière dont ils ont déjà fait la promotion leur site web. Si les pages sont remplies de contenu naturel incluant des mots-clés et des mots-clés alternatifs, et que l'ancre texte de leurs backlinks est suffisamment diversifiée, la LSI ne les affectera pas outre mesure. En revanche, si tous vos efforts se sont concentrés que sur quelques mots-clés, il est encore temps de redresser la barre.
A propos de l'auteur
Matt Jackson travaille pour WebWiseWords, une société spécialisée dans la rédaction de contenus naturels pour sites web.
:: Référencement E-Commerce : Le référencement gratuit est-il encore payant ?
:: Optimisation (SEO)