Bonnes pratiques rel=canonical : 5 erreurs à éviter

L’inclusion d’un attribut rel=canonical est un bon moyen d’indiquer aux moteurs de recherche la version originale ou préférée d’une page, dit « page canonique », en cas de contenu dupliqué. Il s’agit d’une norme fonctionnant avec nombre de moteurs de recherche, dont Google, Yahoo! et Bing. La balise rel=canonical consolide tous les attributs nécessaires au référencement des différentes versions de la page (liens, propriétés des URLs, etc.). Bien que rel=canonical soit extrêmement pratique pour régler les problèmes de duplication de contenu, identifier une erreur dans sa mise en place n’est pas toujours évident.

Les conseils de Google

Une large partie du contenu de la page canonique doit se retrouver sur la ou les variantes. Il faut utiliser rel=canonical si une même page est accessible à plusieurs adresses ou bien si l’on propose des variantes de pages dont les différences sont mineures.

  • Vérifier que l’URL canonique que l’on indique existe bien et n’est pas une page d’erreur.
  • Vérifier que la page canonique indiquée ne contient pas de balise meta noindex.
  • S’assurer que l’on souhaite voir remonter l’URL de la page canonique dans les pages de résultats de recherche.
  • Inclure l’attribut rel=canonical dans la partiedu code source, ou bien dans les entêtes HTTP.
  • Ne pas spécifier plus d’un rel=canonical par page. Lorsque une page contient plusieurs rel=canonical, ceux-ci sont ignorés.

Les erreur à éviter

1. Contenu paginé

Lorsque l’on dispose d’une série de pages paginées, ne pas implémenter d’attribut rel=canonical renvoyant vers la page 1 de la série. Les pages 2, 3, 4, etc., d’une même série sont considérées comme des pages différentes. Dans ce cas de figure, la bonne pratique consiste à utiliser les attributs rel=next et rel=prev.

2. Erreur de structure dans l’URL de la page canonique

Google sait gérer les URLs absolues et relatives. Il faut toutefois faire attention à bien poser la structure de l’URL canonique.

  • URL absolue : http://webmarketing-et-referencement.fr/exemple.html : OK
  • URL relative : /example.html : OK

Erreur fréquente : webmarketing-et-referencement.fr/exemple.html : KO <- cette URL sera interprétée comme une erreur relative, et le robot de Google ira chercher http://webmarketing-et-referencement.fr/webmarketing-et-referencement.fr/exemple.html, une page qui n’existe manifestement pas.

3. Plusieurs rel=canonical ou implémentation non intentionnelle

Il arrive qu’une page se retrouve avec plusieurs attributs rel=canonical. Comme mentionné précédemment, dans ce cas Google ignore la mention rel=canonical et tout le bénéfice potentiel de l’implémentation est perdu. Il s’agit d’un problème fréquemment rencontré par les sites utilisant un CMS (WordPress, Joomla! et autres) et ayant activé plusieurs extensions SEO qui vont chacune ajouter leur rel=canonical dans le code source des pages.

Dans certains cas beaucoup plus rares, Google peut également détecter une implémentation non intentionnelle. Exemple : une rel=canonical qui renvoie sur un site n’ayant rien à voir avec le votre. Dans ce cas, cette implémentation, bien que techniquement correcte, sera ignorée.

4. Page catégorie dont rel=canonical spécifie une page de type « à la une »

Le rel=canonical d’une page catégorie ne peut pas renvoyer vers une page de mise en avant. Exemple : un site de cuisine qui aurait une rubrique « desserts » ne peut pas indiquer que la version canonique de cette page est la page « fondant au chocolat ».

Si Google acceptait ce type d’indication, la page dessert disparaitrait des pages de résultats de recherche. NDLR : ce point rejoint la bonne pratique concernant la similarité du contenu évoquée plus haut. On sent que Google se montre insistant sur ce point, certainement suite à la constatation d’abus dans l’implémentation de la balise.

5. rel=canonical dans,

Il faut implémenter rel=canonical dans la section du code source de la page. Google indique par ailleurs que le plus tôt dans la section sera le mieux. Dans le cas ou rel=canonical est implémenté dans, il sera tout simplement ignoré.

Le mot de la fin

Avec le temps, la SEO s’est nettement complexifiée. Les sites Internet tendent à avoir de plus en plus d’éléments impactants dans leur code source, sans pour autant que ceux-ci ne laissent de trace visible sur le site. Il est donc de bon ton de passer son code source en revue, de temps à autre, pour identifier d’éventuelles erreurs.