Liste des articles SEO

Comment gérer le contenu dupliqué sur son site

By 30 mai 2018 No Comments

Comment gérer le contenu dupliqué sur son site

 

La duplication de contenu peut représenter parfois jusqu’à 100% du contenu d’un site, sous des formes différentes. L’objet de cet article est d’expliquer le phénomène et les solutions pour en sortir.

Disons le franchement, le contenu dupliqué est vraiment pénible, lourd et souvent compliqué à éradiquer et peut parfois représenter 100% de la structure d’un site.

L’utilisateur, dans le cadre de sa navigation, ne se rend compte de rien. En revanche, les moteurs l’identifient, et le traitent plus ou moins bien selon la structure du site et les problématiques rencontrées.

Si les moteurs passent 50% de leur temps à crawler un contenu dupliqué sans intérêt, ils génèreront du crawl inutile (crawl sur des zones « inutiles » du site). L’idée étant que les moteurs puissent n’avoir accès qu’à des pages crawlables et indexables par les moteurs.

Un site peut comporter différentes formes de duplication de contenus :

 

-1- Un contenu (fiche produit, article etc) présent en doublon

Par exemple : une fiche produit enregistrée deux fois par mégarde. Il s’agira de deux url pour une même page. Solution : Rediriger en 301 une des deux url vers la seconde. Solution : S’assurer qu’une fiche produit ne peut être rédigée qu’une seule fois.

 

-2- Une même balise title présente sur plusieurs pages   Par exemple, il peut s’agir de deux pages articles ayant la même balise title. Solution : Rendre unique la balise title de chaque page. Solution : S’assurer qu’aucune balise title n’est dupliquée sur le site.

 

-3- Les variables filtres sur les url listes

C’est souvent le cas des sites e-commerce. Une page liste peut proposer un système de filtre par prix, nouveauté, bonne affaire. Il s’agira d’une variable du type « Order=price ». Avec ce système la page liste peut exister via une dizaine d’url différentes. Solution : Bloquer les variables dans le robots.txt. Solution : La génération du filtre peut se faire sur la page en cours sans générer de nouvelle url.

 

-4- Variables de temps

Par exemple : une page liste dupliquée via un ajout de variable année dans l’url. Solution : Ne pas générer ce variable année. Ou le « cacher » via une système de #.

 

-5- Les bugs générateurs d’url dupliquées à la volée.

Un ID bugué dans une url de fiche produit ou une page liste peut forcer la génération d’une nouvelle url à chaque appel serveur. Solution : Il faut absolument arrêter le bug. Solution : Rediriger en 301 toutes les variantes dupliquées vers la page canonique.

Quelque soit la nature de la duplication du contenu, celle-ci s’avère souvent néfaste pour le site. Tant que faire ce peut, il convient de l’éradiquer en amont, ou au moins un correctif efficace.

Après corrections, on peut voir facilement dans les logs serveurs si il y a un changement de comportement du cawl Google. Du jour au lendemain celui-ci peut changer et se focaliser sur les zones « utiles » du site (pages produits pages articles pages listes).

D’autres cas de duplication sont envisageables aussi :

-6- Une fiche produit enregistrée dans plusieurs catégories (chemins d’url correspondant à chaque catégorie).

 

-7- Dans le cas de versions linguistiques : variables langues buguées.

 

-8- Un domaine accessible en http et https, en www et sans www.

A noter que les CMS sont souvent générateurs de bugs. Si ces bugs ne sont pas connus et maitrisés, c’est le SEO qui en pâtit (Par exemple Magento).

 

Et vous? Comment gérez-vous la duplication de votre contenu?

nvidal

Author nvidal

More posts by nvidal

Leave a Reply