05 Avr Comment corriger le contenu dupliqué sur votre site
Le contenu dupliqué touche 25 à 30 % de l’ensemble des textes sur Internet selon Matt Cutts (le responsable de Google Webspam).
Or les moteurs de recherche, et principalement Google, détestent le « duplicate content » (contenu dupliqué) et peut engendrer une pénalité pour votre site !
Bref, si vous voulez bétonner votre référencement, vous devez vous assurer que vous n’êtes pas concerné par ce problème !
Alors comment détecter le contenu dupliqué sur votre site et comment y remédier ?
1. Le contenu dupliqué, qu’est ce que c’est ?
Comme son nom l’indique, il s’agit ni plus ni moins de la présence d’un même contenu sur plusieurs pages du web.
Cela peut être le même texte avec quelques mots modifiés ou simplement le même texte copié/collé mot pour mot. Que ce soit dans un paragraphe ou une page entière, Google voit tout et veut du contenu UNIQUE ! ;)
Les pages en question peuvent appartenir à un seul et même site, mais elles peuvent aussi concerner des sites différents. Mais, que le contenu dupliqué soit un problème interne ou externe, il a besoin d’être résolu !
Car le contenu dupliqué risque :
– soit de pénaliser votre page. Cela se traduit concrètement par le déclassement de la page copiée dans les résultats des moteurs de recherche. Et, au final, c’est votre site tout entier qui risque d’être pénalisé par Google !
NB : S’il s’agit de plagiat, Google regarde certains critères tels que la date de publication ou l’auteur de la publication pour déterminer la page originale.
– soit que votre page dupliquée ne soit directement pas prise en compte par Google ! Pour le contenu non malveillant, Google choisit lui-même d’indexer une seule des pages en doubons. Alors autant faire en sorte qu’il choisisse la bonne ! Et nous allons voir comment.
En général, la plupart des contenus dupliqués sont des contenus involontairement dupliqués, au sein même de notre site, et dont nous n’avons même pas conscience !
Alors, cela vaut le coup de faire un petit check-up !
2. Quels sont les points à surveiller de votre site ?
1. Les urls de votre site
– Votre home avec ou sans www.
La 1ère chose dont vous devez vous assurer est un cas typique de contenu dupliqué sans que vous le sachiez :
Vous pouvez accéder à votre site au travers de 2 urls différentes :
http://votrenomdedomaine.com et http://www.votrenomdedomaine.com
Le même contenu se retrouve donc sous deux urls différentes > contenu dupliqué !
Assurez-vous donc que l’adresse http://www.votrenomdedomaine.com redirige bien de façon permente vers l’adresse http://votrenomdedomaine.com (via ce qu’on appelle une redirection 301).
Pour cela, tapez l’adresse http://www.votrenomdedomaine.com dans le browser de Browseo. Celui-ci vous indiquera la redirection 301 comme ceci :
Si c’est bon, c’est gagné !
Si ce n’est pas le cas, vous devriez établir la redirection permanente (301) au travers le fichier .htaccess de votre site (aaatchoum). Ou alors demandez plutôt à votre webmaster de la faire pour vous ;). Vous pouvez aussi faire la redirection via votre serveur, mais dans ce cas, il faut demander à votre hébergeur !
– Plusieurs noms de domaine
Avez-vous peut être acheté plusieurs noms de domaine pour votre site ? Plusieurs domaines avec des extensions différentes (.com, .fr etc.) afin de vous assurer que toutes les déclinaisons possibles de votre nom de domaine vous appartiennent.
De la même manière, il est important de choisir le nom de domaine principal sur lequel vous voulez travailler et faire ensuite une redirection permanente (redirection 301) de vos autres noms de domaine vers celui-ci.
2. Les pages de votre site
– Vos articles invités
Attention au même article publié plusieurs fois sur des sites différents !
Par exemple, dans le cas d’un article invité que vous avez écrit sur un autre blog et que vous publiez aussi chez vous ! Pour les articles invités que vous écrivez chez d’autres blogueurs, ne recopiez pas l’article sur votre propre blog. Si vous voulez en parler à vos lecteurs, vous pouvez expliquer que vous avez écrit sur tel blog en faisant une petite introduction (unique et pas reprise sur l’article-invité) et mettre un lien vers l’article original.
– Vos propres articles
De la même manière, attention à vos propres articles :
Et en particulier aux pages d’archives ou de catégories de votre blog, qui reprennent vos articles déjà publiés. Les articles qui s’affichent à la fois dans leur propre url, les archives, les pages de catégories ou encore de mots-clés sont considérés comme des doublons !
Prenons l’exemple de l’un de nos articles : 8 façons de reconnaitre un mauvais Community Manager
Son adresse originale est : https://beinweb.fr/comment-reconnaitre-un-mauvais-community-manager
Si nous le classons dans la catégorie « réseaux sociaux », une autre adresse se crée automatiquement qui renvoie au même contenu :
> https://beinweb.fr/reseaux-sociaux/comment-reconnaitre-un-mauvais-community-manager
Puis, vous avez peut être des pages archives qui classent vos articles par mois de publication. Vous pourrez donc aussi retrouver automatiquement le même article à l’adresse suivante :
> https://beinweb.fr/septembre-2014/comment-reconnaitre-un-mauvais-community-manager
Enfin, dans le cas où vous avez associé votre article à des mots-clé (tags), pour chaque mot-clé, une nouvelle adresse est créée :
> https://beinweb.fr/community-management/comment-reconnaitre-un-mauvais-community-manager
Bref, nous n’aurions donc pas moins de 4 urls différentes pour le même article ! Alors, assurez-vous de mettre plutot des extraits de vos articles (plutot que les articles entiers) dans vos pages d’archives, de catégories et de mots-clés (tags)… mais également dans votre flux RSS et sur votre page d’accueil !
NB : Pour votre flux RSS, une fois sur votre compte WordPress, allez dans le menu de gauche sur « Réglages » puis « Lecture ». Assurez-vous d’avoir coché la case « l’extrait » pour la ligne « Pour chaque article d’un flux, fournir ».
Une erreur souvent commise également est, lors de votre inscription sur des annuaires ou sur des sites de communiqués, faire un copier/coller de la description de votre site ou du communiqué.
Quoi qu’il en soit, pour connaître quelles sont vos pages actuelles touchées par le contenu dupliqué, vous pouvez utiliser Copyscape, qui repère les pages qui ont un contenu similaire au votre.
Psss Cet autre outil de Webrankinfo vous permettra de connaître le pourcentage de similitude entre deux pages.
3. Comment prévenir la présence de contenu dupliqué ?
Il existe différentes manières d’éviter la pénalité due à l’existence de contenu dupliqué sur votre site, mais la solution la plus simple reste de pas indexer le contenu dupliqué !
Comment ?
Souvenez-vous de notre article sur Comment indexer le contenu inutile de votre site :
Pour indiquer à Google les pages que vous ne voulez pas qu’ils prennent en compte (celles que vous considérez comme du contenu dupliqué), vous avez 2 options :
– créer un fichier robots.txt
– insérer une balise « noindex » sur vos pages en double !
NB : Pour mettre une page en « noindex », c’est très facile. Il suffit de 2 clics au travers du plugin WordPress SEO. Regardez notre tutoriel pour plus de détails !
Voilà ! Avec tout ça, vous aurez enlevé toutes les suspicions de contenu dupliqué auprès de Google ! En éliminant les similitudes au niveau des résultats, vous renforcerez le poids des pages restantes et améliorerez votre référencement ;)
Eloise
Posté à 04:50h, 20 octobreBravo Anais, un article simple a comprendre avec des solutions simples a suivre :)
Anaïs Villelongue
Posté à 14:15h, 20 octobre1000 mercis Eloise !!! :) Ravie que ça vous ait plu !