J’aime les aphorismes façon 10 commandements, appliqués aux principes de la rédaction web… Et s’il y en a bien un à respecter, c’est celui-ci : halte au contenu dupliqué ! Il est un des pires ennemis de votre référencement… et contrairement à ce que vous pourriez penser, il ne recouvre pas seulement le phénomène du plagiat. Décryptage…
Le contenu dupliqué, kesako ?
Les webmasters en parlent souvent sous son nom anglais, le duplicate content et le réduisent même souvent à ses deux initiales, le DC. Ce qu’il faut savoir c’est que le duplicate content n’est pas seulement le fruit de copier/ coller émanant de tierces personnes. Il peut aussi venir de l’architecture de votre site, de la façon de rubriquer vos articles et d’établir des liens entre eux.
photo : woodleywonderworks
Le DC réalisé par des tiers
C’est l’une des plaies d’internet. Textes, images, vidéos… tout se copie ! Et dès lors que votre contenu original est copié sur un autre site, il perd de sa valeur et peut voir son référencement pénalisé.
Dans certains cas, il peut arriver qu’une page ayant pillé votre contenu soit mieux référencée que la vôtre : c’est notamment le cas si les backlinks vers cette page-ci sont plus nombreux. Google ne récompense pas l’antériorité de publication, si rien ne lui indique que le contenu est original !
Pour identifier le plagiat en ligne, plusieurs outils gratuits sont à disposition des internautes, tels que Positeo, Plagspotter, ou encore Copyscape.
Si du contenu identique est cerné, plusieurs solutions sont possibles :
– demander au webmaster du site en question le retrait pur et simple de votre texte ;
– proposer une solution « amiable » : autoriser la reprise d’un petit extrait et demander la mise en place d’un lien « lire la suite » renvoyant vers votre page.
Enfin, pour éviter ce genre de déconvenues, pensez à intégrer dans votre code source l’attribut « rel=canonical ». Google comprend alors que votre texte est l’original.
Le contenu dupliqué lié à votre architecture
Il est très fréquent que l’architecture même de votre site ou son rubriquage provoque une duplication de votre propre contenu. Si vous classez un article dans plusieurs catégories distinctes et avec des mots-clés spécifiques, il est fort probable que votre texte se répète automatiquement : chaque catégorie et chaque mot-clé correspondant chacun à une page. Ce problème-ci se pose en particulier dans le cas des blogs.
Pour lutter contre ce dédoublonnage de vos propres textes, vous pouvez soit recourir à la balise « canonical », soit choisir de désindexer les pages en doublons grâce à la balise « noindex ». Google ne référence alors qu’une seule page au contenu original, et ne pénalise plus votre site !
Il existe d’autres cas de DC, lié notamment aux URL des pages et aux balises title et meta. Pensez toujours qu’en matière de rédaction web, rien n’est à négliger, que ce soit dans le texte (qualité, toujours de la qualité !) ou dans son environnement « balisé » !