Tuto #8 Claude : audit de cannibalisation de pages avec le MCP DataForSEO

Tuto #8 Claude : audit de cannibalisation de pages avec le MCP DataForSEO

Date de création
March 4, 2026
Sélectionner
IA

Avant d'aller plus loin : si vous n'avez pas vu les premiers tutos vous pouvez les consulter ici :

Avant d'aller plus loin : ce tuto fait suite au tuto #7 qui couvre l'installation du MCP DataForSEO et un premier cas d'usage. Si le MCP n'est pas encore installé, commencez par là.

📌

Besoin d’intégrer les skills Claude et le Model Context Protocol (MCP) dans votre stack data et SEO ? Contactez moi pour en discuter : foucauld.henin@agence-30a.com

1. La cannibalisation SEO c’est quoi ?

Commençons par lever une idée reçue : avoir deux pages de votre site positionnées sur la même requête, l'une en 4ème et l'autre en 5ème position, c'est une bonne nouvelle. Vous occupez deux places dans la SERP au lieu d'une.

La vraie cannibalisation, c'est quand Google ne sait pas laquelle de vos deux pages choisir — et qu'il alterne d'une semaine à l'autre.

  • Cette semaine, il positionne /article-A/ en 6ème position.
  • La semaine prochaine, il décide que /article-B/ est plus pertinent et la positionne à sa place, en rétrogradant la première hors du top 10.

Les deux pages perdent leur stabilité, leur CTR s'effondre, et vous regardez votre trafic fluctuer sans comprendre pourquoi.

C'est le signe que Google ne distingue pas clairement l'intention de chaque page. Face à deux contenus qui lui semblent équivalents, il improvise un arbitrage et le fait souvent mal, en choisissant parfois la page la moins pertinente pour l'intention de la requête.

1.1 Concrètement, qu'est-ce qui crée de la cannibalisation ?

La plupart du temps, ce n'est pas un bug, c'est une accumulation naturelle. Un site qui produit du contenu régulièrement finit par avoir plusieurs articles sur des sujets proches. Un site e-commerce crée une page catégorie et plusieurs pages produits sur le même terme générique. Une agence rédige une page service et un article de blog qui couvrent la même intention de recherche. Le problème est invisible dans le quotidien, il s'installe silencieusement au fil du temps.

1.2 Pourquoi c'est difficile à détecter sans les bons outils ?

Parce que ça demande de croiser deux dimensions simultanément : les positions de vos pages, et les mots-clés sur lesquels elles se retrouvent en concurrence. Sur un site de 50 pages, c'est faisable manuellement.

Sur un site de 300 pages avec un blog actif, il y a potentiellement des milliers de paires à analyser. Les outils classiques (Ahrefs, Semrush) permettent de voir qu'un mot-clé est positionné sur plusieurs URLs, mais ils ne regroupent pas ces conflits en clusters actionnables, ne les scorent pas par impact, et ne produisent pas de plan d'action priorisé.

→ C’est ici que le rapport généré par Claude sur les données DataforSEO devient intéressant!

1.3 Qu’est ce qu’on peut faire une fois qu’on a identifier une cannibalisation entre deux pages ?

On a deux types d’actions qu’on peut mettre en place :

Fusion des pages et redirection 301 : pour les cas où deux pages couvrent le même sujet sans angle différenciant. On peut identifier une page dominante qui absorbera le contenu utile de l'autre, qui passe en 301. On ne garde ainsi qu’une URL.

Différenciation sémantique. Pour les conflits où les pages ont des angles distincts mais que Google ne parvient pas à distinguer. Il faut différencier le contenu des deux pages. Cela passe par : modifier le title/H1 (rendre l'intention explicite), enrichir le contenu (approfondir ce qui différencie chaque page), et optimiser le maillage interne (orienter chaque page vers son sujet avec des ancres précises).

2.Score d’impact

C'est la notion centrale du rapport qu’on va généré avec Claude. Chaque cluster de cannibalisation reçoit un score d'impact qui répond à une question simple : combien de trafic potentiel est en jeu si on corrige ce conflit ? Score d'impact = Volume mensuel cumulé × (1 − sévérité) La sévérité mesure à quel point les deux pages sont au coude-à-coude sur les mêmes requêtes. Elle est calculée pour chaque mot-clé en conflit comme suit : Sévérité d'un mot-clé = 1 − (|position_A − position_B| / max(position_A, position_B))

Quelques exemples :

Situation
Positions
Sévérité
Interprétation
Deux pages quasi-identiques aux yeux de Google
Position page A : 4 ème en semaine 1 Position page B : 5 ème en semaine 2
~0.8 → Rouge
Conflit majeur, Google hésite vraiment entre 2 pages
Une page dominante, l'autre en embuscade
Position A : 3ème Position page B : 18 ème
~0.17 → Vert
Coexistence acceptable, peu de friction
Pages éloignées
Page A : 4ème Page B : 28ème
~0.14 → Vert
La seconde est en dehors du top visible
⚠️

Une sévérité élevée n'implique pas forcément une action.

Deux pages en position 4 et 5 sur la même requête ont mathématiquement une sévérité proche de 1 mais si elles y restent de façon stable semaine après semaine, c'est simplement que vous occupez deux places sur la SERP. Le vrai signal d'alerte, c'est l'instabilité : une page qui monte et descend au gré des semaines sur la même requête, signe que Google hésite réellement. Le score d'impact doit toujours être lu en parallèle de l'évolution des positions dans le temps.

La sévérité est ensuite moyennée sur tous les mots-clés en conflit du cluster. Un cluster Rouge avec un volume de 670 requêtes/mois (comme le cluster Van der Poel ci-dessous) a un potentiel de gain bien supérieur à un cluster Orange avec le même volume, parce que les deux pages se parasitent réellement, et qu'une correction aura un effet immédiat sur le positionnement de la page conservée.

Ce que le score d'impact ne mesure pas : la difficulté de correction. Un cluster à score 576 qui nécessite une simple différenciation de title/H1 est bien plus prioritaire qu'un cluster à score 600 qui demande une refonte éditoriale complète. Le score est un point de départ pour la priorisation, pas une décision finale.

2. Tuto : dashboard de cannibalisation avec DataforSEO

2.1 Comment ça marche ?

Le workflow fonctionne en deux temps.

  • Phase 1 : Cartographie. Claude interroge DataForSEO pour récupérer les 100 premiers positionnements du domaine en France (top 30, mots-clés organiques).
  • Phase 2 : Intersections ciblées. Claude identifie les URLs candidates (les plus fréquentes dans les résultats) et analyse les intersections entre les 8 paires les plus pertinentes : celles dans le même répertoire ou sémantiquement proches.

Prérequis :

2.2 Créer un doc de configuration

Créez field-config-cannibalisation.json dans votre répertoire de travail :

2.3 Le prompt à utiliser dans Claude Code

Ici pour le site camminus.cc : à remplacer par votre site

3. Test et génération d’un dashboard de cannibalisation

On va voir un exemple concret avec camminus.cc. Site pour les passionnés de vélo lancé il y a quelques années par Quentin GUIGNARD (aka mon Pogacar à moi).

3.1 Dashboard généré par Claude Code :

image

3.2 Interprétation des résultat sur le cluster “Vélo Mathieu Van der Poel”

Le diagnostic : deux URLs se disputent les requêtes autour de Mathieu van der Poel.

  • camminus.cc/velo-mathieu-van-der-poel-champion-monde/ → positionné sur "velo van der poel" (position 19) et "vanderpool cycliste" (position 26)
  • camminus.cc/velo-cyclo-cross-van-der-poel/ → positionné sur "velo mathieu van der poel" (position 22)

Le score d'impact : 576 Avec 670 requêtes mensuelles cumulées sur ces trois mots-clés (210 + 140 + 320), et une sévérité de 0.14 (les deux pages ne se retrouvent jamais directement en concurrence sur le même mot-clé), le score reste élevé parce que le volume est là, même si la concurrence directe est limitée.

La recommandation : Différenciation sémantique (pas une fusion). Les deux pages ont des angles légitimement distincts :

  • /velo-cyclo-cross-van-der-poel/ parle de van der Poel dans sa discipline de Cyclocross, son vélo Canyon Inflite CX, ses caractéristiques techniques, son palmarès...
  • /velo-mathieu-van-der-poel-champion-monde/ parle plutôt de sa carrière sur route : son titre de champion du monde, ses vélos Colnago, son équipement saison, ses performances WorldTour.

Le problème n'est pas que ces pages existent toutes les deux : c'est que Google ne voit pas clairement la différence, probablement parce que les H1 et titles ne l'expriment pas assez explicitement.

Ce que Quentin doit faire concrètement :

  1. Retravailler le H1 et le title de /velo-cyclo-cross-van-der-poel/ pour qu'ils mentionnent explicitement "cyclocross" et "Canyon Inflite CX"
  2. Retravailler le H1 et le title de /velo-mathieu-van-der-poel-champion-monde/ pour qu'ils ancrent clairement "route", "Colnago" et "champion du monde"
  3. Ajouter un lien interne croisé entre les deux pages avec une ancre explicite ("voir aussi notre article sur le van der Poel cyclocrosseur")

C'est 30 minutes de travail pour potentiellement récupérer un positionnement clair sur 670 requêtes mensuelles, au lieu de deux pages qui se marchent dessus.

@Quentin : si tu passe dans le coin !

📌

Besoin d’intégrer les skills Claude et le Model Context Protocol (MCP) dans votre stack data et SEO ? Contactez moi pour en discuter : foucauld.henin@agence-30a.com

image
image
image

FOUCAULD HENIN

Senior SEO consultant et fondateur de 30A  

Je vous accompagne dans conception et la mise en place de vos chantiers SEO.

Après plusieurs expériences chez des retaillers, clients grand comptes et scale up, j’apporte une vision rationnelle et data driven dans les stratégies SEO.

Références : Oscaro, Total Energie, Intermarché, Oreegami

#bigquery #Looker #data analyse