seo

Pièges d'indexation par CMS : Shopify, WordPress, Magento

Chaque CMS a ses pièges d'indexation structurels : facettes, canoniques automatiques, noindex par défaut. Comment les repérer dans la Google Search Console, CMS par CMS.

IndexProbe·4 juillet 2026·4 min de lecture

Un CMS n'indexe pas vos pages : c'est Google qui décide. Mais chaque plateforme a sa façon de générer des URLs, de poser des canoniques, d'appliquer des noindex par défaut. Et ces automatismes, invisibles depuis l'interface d'administration, se traduisent dans la Google Search Console par des statuts d'indexation bien précis.

Cette rubrique passe en revue les pièges d'indexation propres à chaque CMS. Le principe est le même partout : la plateforme industrialise la création d'URLs, et la Search Console rend le verdict. Notre rôle est de faire le lien entre les deux, pour que vous sachiez quoi chercher sur votre plateforme.

Le CMS n'est pas le coupable

Disons-le d'emblée : aucun de ces CMS n'est « mauvais pour le SEO ». Shopify, WordPress, Magento et les autres font exactement ce pour quoi ils sont conçus, industrialiser la production de pages. Le problème n'est pas la plateforme, c'est le volume d'URLs qu'elle génère automatiquement, souvent à votre insu.

Une navigation à facettes crée une URL par combinaison de filtres. Un système de tags WordPress crée une page d'archive par étiquette. Une collection Shopify rend le même produit accessible par plusieurs chemins. Rien de tout cela n'est une faute : ce sont des fonctionnalités. Mais chacune produit des URLs que Google va découvrir, explorer, et parfois refuser d'indexer, ou pire, indexer à la place de vos vraies pages.

Le vrai sujet, ce n'est donc pas « quel CMS choisir », mais « quels automatismes de mon CMS surveiller ». C'est un raisonnement structurel, à mener sur ses propres URLs, pas un procès en règle des plateformes.

Comment un piège CMS se lit dans la Search Console

Ces automatismes ne restent pas abstraits : ils apparaissent noir sur blanc dans le rapport d'indexation. Trois statuts reviennent particulièrement souvent d'un CMS à l'autre.

Explorée, actuellement non indexée : Google a exploré une page générée automatiquement (une archive de tags, une facette) mais l'a jugée trop faible pour l'indexer. Page en double sans URL canonique : plusieurs chemins mènent au même contenu, sans que le CMS ait déclaré lequel fait foi. Page en double, Google a choisi une autre URL canonique : votre thème déclare une canonique, mais Google en retient une autre. Reconnaître ces trois statuts, c'est déjà savoir lire la moitié des pièges CMS.

Les CMS couverts dans cette série

Cette rubrique couvrira les plateformes suivantes, chacune avec son piège d'indexation le plus caractéristique :

Shopify — contenu dupliqué entre URLs de collection et URLs de produit
WordPress — noindex et archives fines (tags, catégories, dates)
WooCommerce — facettes et pagination qui saturent le crawl
Wix — configuration SEO et pages « Détectée, actuellement non indexée »
Squarespace — canonique du domaine par défaut face au domaine personnalisé
PrestaShop — navigation à facettes et paramètres d'URL
Magento — layered navigation et explosion des URLs
BigCommerce — facettes et canoniques automatiques
Webflow — pagination des Collection Lists et canoniques dupliquées
Drupal — alias d'URL et facettes

Les articles seront publiés progressivement et liés depuis cette page au fur et à mesure.

Le point commun : diagnostiquer sur ses propres URLs

Quel que soit le CMS, la démarche est la même. Le piège est structurel, donc il se repère à l'échelle : non pas sur une page, mais sur l'ensemble des URLs qu'un pattern génère (toutes les facettes, tous les tags, toutes les variantes de produit). C'est là qu'un audit une-à-la-fois montre ses limites. C'est le problème qu'IndexProbe règle : en interrogeant l'API officielle de la Google Search Console sur toute la liste d'URLs que vous fournissez ou constituez depuis la GSC, vous repérez aussitôt quel pattern de votre CMS génère des doublons, du « non indexé » ou des canoniques ignorées.

Pour comprendre le vocabulaire des statuts avant de plonger dans un CMS précis, commencez par la rubrique Statuts d'indexation Google Search Console. Pour les guides techniques transversaux (budget de crawl, facettes, pagination), voir SEO technique : crawl et indexation.

Questions fréquentes

Mon CMS est-il mauvais pour le SEO ?

Non. Aucun CMS grand public n'est intrinsèquement mauvais pour le référencement. Ce qui pose problème, ce sont les URLs générées automatiquement (facettes, tags, variantes) que la plateforme crée sans que vous le remarquiez. Ces URLs sont des fonctionnalités, pas des défauts, mais elles demandent une surveillance côté indexation.

Pourquoi les pièges d'indexation dépendent-ils du CMS ?

Parce que chaque CMS a sa propre logique de génération d'URLs et de balises canoniques. WordPress crée des archives par tag, Shopify multiplie les chemins vers un produit, Magento génère des URLs à facettes. Le mécanisme diffère, mais le résultat se lit dans les mêmes statuts de la Search Console.

Comment savoir si mon CMS génère des doublons ?

En auditant vos URLs par pattern dans la Google Search Console. Si plusieurs URLs servent le même contenu, elles apparaîtront en « Page en double » ou en « Explorée, actuellement non indexée ». Un audit en masse permet d'isoler d'un filtre toutes les URLs d'un pattern donné (par exemple ?filter=) et de voir combien sont concernées.