URL inconnue de Google : les 2 causes opposées (et quoi faire)

Dans l'outil d'Inspection d'URL de la Google Search Console, « URL inconnue de Google » signifie une chose simple : Google n'a jamais vu cette adresse. Aucune trace dans son système. Ce n'est ni un refus de qualité, ni un blocage, ni une 404. Mais le même libellé recouvre deux situations opposées : une page jamais découverte, ou une page que Google connaissait et qui vient de sortir de son index.
Dans l'outil d'Inspection d'URL de la Google Search Console, un verdict ferme la porte plus sec que les autres : « URL inconnue de Google ». Pas de date de crawl, pas de canonique retenue, pas de motif de non-indexation. Juste un constat brut : Google n'a aucune trace de cette adresse.
Le réflexe est de le lire comme un point de départ, une page neuve qui attend d'être découverte. Sauf que le même libellé tombe parfois sur une page que Google connaissait très bien, qui était indexée, et qui vient de disparaître de son index. Deux histoires opposées sous une seule étiquette.
Comment savoir laquelle des deux vous avez sous les yeux ? Pourquoi une page demandée à l'indexation reste-t-elle « inconnue » plusieurs jours ? Et comment repérer, parmi des centaines d'URLs, celles qui sont retombées dans ce statut après une régression ? La réponse tient dans une question : Google a-t-il déjà connu cette adresse, oui ou non.
« URL inconnue de Google » : ce que Google vous signale vraiment
« URL inconnue de Google » signifie que Google n'a jamais rencontré cette adresse : elle n'est pas dans son système, ni dans la file de crawl, ni dans l'index. La documentation officielle est nette : ce statut indique que « Google n'a jamais vu cette URL auparavant ». C'est l'absence totale de trace, pas un verdict porté sur la page.
Il faut écarter d'emblée ce que ce statut n'est pas, parce que la confusion mène droit au mauvais correctif :
- Ce n'est pas un jugement de qualité. Google n'a pas lu la page, donc il n'a rien évalué. Inutile de réécrire un contenu que personne n'a consulté.
- Ce n'est pas une balise
noindex. Une page ennoindexest connue de Google, qui l'a vue puis exclue volontairement. C'est le statut Exclue par la balise noindex, pas celui-ci. - Ce n'est pas un blocage
robots.txt. Une page bloquée au crawl est, elle aussi, connue de Google : il en a vu l'URL mais a renoncé à la télécharger. C'est Bloquée par le fichier robots.txt. - Ce n'est pas une 404. Une 404 suppose que Google a demandé l'URL et reçu une réponse. Ici, il n'a jamais rien demandé du tout.
La nuance commune à ces quatre cas : dans chacun, Google connaît l'URL. « Inconnue » est le seul statut où il n'en a aucune trace. C'est précisément ce qui le rend ambigu, parce que cette absence de trace peut signifier deux choses radicalement différentes.
Deux situations opposées derrière le même libellé
Le même verdict « URL inconnue de Google » recouvre deux réalités qui appellent des actions inverses. Soit la page est jamais découverte : elle vient d'être créée, ou rien ne mène à elle, et Google ne l'a tout simplement pas encore trouvée. Soit la page était connue et indexée, puis a disparu de l'index, et retombe dans ce statut comme si elle n'avait jamais existé.
La première situation est un démarrage. La page est neuve ou isolée, et la mission est de la faire découvrir : un lien, une entrée de sitemap, une soumission ponctuelle. C'est un travail d'amorçage, sans urgence particulière.
La seconde est une régression, et c'est l'inverse d'un démarrage. Une page qui était positionnée, qui recevait du trafic, peut finir par sortir de l'index lorsque Google cesse de la juger utile. Une fois désindexée, son URL peut très bien réafficher « inconnue de Google » à l'inspection. Là, le travail n'est pas d'amorcer : c'est de comprendre pourquoi une page établie a décroché et de la remettre en état.
Le piège est de confondre les deux. Traiter une régression comme un simple démarrage (« je vais ajouter un lien et demander l'indexation ») masque la vraie question : qu'est-ce qui a fait sortir cette page de l'index, et est-ce déjà en train de toucher d'autres pages du même type ? La distinction se fait sur un seul critère : cette URL avait-elle déjà du trafic et des positions ? Si oui, vous êtes face à une régression, pas à un démarrage.
Les causes d'une « URL inconnue de Google »
Les causes se rangent dans les deux familles qu'on vient de poser : celles qui empêchent une page d'être découverte, et celles qui font sortir une page connue de l'index. Le diagnostic commence toujours par identifier dans quelle famille vous êtes.
Jamais découverte
Google ne peut indexer que ce qu'il trouve. Quand rien ne mène à une page, elle reste hors de son champ de vision.
- Page orpheline, sans lien interne. Aucun lien de votre site ne pointe vers elle. Les liens internes sont le principal chemin par lequel Googlebot découvre vos pages ; sans eux, une page neuve peut rester invisible longtemps.
- Absente du sitemap. Le sitemap est l'un des canaux par lesquels Google apprend l'existence de vos URLs. Une page qui n'y figure pas, et que personne ne lie, n'a presque aucune chance d'être trouvée.
- Jamais soumise. La page vient d'être publiée et aucun signal n'est encore parti vers Google. C'est le cas le plus banal, et le plus facile à corriger.
- Versions d'URL divergentes. Vous inspectez
https://example.com/pagealors que votre site serthttps://www.example.com/page, ou l'inverse, ou encore une versionhttp://au lieu dehttps://. Pour Google, ce sont des adresses distinctes. La version que vous tapez dans l'outil d'inspection n'est peut-être pas celle que Google connaît : il a indexé la canonique (par exemple lawww) et déclare « inconnue » la variante que vous testez. La page est bien dans l'index, mais sous une autre adresse. C'est une fausse alerte fréquente, à vérifier en premier quand une page que vous savez en ligne ressort « inconnue ». - Blocage en amont. Une règle
robots.txtou une réponse serveur empêche Googlebot d'atteindre la zone où vit la page, si bien qu'aucun lien crawlable n'y conduit. Le blocage lui-même produit son propre statut (voir Bloquée par le fichier robots.txt et Indexée malgré le blocage par robots.txt), mais son effet de bord est de couper le chemin de découverte des pages situées derrière lui.
Régression : sortie d'index
Ici, Google avait l'URL, l'avait indexée, puis l'a retirée. Une fois la trace de la page effacée, son URL peut basculer en « inconnue », comme si elle n'avait jamais été indexée.
- Perte de clics et d'impressions. La page avait des positions, elles s'effacent. Quand une page cesse d'apparaître dans les résultats, c'est souvent le signe que Google l'a écartée de l'index, ou est en train de le faire.
- Contenu dévalué. La page a vieilli, son sujet a été couvert ailleurs en mieux, ou un nettoyage de votre site l'a appauvrie. Google la juge moins utile et finit par ne plus la conserver.
- Crawl raréfié. Googlebot espace ses passages sur une page qu'il ne valorise plus, puis cesse de la recrawler. Privée de confirmation, la page glisse hors de l'index. Une page que Google ne crawle plus est une page en sursis.
Ces causes de régression recoupent celles d'autres statuts de la série : avant de basculer en « inconnue », une page en perte de vitesse transite souvent par Explorée, actuellement non indexée. « Inconnue » peut être l'étape suivante, lorsque Google a non seulement cessé d'indexer la page, mais effacé sa trace.
« J'ai demandé l'indexation et c'est toujours inconnu » : faut-il s'inquiéter ?
Non, pas tout de suite. Après une demande d'indexation via l'outil d'Inspection d'URL, il est normal que le statut reste « inconnue » quelques jours. La documentation de Google le formule clairement : l'indexation prend généralement quelques jours, parfois davantage. La demande place l'URL dans la file, elle ne la fait pas entrer dans l'index du jour au lendemain.
Surtout, ce délai n'est ni un refus ni une sanction. Demander l'indexation, c'est signaler une URL à Google, pas exiger son inscription. Google le rappelle d'ailleurs sans détour : une demande d'indexation ne garantit pas que la page rejoindra l'index. Tant que le statut reste « inconnue » peu après votre demande, vous n'avez aucune raison de conclure à un problème de qualité. Google n'a pas évalué la page : il ne l'a pas encore traitée.
À quel moment cela devient anormal ? Quand le délai s'étire bien au-delà de l'attente raisonnable et qu'une re-soumission ne change rien. Là, le statut « inconnue » cesse d'être une simple attente : il pointe une cause de fond non réglée. Une page introuvable (orpheline, hors sitemap) restera « inconnue » tant que rien ne mène à elle, peu importe le nombre de demandes. Et re-soumettre la même URL chaque jour n'accélère pas le traitement : ce n'est pas le volume de demandes qui décide, c'est la capacité de Google à atteindre puis à juger la page utile.
URL inconnue vs Détectée vs Explorée : ne plus les confondre
Trois statuts décrivent une page « pas dans l'index », mais à trois stades opposés du parcours de Google. La distinction tient à deux questions : Google connaît-il l'URL, et l'a-t-il crawlée ? « Inconnue » répond non aux deux ; Détectée, actuellement non indexée répond oui puis non ; Explorée, actuellement non indexée répond oui aux deux.
| Statut GSC | Google connaît l'URL ? | L'a-t-il crawlée ? | Nature du problème | Levier |
|---|---|---|---|---|
| URL inconnue de Google | Non | Non | Découverte (ou sortie d'index) | Faire découvrir : lien, sitemap, soumission — ou diagnostiquer la régression |
| Détectée, actuellement non indexée | Oui | Non, pas encore | Priorité de crawl | Donner une raison de crawler : maillage, budget de crawl, serveur |
| Explorée, actuellement non indexée | Oui | Oui | Décision d'indexation (souvent la qualité) | Améliorer la page elle-même |
La progression est logique : Google ignore l'URL (« inconnue »), puis la découvre et l'attend en file (« Détectée »), puis la crawle sans l'indexer (« Explorée »). Le piège classique est de plaquer le remède d'un stade sur un autre. Réécrire le contenu d'une page « inconnue » ne sert à rien, puisque Google ne l'a même pas trouvée. À l'inverse, se contenter d'ajouter un lien à une page « Explorée » ignore le vrai problème, qui est une page lue puis écartée. Chaque stade a son levier, et eux seuls.
Identifier les pages concernées à l'échelle
Maintenant que les deux situations sont posées, reste à savoir lesquelles de vos URLs sont concernées, et dans quelle famille elles tombent. L'outil d'Inspection d'URL de la Search Console donne le verdict officiel par adresse, mais une URL à la fois : vous inspectez, vous lisez, vous passez à la suivante. Sur quelques pages, c'est tenable. Pour distinguer, sur des centaines d'URLs, les pages jamais découvertes de celles qui sont retombées en « inconnue » après une régression, l'inspection manuelle ne suffit plus.
C'est le mur que fait sauter IndexProbe : la version en masse de l'outil d'inspection d'URL de Google. Il interroge l'API officielle de la Search Console pour inspecter, en une seule analyse, la liste d'URLs que vous lui fournissez (import CSV, sitemap, copier-coller) ou que vous constituez depuis votre Search Console. Pour chaque page, il renvoie le statut officiel retenu par Google et la date du dernier passage de Googlebot. IndexProbe n'explore pas votre site pour découvrir des URLs : il inspecte celles que vous lui donnez, et celles-là seulement.
L'intérêt, ici, c'est de séparer les deux populations que le libellé « inconnue » réunit à tort. Les pages neuves ou orphelines jamais découvertes appellent un travail d'amorçage. Les pages retombées en « inconnue » après une sortie d'index appellent un diagnostic. Et IndexProbe sait isoler ces secondes : ce sont les pages qui avaient des clics et qui n'ont plus d'impression récente. Une page autrefois positionnée, désormais sans la moindre apparition dans les résultats, trahit une sortie d'index probable, exactement le profil d'une régression silencieuse qu'aucune inspection au cas par cas ne révèle.
Ce que vous tirez de l'analyse dépend de la liste que vous apportez.
- Une sélection de pages stratégiques (vos pages clés, votre sitemap des pages à indexer). Toute page importante qui ressort « inconnue » est un signal immédiat : si elle avait du trafic, c'est une régression à traiter en priorité ; si elle est neuve, c'est une découverte à provoquer. Pas d'extrapolation, le verdict porte sur des pages dont vous connaissez la valeur.
- Un export complet de vos URLs (sitemap entier, export de crawl). La segmentation par type de pages montre où les « inconnues » se concentrent : un nouveau segment encore invisible (découverte) ou un ancien segment qui décroche (régression). La concentration oriente la décision par famille plutôt qu'au cas par cas.
💡 Vous voulez séparer vos pages jamais découvertes de celles qui ont décroché après une sortie d'index ? IndexProbe inspecte votre liste d'URLs via l'API de la Search Console et vous donne la réponse en une analyse. Tester IndexProbe en accès anticipé →
Corriger : deux chemins selon la situation
Maintenant que vous savez quelles URLs sont concernées et dans quelle famille elles tombent, le correctif suit la situation. Une page jamais découverte se corrige par la découverte ; une page sortie de l'index se corrige par le diagnostic. Appliquer l'un à la place de l'autre fait perdre du temps sans rien régler.
Page jamais découverte : provoquer la découverte
L'objectif est simple : donner à Google un chemin vers la page, et un signal qu'elle existe.
- Ajoutez la page au sitemap. Une URL listée dans un sitemap propre, à jour, est l'un des canaux les plus directs pour la faire connaître de Google.
- Maillez-la depuis vos pages déjà indexées. Un lien interne contextuel, posé depuis une page que Googlebot visite souvent, ouvre le chemin de découverte. C'est le levier le plus durable : il ne dépend d'aucune soumission manuelle.
- Unifiez les versions d'URL. Si la page existe en plusieurs variantes (
www/non-www,http/https), choisissez-en une comme canonique et redirigez les autres vers elle en 301. Vous évitez que Google connaisse une version pendant que vous en inspectez une autre, déclarée « inconnue ». Google retient la version servie surhttps, listée au sitemap et confirmée par la baliserel="canonical": faites converger ces trois signaux vers la même adresse. - Levez un éventuel blocage en amont. Si une règle
robots.txtcoupe l'accès à la zone où vit la page, retirez-la pour rétablir un chemin crawlable. - Soumettez les pages prioritaires via l'Inspection d'URL. Pour une poignée de pages, l'outil d'inspection propose un Test en direct (pour vérifier que la page est bien accessible et crawlable) puis « Demander l'indexation ». C'est un coup de pouce ponctuel, jamais une stratégie de masse : sur des centaines d'URLs, ce n'est pas tenable, et re-soumettre en boucle n'apporte rien.
Page sortie de l'index : diagnostiquer avant de re-soumettre
Ici, re-soumettre d'abord est une erreur. Une page que Google a écartée pour une raison de fond reviendra dans l'index, puis en sortira de nouveau, tant que la cause n'est pas traitée.
- Diagnostiquez la perte. Croisez l'historique de la page : depuis quand a-t-elle perdu ses clics, ses impressions, ses positions ? La date du dernier crawl de Google a-t-elle vieilli ? Ce sont ces signaux qui révèlent si la page a glissé hors de l'index par dévaluation ou par raréfaction du crawl.
- Renforcez ou consolidez la page. Si le contenu a été dévalué, mettez-le à jour, étoffez-le, ou fusionnez la page avec une autre plus complète sur le même sujet (avec une redirection 301 vers la version conservée). L'objectif est de redonner à Google une raison de la garder.
- Re-soumettez ensuite seulement. Une fois la cause traitée, demandez l'indexation pour signaler à Google que la page a changé. Cette fois, la re-soumission s'appuie sur une correction réelle, pas sur l'espoir qu'un nouveau passage suffise.
Vérifier que l'URL est repassée connue (et indexée)
Corriger ne suffit pas, il faut confirmer que Google a pris acte. Une URL qui repasse de « inconnue » à connue n'est pas encore au bout du chemin : « connue » signifie seulement que Google a désormais une trace de l'adresse, pas qu'il l'a indexée. L'objectif final reste l'indexation. Entre les deux, la page transite souvent par « Détectée » (connue, en file de crawl) puis « Explorée » (crawlée, en attente de décision).
Réinspectez les URLs traitées après quelques jours, puis suivez leur évolution dans le temps. Une analyse unique ne prouve rien : c'est la comparaison entre un état avant et un état après qui montre le mouvement, qu'il s'agisse d'une page neuve enfin découverte ou d'une page tombée hors index puis remise dedans.
La vue COMPARAISON d'IndexProbe est conçue pour ce suivi : elle met deux analyses en regard et chiffre, par URL, les passages de « inconnue » à « Détectée », « Explorée » puis « indexée ». Un point de vigilance : une page tout juste découverte ne réintègre pas l'index instantanément. Une « inconnue » devenue « Détectée » n'est pas un échec, c'est une étape franchie ; le mouvement compte plus que le statut figé d'une seule analyse.
Questions fréquentes
Que signifie « URL inconnue de Google » dans la Search Console ?
Cela signifie que Google n'a jamais vu cette adresse : aucune trace dans son système, ni dans la file de crawl, ni dans l'index. Ce n'est pas un jugement de qualité, ni un noindex, ni un blocage robots.txt, ni une 404. Dans tous ces autres cas, Google connaît l'URL ; ici, il n'en a aucune trace.
Pourquoi ma page reste-t-elle « inconnue » après une demande d'indexation ? C'est normal les premiers jours : l'indexation prend généralement quelques jours, parfois plus. La demande place l'URL dans la file, elle ne l'indexe pas immédiatement, et ne garantit pas l'indexation. Cela ne devient anormal que si le délai s'étire longuement et qu'une cause de fond (page orpheline, hors sitemap) n'est pas réglée.
Quelle différence entre « inconnue », « Détectée » et « Explorée » ? Pour « inconnue », Google ne connaît pas l'URL et ne l'a pas crawlée. Pour Détectée, actuellement non indexée, il la connaît mais ne l'a pas encore crawlée (problème de priorité de crawl). Pour Explorée, actuellement non indexée, il l'a crawlée puis a choisi de ne pas l'indexer (souvent une question de qualité). Trois stades, trois leviers.
Combien de temps Google met-il à indexer une nouvelle page ? Il n'y a pas de délai garanti. Google indique que l'indexation prend généralement quelques jours après une demande, parfois davantage, et qu'elle n'est jamais certaine. Le délai dépend de la facilité avec laquelle Google atteint la page (maillage, sitemap) et de l'intérêt qu'il lui trouve. Re-soumettre chaque jour n'accélère rien.
« URL inconnue de Google » est-il un problème de qualité ? Non. Google n'a pas lu la page, donc il n'a rien évalué. Le statut décrit une absence de trace, pas une décision sur le contenu. Réécrire une page « inconnue » ne sert à rien : tant qu'elle n'est pas découverte, son contenu n'entre pas en jeu.
Une page indexée peut-elle redevenir « inconnue » ? Oui, cela s'observe. Quand une page sort de l'index (contenu dévalué, crawl raréfié, perte de positions), son URL peut réafficher « inconnue de Google » à l'inspection, comme si elle n'avait jamais existé. C'est une régression, pas un démarrage : le bon réflexe est de diagnostiquer la perte, pas seulement d'ajouter un lien.
Comment vérifier ce statut sur un grand nombre d'URLs ? L'outil d'Inspection d'URL de la Search Console ne traite qu'une URL à la fois. Pour trier à l'échelle, un outil comme IndexProbe inspecte la liste d'URLs que vous lui fournissez via l'API officielle et renvoie, par URL, le statut officiel et la date du dernier passage de Googlebot. Le croisement clics passés / impressions récentes isole les pages retombées en « inconnue » après une sortie d'index.
Cessez de lire « URL inconnue de Google » comme un simple point de départ. IndexProbe se branche sur l'API officielle de la Search Console et inspecte votre liste d'URLs en une seule analyse : statut officiel par URL, date du dernier passage de Googlebot, et croisement clics / impressions récentes. Vous séparez les pages jamais découvertes des pages clés retombées en « inconnue » après une régression, et vous vérifiez d'une analyse à l'autre, grâce à la vue COMPARAISON, qu'elles repassent connues puis indexées.