"Excluida por la etiqueta noindex": ¿intencionado o error? (Search Console)

En el informe "Indexación de páginas" de Google Search Console, «Excluida por la etiqueta noindex» es uno de los estados más claros que existen: Google encontró una instrucción de no indexar la página, y la siguió. La mayoría de las veces, es justo lo que querías —páginas de acceso, de carrito, archivos de etiquetas.
El problema empieza cuando la instrucción no era tuya. ¿Cómo detectar, entre cientos de noindex legítimos, la página estratégica desindexada por error? ¿Por qué un noindex sigue activo cuando no lo encuentras en ninguna parte del código de la página? ¿Y qué haces cuando Google ni siquiera ve el noindex que acabas de quitar?
Tres preguntas en las que este estado, en apariencia trivial, se vuelve bastante menos simple.
¿Qué significa "Excluida por la etiqueta noindex"?
Significa que la página lleva una directiva noindex —en una etiqueta meta o en un encabezado HTTP— y Google la respetó: rastreó la página, pero no la añadió a su índice. Es una exclusión voluntaria a nivel de página, y en la mayoría de los casos es intencionada.
A diferencia de un bloqueo robots.txt, que impide el rastreo, el noindex deja que Google rastree la página: lee su contenido, ve la instrucción de no indexarla y la cumple. De hecho, es el método que Google recomienda para mantener una página fuera del índice.
Así que la página no está «rota». Obedece una consigna. Toda la cuestión es saber si esa consigna es realmente la tuya.
¿Intencionado o accidental? Depende de tu intención
No hay una respuesta única: depende de lo que esperabas de la página. Dos casos, dos decisiones opuestas. Mientras no los distingas, no puedes aplicar la corrección correcta.
Caso A: el noindex es intencionado, todo va bien. Páginas de acceso y de cuenta, de carrito y de confirmación de pedido, resultados de búsqueda interna, archivos de etiquetas o de fechas de poco valor, feeds RSS, páginas de agradecimiento… Las pusiste en noindex a propósito para que no aparezcan en Google. Verlas listadas en «Excluida por la etiqueta noindex» es el resultado esperado. No hay nada que corregir.
Caso B: una página útil está en noindex por error. Una página que querías indexar lleva un noindex que no quisiste: un ajuste heredado de una preproducción, un noindex aplicado a toda una plantilla, un plugin mal configurado. Mientras esté ahí, la página nunca se indexará. Aquí el objetivo es quitar el noindex —si consigues encontrarlo.
Distinguir A de B es todo el trabajo. Y antes de corregir el caso B, hay que saber de dónde viene realmente el noindex.
De dónde viene el noindex: etiqueta meta o encabezado HTTP
Un noindex puede estar en dos sitios, y ahí está el origen del error más persistente sobre este estado. El primero es la etiqueta meta, en el <head> de la página:
<meta name="robots" content="noindex">
El segundo es un encabezado HTTP X-Robots-Tag, que el servidor devuelve con la página:
X-Robots-Tag: noindex
Ambos tienen el mismo efecto para Google. Pero el segundo es invisible en el código fuente de la página: abres el HTML, no encuentras ninguna etiqueta noindex, y concluyes que no la hay. Es falso. La instrucción está en la respuesta del servidor, no en el HTML.
Es la trampa clásica: quitas una etiqueta meta que no existe, esperas, y nada cambia. Para evitarla, hay que inspeccionar la respuesta HTTP de la página (los encabezados), no solo su código fuente. La inspección de URL de Search Console sí indica si Google vio un noindex —pero una URL cada vez.
Por qué una página útil acaba en noindex (caso B)
Cuando una página que querías indexar lleva un noindex, casi siempre es un ajuste involuntario. Las causas más frecuentes:
- Un resto de preproducción. Durante el desarrollo, el sitio entero suele estar en
noindex. Si el ajuste no se retira al publicar, páginas útiles quedan excluidas. En WordPress, es la casilla «Pedir a los motores de búsqueda que no indexen este sitio». - Un noindex aplicado a toda una plantilla. Un ajuste por tipo de contenido (categorías, páginas de autor, una plantilla de página) puede desindexar una familia entera de URLs en bloque, incluidas algunas que querías conservar.
- Un plugin o un tema. Una extensión SEO mal configurada, o un tema que inyecta sus propias etiquetas, puede poner un
noindexsin que lo sepas. - Un encabezado de servidor o CDN. Una regla
X-Robots-Taga nivel de servidor, proxy inverso o CDN, invisible en el HTML (ver la sección anterior). - Una migración. Al cambiar de CMS o de dominio, las directivas
noindexse transfieren o se recrean en páginas que no debían tenerlas.
El punto común: una consigna noindex está activa donde no la querías. Queda encontrar dónde, y en qué páginas.
La trampa: robots.txt y noindex no se combinan
Antes de corregir, un caso particular merece atención, porque bloquea en silencio la mitad de los intentos de corrección: si una página está bloqueada por el robots.txt, Google nunca verá su noindex.
La lógica es implacable: el noindex está en la página (o en su respuesta HTTP); pero el robots.txt impide a Google rastrear la página. Sin rastreo, no hay lectura de la instrucción. Google lo precisa explícitamente: para que un noindex se tenga en cuenta, la página no debe estar bloqueada por el robots.txt.
Esto funciona en ambos sentidos: si quieres desindexar una página, no la bloquees al rastreo a la vez —deja que Google la lea para ver el noindex. Y si quieres indexar una página que lleva un noindex involuntario, comprueba además que no esté bloqueada por el robots.txt. El tema se detalla en «Bloqueada por robots.txt».
Ahora que conoces las causas y los orígenes posibles, identifica con precisión qué páginas están afectadas, antes de decidir qué corregir.
Identificar las páginas afectadas en la lista que analizas
Aquí es donde Search Console muestra su límite: su herramienta de inspección de URL trata una sola URL cada vez. Para saber, página por página, cuál lleva un noindex, de dónde viene (meta o encabezado HTTP) y si la página te importaba, inspeccionas, lees, pasas a la siguiente. Viable con unas pocas páginas. Con cientos, detectar la página estratégica desindexada por error se vuelve impracticable.
Ese es el muro que IndexProbe derriba. IndexProbe es la versión en masa de la herramienta de inspección de URL de Google: consulta la API oficial de Search Console para inspeccionar, en un solo análisis, la lista de URLs que le proporcionas (importación CSV, sitemap, copiar y pegar). Para cada página muestra su estado de indexación, su estado noindex y su origen —etiqueta meta o encabezado HTTP X-Robots-Tag, el segmento de URL y los enlaces internos que recibe.
Lo que obtienes depende de la lista que aportes. IndexProbe no rastrea tu sitio para descubrir URLs: inspecciona las que le das, y solo esas.
- Una selección de páginas estratégicas (tus páginas clave, tu sitemap de páginas a indexar). Cualquier página importante que aparezca en
noindexes un caso B inmediato: una página que querías indexar, excluida por error. La detectas sin presuponer nada del resto del sitio. - Una exportación completa de tus URLs (sitemap entero, exportación de rastreo…). El desglose por tipo de página muestra entonces dónde se concentra el noindex —una plantilla entera excluida en bloque resalta de inmediato— y el origen (meta vs encabezado HTTP) te dice dónde ir a corregir.
Ver el origen del noindex —etiqueta meta o encabezado HTTP— a escala es algo que ninguna otra herramienta ofrece.
💡 ¿Quieres saber cuáles de tus URLs están en noindex, de dónde viene la instrucción y si una página estratégica está afectada? IndexProbe inspecciona tu lista de URLs y te da la respuesta en un análisis. Probar IndexProbe en acceso anticipado →
Corregir según el caso
Una vez triadas tus páginas, la corrección depende del caso. No los mezcles: la acción correcta para una página útil es lo opuesto a «no toques nada».
Quitar un noindex involuntario (caso B)
El objetivo es eliminar la directiva noindex allí donde realmente está.
- Encuentra el origen. Inspecciona la URL y comprueba si el
noindexviene de la etiqueta meta (visible en el HTML) o del encabezado HTTPX-Robots-Tag(visible solo en la respuesta del servidor). - Quítala en el lugar correcto. Una etiqueta meta se retira en el contenido, la plantilla o el ajuste SEO de la página; un encabezado
X-Robots-Tagse retira en la configuración del servidor, del proxy o del CDN. - Comprueba que no haya un bloqueo
robots.txten la página: si no, Google nunca volverá a rastrear la página liberada del noindex. - Solicita una reinspección en Search Console, y luego da tiempo a Google para volver a rastrear y reindexar.
Dejar un noindex intencionado (caso A)
Para las páginas que querías excluir, no hay nada que corregir: el estado es el resultado esperado. Aprovecha para comprobar que un ajuste por plantilla no atrapa, de paso, una página que querías conservar.
Según tu CMS
- WordPress. Comprueba primero Ajustes → Lectura: la casilla «Pedir a los motores de búsqueda que no indexen este sitio» pone un
noindexglobal, a desmarcar en producción. Para el ajuste por página o por tipo de contenido, usa Yoast SEO, Rank Math o All in One SEO. - Shopify. Las páginas de carrito y de cuenta están en
noindexpor defecto. Para ajustar unnoindexen una plantilla, pasa por las etiquetas del tema (theme.liquid/ plantillas); evita desindexar un tipo de página entero sin querer.
"Excluida por noindex" vs "Bloqueada por robots.txt" vs "Indexada aunque bloqueada"
Tres estados de Search Console se parecen y se resuelven de forma muy distinta. La guía rápida:
| Estado GSC | De dónde viene la exclusión | ¿Indexada? | Acción |
|---|---|---|---|
| Excluida por la etiqueta 'noindex' | directiva noindex (meta o encabezado HTTP) |
No | Nada si es intencionado; quitar el noindex si es una página útil |
| Bloqueada por robots.txt | robots.txt (rastreo prohibido) |
No | Nada si es intencionado; desbloquear si hay una página útil atrapada |
| Indexada aunque bloqueada por robots.txt | robots.txt, pero URL encontrada en otro sitio |
Sí | Desbloquear y luego noindex para desindexar |
Cada uno tiene su lógica: el primero excluye a nivel de página (Google leyó la consigna), el segundo impide el rastreo, el tercero revela que el bloqueo no bastó. Confundirlos es aplicar la corrección equivocada. Véase «Bloqueada por robots.txt» e «Indexada aunque bloqueada».
Comprobar que la corrección funcionó
Tras quitar el noindex de tus páginas del caso B, confirma a escala que Google volvió a rastrear. Reinspecciona tus URLs y compara dos análisis en el tiempo: las páginas que corregiste deben salir del estado «Excluida por la etiqueta noindex» y luego pasar a indexadas.
Es el ciclo completo: entender que el noindex suele ser intencionado, triar A/B, encontrar el verdadero origen (meta o encabezado), corregir, comprobar.
Preguntas frecuentes
«Excluida por la etiqueta noindex», ¿es grave?
No en sí mismo. En la mayoría de los casos es un noindex intencionado que cumple su función: acceso, carrito, archivos de etiquetas. Solo se convierte en problema si una página que querías indexar lleva un noindex por error.
¿Por qué mi página está en noindex si no puse nada?
El noindex puede venir de un ajuste del CMS aplicado a toda una plantilla, de un plugin, de un resto de preproducción, o de un encabezado HTTP X-Robots-Tag puesto a nivel de servidor —invisible en el código fuente de la página. Inspecciona la respuesta HTTP, no solo el HTML.
¿Cómo quitar un noindex?
Primero encuentra su origen: etiqueta meta en el <head>, o encabezado HTTP X-Robots-Tag. Quítala en el lugar correcto (contenido/plantilla/ajuste SEO para la meta; configuración del servidor/CDN para el encabezado), comprueba que ningún bloqueo robots.txt impida el nuevo rastreo, y solicita una reinspección.
¿Por qué mi noindex no desaparece después de quitarlo?
Dos causas frecuentes: o el noindex venía en realidad de un encabezado HTTP que no modificaste (quitaste una etiqueta meta inexistente), o la página está bloqueada por el robots.txt y Google no puede volver a rastrearla para constatar el cambio.
¿noindex o robots.txt?
El noindex impide la indexación (la página puede rastrearse pero no aparece en los resultados): es la herramienta para retirar una página del índice. El robots.txt impide el rastreo (útil para ahorrar presupuesto de rastreo). Los dos no se combinan: un noindex en una página bloqueada al rastreo nunca se verá.
¿Cómo comprobar este estado en un gran número de URLs? La inspección de URL de Search Console trata una URL cada vez. Para triar a escala, una herramienta como IndexProbe inspecciona la lista de URLs que le proporcionas (CSV, sitemap) y muestra, para cada una, el estado de indexación, el estado noindex y su origen (meta o encabezado HTTP).
Deja de buscar un noindex que no ves. IndexProbe se conecta a la API oficial de Search Console e inspecciona tu lista de URLs en un solo análisis: estado de indexación, estado noindex y su origen (etiqueta meta o encabezado HTTP), por segmento. En minutos separas las exclusiones intencionadas de las páginas útiles desindexadas por error, y verificas tus correcciones de un análisis al siguiente.