← Estados de Indexación Google Search Console

seo

"Excluida por la etiqueta noindex": ¿intencionado o error?

Q: «Excluida por la etiqueta noindex», ¿es grave?

No en sí mismo. En la mayoría de los casos es un `noindex` intencionado que cumple su función: acceso, carrito, archivos de etiquetas. Solo se convierte en problema si una página que querías indexar lleva un `noindex` por error.

Q: ¿Por qué mi página está en noindex si no puse nada?

El `noindex` puede venir de un ajuste del CMS aplicado a toda una plantilla, de un plugin, de un resto de preproducción, o de un encabezado HTTP `X-Robots-Tag` puesto a nivel de servidor —invisible en el código fuente de la página. Inspecciona la respuesta HTTP, no solo el HTML.

Q: ¿Cómo quitar un noindex?

Primero encuentra su origen: etiqueta meta en el ` `, o encabezado HTTP `X-Robots-Tag`. Quítala en el lugar correcto (contenido/plantilla/ajuste SEO para la meta; configuración del servidor/CDN para el encabezado), comprueba que ningún bloqueo `robots.txt` impida el nuevo rastreo, y solicita una reinspección.

Q: ¿Por qué mi noindex no desaparece después de quitarlo?

Dos causas frecuentes: o el `noindex` venía en realidad de un encabezado HTTP que no modificaste (quitaste una etiqueta meta inexistente), o la página está bloqueada por el `robots.txt` y Google no puede volver a rastrearla para constatar el cambio.

Q: ¿noindex o robots.txt?

El `noindex` impide la **indexación** (la página puede rastrearse pero no aparece en los resultados): es la herramienta para retirar una página del índice. El `robots.txt` impide el **rastreo** (útil para ahorrar presupuesto de rastreo). Los dos no se combinan: un `noindex` en una página bloqueada al rastreo nunca se verá.

«Excluida por la etiqueta noindex» en Search Console: Google obedeció un noindex. Distingue lo intencionado de lo accidental, detecta el noindex invisible (encabezado HTTP) y corrige a escala.

IndexProbe·17 de junio de 2026·12 min de lectura

"Excluida por la etiqueta noindex": ¿intencionado o error? (Search Console)

Estado «Excluida por la etiqueta noindex»: el noindex puede venir de un encabezado HTTP X-Robots-Tag, invisible en el código fuente HTML

En el informe "Indexación de páginas" de Google Search Console, «Excluida por la etiqueta noindex» es uno de los estados más claros que existen: Google encontró una instrucción de no indexar la página, y la siguió. La mayoría de las veces, es justo lo que querías —páginas de acceso, de carrito, archivos de etiquetas.

El problema empieza cuando la instrucción no era tuya. ¿Cómo detectar, entre cientos de noindex legítimos, la página estratégica desindexada por error? ¿Por qué un noindex sigue activo cuando no lo encuentras en ninguna parte del código de la página? ¿Y qué haces cuando Google ni siquiera ve el noindex que acabas de quitar?

Tres preguntas en las que este estado, en apariencia trivial, se vuelve bastante menos simple.

¿Qué significa "Excluida por la etiqueta noindex"?

Significa que la página lleva una directiva noindex —en una etiqueta meta o en un encabezado HTTP— y Google la respetó: rastreó la página, pero no la añadió a su índice. Es una exclusión voluntaria a nivel de página, y en la mayoría de los casos es intencionada.

A diferencia de un bloqueo robots.txt, que impide el rastreo, el noindex deja que Google rastree la página: lee su contenido, ve la instrucción de no indexarla y la cumple. De hecho, es el método que Google recomienda para mantener una página fuera del índice.

Así que la página no está «rota». Obedece una consigna. Toda la cuestión es saber si esa consigna es realmente la tuya.

¿Intencionado o accidental? Depende de tu intención

No hay una respuesta única: depende de lo que esperabas de la página. Dos casos, dos decisiones opuestas. Mientras no los distingas, no puedes aplicar la corrección correcta.

Caso A: el noindex es intencionado, todo va bien. Páginas de acceso y de cuenta, de carrito y de confirmación de pedido, resultados de búsqueda interna, archivos de etiquetas o de fechas de poco valor, feeds RSS, páginas de agradecimiento… Las pusiste en noindex a propósito para que no aparezcan en Google. Verlas listadas en «Excluida por la etiqueta noindex» es el resultado esperado. No hay nada que corregir.

Caso B: una página útil está en noindex por error. Una página que querías indexar lleva un noindex que no quisiste: un ajuste heredado de una preproducción, un noindex aplicado a toda una plantilla, un plugin mal configurado. Mientras esté ahí, la página nunca se indexará. Aquí el objetivo es quitar el noindex —si consigues encontrarlo.

Distinguir A de B es todo el trabajo. Y antes de corregir el caso B, hay que saber de dónde viene realmente el noindex.

De dónde viene el noindex: etiqueta meta o encabezado HTTP

Un noindex puede estar en dos sitios, y ahí está el origen del error más persistente sobre este estado. El primero es la etiqueta meta, en el <head> de la página:

<meta name="robots" content="noindex">

El segundo es un encabezado HTTP X-Robots-Tag, que el servidor devuelve con la página:

X-Robots-Tag: noindex

Ambos tienen el mismo efecto para Google. Pero el segundo es invisible en el código fuente de la página: abres el HTML, no encuentras ninguna etiqueta noindex, y concluyes que no la hay. Es falso. La instrucción está en la respuesta del servidor, no en el HTML.

Es la trampa clásica: quitas una etiqueta meta que no existe, esperas, y nada cambia. Para evitarla, hay que inspeccionar la respuesta HTTP de la página (los encabezados), no solo su código fuente. La inspección de URL de Search Console sí indica si Google vio un noindex —pero una URL cada vez.

Por qué una página útil acaba en noindex (caso B)

Cuando una página que querías indexar lleva un noindex, casi siempre es un ajuste involuntario. Las causas más frecuentes:

Un resto de preproducción. Durante el desarrollo, el sitio entero suele estar en noindex. Si el ajuste no se retira al publicar, páginas útiles quedan excluidas. En WordPress, es la casilla «Pedir a los motores de búsqueda que no indexen este sitio».
Un noindex aplicado a toda una plantilla. Un ajuste por tipo de contenido (categorías, páginas de autor, una plantilla de página) puede desindexar una familia entera de URLs en bloque, incluidas algunas que querías conservar.
Un plugin o un tema. Una extensión SEO mal configurada, o un tema que inyecta sus propias etiquetas, puede poner un noindex sin que lo sepas.
Un encabezado de servidor o CDN. Una regla X-Robots-Tag a nivel de servidor, proxy inverso o CDN, invisible en el HTML (ver la sección anterior).
Una migración. Al cambiar de CMS o de dominio, las directivas noindex se transfieren o se recrean en páginas que no debían tenerlas.

El punto común: una consigna noindex está activa donde no la querías. Queda encontrar dónde, y en qué páginas.

La trampa: robots.txt y noindex no se combinan

Antes de corregir, un caso particular merece atención, porque bloquea en silencio la mitad de los intentos de corrección: si una página está bloqueada por el robots.txt, Google nunca verá su noindex.

La lógica es implacable: el noindex está en la página (o en su respuesta HTTP); pero el robots.txt impide a Google rastrear la página. Sin rastreo, no hay lectura de la instrucción. Google lo precisa explícitamente: para que un noindex se tenga en cuenta, la página no debe estar bloqueada por el robots.txt.

Esto funciona en ambos sentidos: si quieres desindexar una página, no la bloquees al rastreo a la vez —deja que Google la lea para ver el noindex. Y si quieres indexar una página que lleva un noindex involuntario, comprueba además que no esté bloqueada por el robots.txt. El tema se detalla en «Bloqueada por robots.txt».

Ahora que conoces las causas y los orígenes posibles, identifica con precisión qué páginas están afectadas, antes de decidir qué corregir.

Identificar las páginas afectadas en la lista que analizas

Aquí es donde Search Console muestra su límite: su herramienta de inspección de URL trata una sola URL cada vez. Para saber, página por página, cuál lleva un noindex, de dónde viene (meta o encabezado HTTP) y si la página te importaba, inspeccionas, lees, pasas a la siguiente. Viable con unas pocas páginas. Con cientos, detectar la página estratégica desindexada por error se vuelve impracticable.

Ese es el muro que IndexProbe derriba. IndexProbe es la versión en masa de la herramienta de inspección de URL de Google: consulta la API oficial de Search Console para inspeccionar, en un solo análisis, la lista de URLs que le proporcionas (importación CSV, sitemap, copiar y pegar). Para cada página muestra su estado de indexación, su estado noindex y su origen —etiqueta meta o encabezado HTTP X-Robots-Tag, el segmento de URL y los enlaces internos que recibe.

Lo que obtienes depende de la lista que aportes. IndexProbe no rastrea tu sitio para descubrir URLs: inspecciona las que le das, y solo esas.

Una selección de páginas estratégicas (tus páginas clave, tu sitemap de páginas a indexar). Cualquier página importante que aparezca en noindex es un caso B inmediato: una página que querías indexar, excluida por error. La detectas sin presuponer nada del resto del sitio.
Una exportación completa de tus URLs (sitemap entero, exportación de rastreo…). El desglose por tipo de página muestra entonces dónde se concentra el noindex —una plantilla entera excluida en bloque resalta de inmediato— y el origen (meta vs encabezado HTTP) te dice dónde ir a corregir.

Ver el origen del noindex —etiqueta meta o encabezado HTTP— a escala es algo que ninguna otra herramienta ofrece.

Desglose del estado noindex sobre 10.000 URLs analizadas: indexación permitida, bloqueada por etiqueta meta, bloqueada por encabezado HTTP — Vista IndexProbe — Datos de ejemplo. Estado noindex y su origen (etiqueta meta vs encabezado HTTP) | Vista IndexProbe.

Histograma del estado noindex por segmento del sitio: acceso, cuenta y etiquetas muy en noindex; productos y blog casi nunca — Vista IndexProbe — Datos de ejemplo (análisis de una exportación completa de URLs). Proporción de URLs en noindex, por segmento | Vista IndexProbe.

💡 ¿Quieres saber cuáles de tus URLs están en noindex, de dónde viene la instrucción y si una página estratégica está afectada? IndexProbe inspecciona tu lista de URLs y te da la respuesta en un análisis. Probar IndexProbe en acceso anticipado →

Corregir según el caso

Una vez triadas tus páginas, la corrección depende del caso. No los mezcles: la acción correcta para una página útil es lo opuesto a «no toques nada».

Quitar un noindex involuntario (caso B)

El objetivo es eliminar la directiva noindex allí donde realmente está.

Encuentra el origen. Inspecciona la URL y comprueba si el noindex viene de la etiqueta meta (visible en el HTML) o del encabezado HTTP X-Robots-Tag (visible solo en la respuesta del servidor).
Quítala en el lugar correcto. Una etiqueta meta se retira en el contenido, la plantilla o el ajuste SEO de la página; un encabezado X-Robots-Tag se retira en la configuración del servidor, del proxy o del CDN.
Comprueba que no haya un bloqueo robots.txt en la página: si no, Google nunca volverá a rastrear la página liberada del noindex.
Solicita una reinspección en Search Console, y luego da tiempo a Google para volver a rastrear y reindexar.

Dejar un noindex intencionado (caso A)

Para las páginas que querías excluir, no hay nada que corregir: el estado es el resultado esperado. Aprovecha para comprobar que un ajuste por plantilla no atrapa, de paso, una página que querías conservar.

Según tu CMS

WordPress. Comprueba primero Ajustes → Lectura: la casilla «Pedir a los motores de búsqueda que no indexen este sitio» pone un noindex global, a desmarcar en producción. Para el ajuste por página o por tipo de contenido, usa Yoast SEO, Rank Math o All in One SEO.
Shopify. Las páginas de carrito y de cuenta están en noindex por defecto. Para ajustar un noindex en una plantilla, pasa por las etiquetas del tema (theme.liquid / plantillas); evita desindexar un tipo de página entero sin querer.

"Excluida por noindex" vs "Bloqueada por robots.txt" vs "Indexada aunque bloqueada"

Tres estados de Search Console se parecen y se resuelven de forma muy distinta. La guía rápida:

Estado GSC	De dónde viene la exclusión	¿Indexada?	Acción
Excluida por la etiqueta 'noindex'	directiva `noindex` (meta o encabezado HTTP)	No	Nada si es intencionado; quitar el `noindex` si es una página útil
Bloqueada por robots.txt	`robots.txt` (rastreo prohibido)	No	Nada si es intencionado; desbloquear si hay una página útil atrapada
Indexada aunque bloqueada por robots.txt	`robots.txt`, pero URL encontrada en otro sitio	Sí	Desbloquear y luego `noindex` para desindexar

Cada uno tiene su lógica: el primero excluye a nivel de página (Google leyó la consigna), el segundo impide el rastreo, el tercero revela que el bloqueo no bastó. Confundirlos es aplicar la corrección equivocada. Véase «Bloqueada por robots.txt» e «Indexada aunque bloqueada».

Comprobar que la corrección funcionó

Tras quitar el noindex de tus páginas del caso B, confirma a escala que Google volvió a rastrear. Reinspecciona tus URLs y compara dos análisis en el tiempo: las páginas que corregiste deben salir del estado «Excluida por la etiqueta noindex» y luego pasar a indexadas.

Vista Comparación de IndexProbe antes/después: el estado Excluida por la etiqueta noindex baja de 220 a 40 URLs tras quitar los noindex involuntarios — Vista IndexProbe — Datos de ejemplo. Evolución del estado entre dos análisis, tras triaje y retirada de los noindex involuntarios | Vista IndexProbe.

Es el ciclo completo: entender que el noindex suele ser intencionado, triar A/B, encontrar el verdadero origen (meta o encabezado), corregir, comprobar.

Preguntas frecuentes

«Excluida por la etiqueta noindex», ¿es grave? No en sí mismo. En la mayoría de los casos es un noindex intencionado que cumple su función: acceso, carrito, archivos de etiquetas. Solo se convierte en problema si una página que querías indexar lleva un noindex por error.

¿Por qué mi página está en noindex si no puse nada? El noindex puede venir de un ajuste del CMS aplicado a toda una plantilla, de un plugin, de un resto de preproducción, o de un encabezado HTTP X-Robots-Tag puesto a nivel de servidor —invisible en el código fuente de la página. Inspecciona la respuesta HTTP, no solo el HTML.

¿Cómo quitar un noindex? Primero encuentra su origen: etiqueta meta en el <head>, o encabezado HTTP X-Robots-Tag. Quítala en el lugar correcto (contenido/plantilla/ajuste SEO para la meta; configuración del servidor/CDN para el encabezado), comprueba que ningún bloqueo robots.txt impida el nuevo rastreo, y solicita una reinspección.

¿Por qué mi noindex no desaparece después de quitarlo? Dos causas frecuentes: o el noindex venía en realidad de un encabezado HTTP que no modificaste (quitaste una etiqueta meta inexistente), o la página está bloqueada por el robots.txt y Google no puede volver a rastrearla para constatar el cambio.

¿noindex o robots.txt? El noindex impide la indexación (la página puede rastrearse pero no aparece en los resultados): es la herramienta para retirar una página del índice. El robots.txt impide el rastreo (útil para ahorrar presupuesto de rastreo). Los dos no se combinan: un noindex en una página bloqueada al rastreo nunca se verá.

¿Cómo comprobar este estado en un gran número de URLs? La inspección de URL de Search Console trata una URL cada vez. Para triar a escala, una herramienta como IndexProbe inspecciona la lista de URLs que le proporcionas (CSV, sitemap) y muestra, para cada una, el estado de indexación, el estado noindex y su origen (meta o encabezado HTTP).

Deja de buscar un noindex que no ves. IndexProbe se conecta a la API oficial de Search Console e inspecciona tu lista de URLs en un solo análisis: estado de indexación, estado noindex y su origen (etiqueta meta o encabezado HTTP), por segmento. En minutos separas las exclusiones intencionadas de las páginas útiles desindexadas por error, y verificas tus correcciones de un análisis al siguiente.

Probar IndexProbe en acceso anticipado →