Página duplicada sin URL canónica seleccionada por el usuario: causas, soluciones y corrección (Search Console)
Abres el informe de indexación de Google Search Console y, en la columna "No indexadas", te encuentras esto: "Página duplicada sin URL canónica seleccionada por el usuario". Decenas, a veces cientos de URLs listadas.
Primera reacción: pánico. Segunda reacción: confusión, porque no ves por qué esas páginas serían duplicadas.
Es uno de los errores de GSC menos comprendidos — no porque sea complejo, sino porque su nombre oculta lo que realmente está pasando.
Qué significa realmente este error
Cuando Google rastrea tu sitio, compara las páginas entre sí. Si dos URLs le parecen suficientemente similares — mismo contenido, misma estructura, diferencia mínima en la URL — las considera duplicados. Entonces debe decidir cuál indexar.
Normalmente, eres tú quien le dice qué versión es la "correcta": ese es el papel de la etiqueta rel="canonical". Pero si no has añadido ninguna, Google hace su propia elección. Y eso es exactamente lo que te dice el mensaje: no has expresado ninguna preferencia, así que Google ha elegido por su cuenta.
No es necesariamente una catástrofe. Google suele elegir la URL correcta. Pero a veces se equivoca — y aunque acierte, pierdes el control sobre tu indexación.
El error que no debes confundir
En GSC existe otro error con un nombre muy parecido: "Página duplicada: Google no eligió la misma URL canónica que el usuario". La distinción es importante.
| Error | Qué ocurre |
|---|---|
| Página duplicada sin URL canónica seleccionada por el usuario | No has declarado ninguna canonical. Google ha elegido por su cuenta. |
| Página duplicada: Google no eligió la misma URL canónica que el usuario | Has declarado una canonical, pero Google la ignoró e indexó otra versión. |
El primero se corrige añadiendo una etiqueta canonical. El segundo indica un problema más profundo: Google cree que tu canonical es incorrecta, y tiene sus razones. Ambos merecen un tratamiento diferente — y muchos artículos los tratan como si fueran lo mismo, lo que genera confusión.
Cómo detecta Google las páginas duplicadas
Google no compara las URLs entre sí palabra por palabra. Analiza el contenido de cada página y construye una huella semántica. Dos páginas con URLs diferentes pero contenido idéntico (o casi idéntico) serán tratadas como duplicados.
Las señales que tiene en cuenta:
- El contenido textual: el indicador principal. Si dos páginas tienen el mismo texto principal, los mismos títulos, las mismas descripciones de producto, Google las agrupa.
- Los enlaces internos: si tu sitio apunta indistintamente a
/producto/y/producto(sin barra final), es una señal de duplicado. - El sitemap: si las dos versiones de una URL aparecen en tu sitemap.xml, tú mismo estás indicando que ambas existen.
- Las redirecciones ausentes: una página accesible tanto en HTTP como en HTTPS sin redirección de una hacia la otra crea dos versiones indexables del mismo contenido.
Lo que hace Google a continuación: agrupa esas URLs en un "cluster" de duplicados y elige una URL canónica entre ellas. La que elige queda indexada. Las demás aparecen en GSC bajo el error que nos interesa.
Las 6 causas más frecuentes
Este error aparece cuando Google detecta dos URLs con el mismo contenido y ninguna etiqueta canonical le indica cuál conservar. En la gran mayoría de casos, es un problema técnico de configuración — barra final, HTTP/HTTPS, www, parámetros de URL — no un duplicado de contenido intencional. A veces varias causas coexisten en el mismo sitio.
1. La barra final: /pagina/ vs /pagina
Probablemente la causa número uno en los sitios WordPress. /about/ y /about son dos URLs técnicamente distintas. Si tu servidor responde a las dos sin redirección de una hacia la otra, Google ve dos páginas con el mismo contenido.
La solución: elige una convención (con o sin barra final), redirige sistemáticamente la otra versión, y asegúrate de que tus enlaces internos sean coherentes.
2. HTTP vs HTTPS
Si tu sitio es accesible en HTTPS pero la versión HTTP todavía responde (incluso con un código 200), Google puede rastrear las dos. Debe existir una redirección 301 de todo HTTP hacia HTTPS, y si migraste recientemente, puede haber residuos.
Para verificarlo: escribe http://tusitioweb.com en un navegador. Si no eres redirigido inmediatamente a HTTPS, hay que corregirlo.
3. www vs sin www
Mismo problema, misma lógica. www.tusitioweb.com y tusitioweb.com son dos dominios diferentes a ojos de Google. Uno debe redirigir al otro — y esta regla debe aplicarse antes de cualquier otro procesamiento en la configuración de tu servidor o tu CDN.
4. Parámetros de URL
Aquí es donde se complica. Los parámetros UTM (?utm_source=newsletter), los parámetros de sesión (?sessionid=abc123), los parámetros de ordenación y filtrado (?sort=price&order=asc) — todos crean URLs únicas con el mismo contenido.
Un sitio de comercio electrónico con 500 productos y 10 combinaciones de filtros puede generar 5.000 URLs distintas que apuntan todas a las mismas páginas. Google rastreará una buena parte de estas URLs antes de darse cuenta de que son idénticas.
Las canonicals apuntando a la URL limpia (sin parámetros) son la solución estándar. En algunos CMS, también puedes configurar estos parámetros directamente en GSC mediante los "Parámetros de URL" — aunque esta funcionalidad ha sido deprecada y solo aplica a cuentas antiguas.
5. La paginación
/blog/page/2/, /blog/?page=2, /blog/2/: tres formas habituales de paginar según el CMS y el tema. Si tu sitio cambió de estructura en algún momento, o si tienes varios plugins de paginación activos, puedes encontrarte con los dos formatos accesibles simultáneamente.
La paginación es también un caso especial porque estas páginas no deben apuntar necesariamente a la página 1 como canonical — es un error frecuente. Cada página de paginación es una página distinta con su propio contenido. Lo que debe existir es coherencia en la URL utilizada para acceder a ellas.
6. Variantes de seguimiento y de sesión
Los parámetros de sesión son especialmente problemáticos en los sitios de comercio electrónico más antiguos: ?PHPSESSID=... o ?sid=... añadidos automáticamente a cada URL para los usuarios no autenticados. Cada sesión crea una URL única. Google puede indexar miles de estas variantes antes de que te des cuenta.
Identificar todas las URLs afectadas — sin hacerlo una por una
Aquí es donde GSC muestra sus limitaciones. El informe de indexación te dice que algunas páginas tienen este estado, pero no puedes extraer fácilmente una lista completa, ni saber qué URL eligió Google como canónica en lugar de cada duplicado.
Para eso, tienes dos opciones.
La API URL Inspection de Google te permite consultar el estado de indexación de una URL concreta — lo que Google tiene indexado, qué canonical ha conservado, cuándo rastreó la página. Es la herramienta más fiable porque devuelve los mismos datos que ves en GSC escribiendo una URL a mano. El problema: el límite es de 2.000 peticiones por día y por propiedad de GSC. En un sitio de 50.000 URLs, eso son 25 días de análisis.
IndexProbe resuelve este problema de cuota. Se conecta a tu propiedad de GSC, distribuye las peticiones automáticamente a lo largo de varios días, y te da para cada URL: el estado de indexación, la canonical que Google ha conservado, la fecha del último rastreo. Puedes filtrar por estado y exportar todas las "páginas duplicadas sin URL canónica" de una vez, para tratarlas en bloque.
Si solo tienes un puñado de URLs que verificar, el inspector de URLs de GSC es suficiente. En cuanto trabajas con un sitio de tamaño medio, la inspección manual URL por URL no es una estrategia viable.
¿Qué corrección elegir?
La corrección depende de la naturaleza del duplicado. Si la URL duplicada no debería existir (versión HTTP de un sitio HTTPS, URL con parámetro de sesión), opta por una redirección 301. Si las dos URLs son legítimas pero una es la preferida, usa una etiqueta canonical. Si la página no debe indexarse pero debe permanecer accesible, usa noindex — nunca los dos a la vez.
La tabla siguiente resume las situaciones más habituales:
| Situación | Solución recomendada |
|---|---|
| Dos URLs idénticas, una es la "real", la otra es un artefacto técnico | Redirección 301 del artefacto hacia la real |
Dos formatos de URL para la misma página paginada (ej.: /pagina/2/ vs /?page=2) |
Redirección 301 hacia el formato elegido, o canonical autorreferenciada hacia ese formato — nunca hacia la página 1 |
| Página que no quieres indexar, pero que debe permanecer accesible | Atributo noindex |
| Dos páginas con contenido casi idéntico, ambas de escasa importancia | Consolidación: fusionar el contenido, redirigir una hacia la otra |
| Parámetros de URL que varían sin cambiar el contenido | Canonical hacia la versión sin parámetros |
Opción 1 — La etiqueta rel="canonical"
Es la solución recomendada por Google en la mayoría de casos. Se añade en el <head> de cada página que es un duplicado:
<link rel="canonical" href="https://www.tusitioweb.com/la-url-real/" />
Algunas reglas a respetar:
- Siempre en URL absoluta (no relativa)
- Una sola etiqueta canonical por página
- Debe apuntar a una URL que responda con 200 (no una redirección, no una página 404)
- Debe estar en el
<head>, no en el<body>
La etiqueta canonical es una señal, no una directiva. Google puede decidir ignorarla si considera que es incorrecta o contradictoria con otras señales. Si Google ignora la tuya, a menudo es porque tienes otras señales contradictorias (enlaces internos hacia las dos versiones, las dos en el sitemap, etc.).
Opción 2 — La redirección 301
Cuando la URL duplicada realmente no debería existir — una versión HTTP de una página solo accesible en HTTPS, o una URL con parámetro de sesión — la redirección 301 es más limpia. Consolida el PageRank, elimina definitivamente el duplicado, y Google ya no tiene que "elegir".
El inconveniente: si hay enlaces externos apuntando a la versión redirigida, perderás un mínimo porcentaje del valor transmitido en cada salto. En la práctica, para redirecciones en cadena simple (A → B), es despreciable.
Opción 3 — El atributo noindex
Usar con moderación. noindex impide que Google indexe la página, pero Googlebot sigue rastreándola para descubrir los enlaces que contiene. Es pertinente para páginas de filtrado o de ordenación que quieres mantener accesibles para los usuarios sin que aparezcan en los resultados de búsqueda.
Atención: noindex y canonical no hacen lo mismo. Una página con noindex no será indexada. Una página con una canonical que apunta a otra URL será tratada como duplicado de esa. Pon las dos en la misma página y estarás enviando señales contradictorias — ver la sección de errores a evitar.
Opción 4 — La consolidación de contenido
A veces la respuesta correcta es fusionar dos páginas en una. Si tienes dos artículos sobre temas muy parecidos, o dos páginas de producto para variantes muy similares, agruparlas en una sola página más completa es generalmente mejor para el SEO y para la experiencia de usuario.
Cuándo NO añadir una canonical
Es el caso que nadie menciona. Si tienes una página de resultados de búsqueda interna, una página de carrito, o una página de confirmación de pedido que aparece en este informe — no añadas una canonical. Estas páginas simplemente deben tener un noindex. Añadir una canonical hacia la página de inicio, por ejemplo, solo genera confusión.
Del mismo modo, en una página de inicio de versión multilingüe, apuntar la canonical de /es/ hacia / porque es "la real" puede ser contraproducente si gestionas correctamente el hreflang. Las dos deben coexistir.
Los errores a evitar al corregir
Canonical apuntando a una redirección
Es el error más común después de una migración. Has declarado una canonical hacia http://tusitioweb.com/pagina/, pero esa URL ahora redirige a https://www.tusitioweb.com/pagina/. Google sigue la redirección y ve la página correcta, pero tu señal está diluida. Actualiza siempre tus canonicals para que apunten a la URL final, no a una URL intermedia.
La cadena de canonicals
La página A declara una canonical hacia la página B. La página B declara una canonical hacia la página C. Google sigue la cadena, pero con menos confianza. Si encuentras cadenas de canonicals al auditar tu sitio, acórtalas: A debe apuntar directamente a C.
noindex + canonical en la misma página
Estas dos directivas se contradicen. La canonical dice "esta página es un duplicado de X, indexa X". El noindex dice "no indexes esta página". Google tiene que elegir — y generalmente opta por respetar el noindex. Resultado: ni tu página ni el destino de la canonical serán necesariamente indexados como deseas. Elige una u otra.
La etiqueta canonical en el <body>
Será ignorada por Google. Debe estar obligatoriamente en la sección <head>. En algunos CMS o constructores de páginas, comprueba que tu plugin o tema no mueva las etiquetas al lugar equivocado durante el renderizado.
La URL relativa en lugar de la URL absoluta
<!-- Evitar -->
<link rel="canonical" href="/pagina/" />
<!-- Correcto -->
<link rel="canonical" href="https://www.tusitioweb.com/pagina/" />
La URL relativa puede interpretarse de forma diferente según el contexto. Usa siempre la URL completa, con protocolo y dominio.
Casos especiales
Comercio electrónico: filtros, ordenación y facetas
Es el escenario más complejo. Un sitio con filtros de categoría puede generar miles de URLs distintas para los mismos productos: /zapatillas/?color=negro&talla=42&marca=nike. Cada combinación es una URL única.
La estrategia estándar: cada página filtrada declara una canonical apuntando a la URL de categoría limpia (/zapatillas/). Para que sea eficaz, hay que asegurarse de que estas páginas filtradas tampoco estén en el sitemap y de que los enlaces de paginación en las páginas filtradas no se sigan.
En Shopify, la plataforma añade automáticamente canonicals en las páginas de colección filtradas — pero los parámetros UTM añadidos por tus campañas de marketing no están cubiertos por este mecanismo. En WooCommerce, debes configurar tú mismo tu plugin SEO para gestionar estos casos.
Sitios multilingües: canonical y hreflang no hacen lo mismo
Mucha gente los confunde, y es comprensible. El hreflang le dice a Google cuáles son las versiones lingüísticas de tu página. La canonical le dice cuál indexar entre duplicados.
En un sitio multilingüe, cada versión lingüística debe declararse a sí misma como canonical (/es/pagina/ → canonical /es/pagina/), mientras indica mediante hreflang las otras versiones idiomáticas. Si apuntas la canonical de /es/pagina/ hacia /en/pagina/, estás indicando a Google que tu página en español es un duplicado de la página en inglés — y dejará de mostrársela a los usuarios de habla hispana.
Next.js y los frameworks headless
En Next.js (App Router), la canonical se gestiona mediante la función generateMetadata o directamente en el objeto metadata de una página:
export const metadata: Metadata = {
alternates: {
canonical: 'https://www.tusitioweb.com/pagina/',
},
}
La ventaja de los frameworks modernos: puedes generar la canonical dinámicamente a partir de la URL de la página, lo que elimina los errores manuales. El inconveniente: si tu aplicación genera URLs con query strings por razones internas (ordenación, filtros, estado de la interfaz), esos parámetros pueden acabar en la canonical si no los filtras explícitamente.
Verifica también que tu next.config.js no genere versiones _next/ o prefijos de idioma que creen duplicados inesperados.
WordPress
Con Yoast SEO o Rank Math, la canonical se genera automáticamente para cada página — generalmente de forma correcta. Los problemas surgen cuando:
- Tienes varios plugins SEO activos al mismo tiempo (cada uno puede generar su propia etiqueta canonical)
- Tu tema añade manualmente una etiqueta canonical en su plantilla
- Has cambiado la estructura de permalinks sin redirigir las URLs antiguas
Para comprobar lo que tu página envía realmente a Google, usa "Ver código fuente" y busca rel="canonical". Si encuentras varias, hay un problema.
¿Cuánto tiempo tarda Google en reprocesar la corrección?
Es la pregunta que todo el mundo hace y que nadie responde en los artículos sobre este tema. La respuesta honesta: depende.
Para un sitio bien rastreado (dominio consolidado, muchos enlaces, sitemap XML actualizado): las correcciones suelen aparecer en GSC entre 1 y 4 semanas después de la implementación. Google vuelve a rastrear las páginas afectadas, actualiza su índice, y el informe de indexación refleja los cambios.
Para un sitio poco rastreado (sitio reciente, pocos enlaces, baja frecuencia de rastreo): cuenta de 4 a 8 semanas, a veces más. Puedes acelerar el proceso enviando las URLs corregidas mediante la herramienta de Inspección de URL en GSC ("Solicitar indexación").
Lo que no hay que esperar: que los errores desaparezcan del informe en pocos días. GSC tiene su propio retraso de visualización, y aunque Google haya vuelto a rastrear y actualizado su índice, el informe puede tardar algunos días adicionales en reflejar la situación real.
Cómo verificar que ha funcionado:
- En GSC, ve a "Inspección de URL" e introduce la URL que has corregido
- Comprueba "URL canónica declarada por el usuario" y "URL canónica de Google" — deben coincidir
- Si todavía no coinciden, no es necesariamente un problema si el rastreo es anterior a tu corrección
Si después de 6 semanas Google sigue ignorando tu canonical, es una señal de que hay otros factores contradictorios que investigar.
Preguntas frecuentes
¿Qué es una URL canónica?
La etiqueta rel="canonical" es un elemento HTML que colocas en el <head> de una página para decirle a Google qué versión indexar entre varias URLs con contenido similar. Ejemplo: /producto/, /producto y /producto?ref=newsletter son tres URLs distintas para el mismo contenido — la canonical señala cuál es la "correcta" y concentra el valor SEO en ella. Sin canonical, Google decide por su cuenta. Eso es lo que señala el error que nos interesa.
¿Este error penaliza directamente mi posicionamiento?
No directamente. No es una penalización manual. El impacto real es indirecto: Google indexa una versión de tu página que quizás no es la que deseas, y si tienes enlaces apuntando a varias versiones de la misma URL, su valor se diluye entre esas versiones. En un sitio con decenas de URLs afectadas, el efecto acumulado puede ser significativo.
¿Hay que corregirlo todo a la vez?
No. Prioriza las páginas importantes: las páginas que generan tráfico, las páginas objetivo de tus campañas, las páginas con enlaces externos. Las páginas de escaso valor (páginas de etiquetas, archivos de fechas, variantes de parámetros UTM) pueden esperar o gestionarse en bloque mediante una regla de redirección o de canonical programática.
¿Puede Google ignorar mi etiqueta canonical?
Sí. Google trata la canonical como una señal fuerte, pero no como una directiva absoluta (al contrario que noindex). Si considera que tu canonical es incorrecta — porque apunta a una página redirigida, o porque el contenido de las dos páginas es demasiado diferente para ser duplicados — puede ignorar tu sugerencia. Eso es lo que significa el error "Página duplicada: Google no eligió la misma URL canónica que el usuario".
¿Hay un número "normal" de páginas con este estado?
En un sitio bien gestionado, deberías tender a cero para las páginas importantes. Unas pocas URLs con este estado en páginas secundarias no es necesariamente alarmante. Sin embargo, si el 20 % o más de tu sitio aparece en este informe, hay un problema estructural que resolver.
Verificar la indexación de todas tus URLs, no solo una
El verdadero problema con este error es que GSC te lo señala sin indicarte exactamente qué URLs están afectadas ni qué canonical eligió Google en su lugar. Puedes pasar horas inspeccionando las URLs una a una — la herramienta integrada es excelente, pero no está diseñada para eso a gran escala.
Ese es el problema que IndexProbe resuelve. Se conecta a tu propiedad de Google Search Console e interroga la API URL Inspection para cada una de tus URLs — distribuyendo automáticamente las peticiones a lo largo de varios días para mantenerse dentro del cupo de 2.000 URLs inspeccionadas/día/propiedad de GSC. Resultado: para cada URL de tu sitio, obtienes el estado real de indexación, el motivo de no indexación si es el caso, la canonical que Google ha conservado, y la fecha del último rastreo. Los mismos datos que en el inspector de URL de GSC, pero sobre todo tu sitio de una vez.
Después puedes filtrar por estado para aislar todas tus "páginas duplicadas sin URL canónica", exportarlas, tratarlas en bloque, y hacer un seguimiento de la evolución tras tus correcciones.