Introducción

En catálogos grandes de productos, es común que se generen entradas duplicadas sin que nadie lo note: títulos iguales, descripciones copiadas, productos repetidos con pequeñas variaciones. Esto afecta negativamente al SEO, a la experiencia del usuario y a la eficiencia del sistema.

En esta guía aprenderás cómo detectar contenido duplicado usando consultas MySQL en tiendas o blogs grandes, especialmente en WordPress y WooCommerce, pero aplicable también a otras plataformas.

Índice

1. ¿Por qué el contenido duplicado es un problema?

  • 📉 Penalización SEO por parte de Google
  • 🧭 Mala experiencia de navegación para el usuario
  • ❌ Canibalización de palabras clave
  • 🔁 Dificultades para campañas en Google Ads

2. Tablas que contienen contenido

TablaCampoContenido
wp_postspost_titleTítulo del producto o entrada
wp_postspost_contentDescripción larga
wp_postmetameta_valueContenido SEO u otros campos personalizados

3. Duplicados por título

SELECT post_title, COUNT(*) as total
FROM wp_posts
WHERE post_status = 'publish'
  AND post_type IN ('product', 'post')
GROUP BY post_title
HAVING total > 1
ORDER BY total DESC;

4. Duplicados por descripción

SELECT post_content, COUNT(*) as coincidencias
FROM wp_posts
WHERE post_status = 'publish'
  AND post_type = 'product'
GROUP BY post_content
HAVING coincidencias > 1
ORDER BY coincidencias DESC;

5. Comparación por hash (checksum)

SELECT MD5(post_content) as hash, COUNT(*) as total
FROM wp_posts
WHERE post_type = 'product' AND post_status = 'publish'
GROUP BY hash
HAVING total > 1;

6. ¿Qué hacer con contenido duplicado?

  • 🔍 Unificar productos/entradas similares
  • ✏️ Reescribir descripciones usando IA (GPT)
  • 📤 Exportar a CSV para revisión manual
  • 🔗 Usar etiquetas canonical si el contenido debe permanecer

7. Conclusión

Detectar contenido duplicado es fundamental en catálogos grandes si quieres escalar, mejorar SEO y evitar confusiones.

Estas consultas SQL te permiten auditar de forma precisa qué partes de tu sitio están duplicadas.

📩 ¿Quieres que lo analicemos juntos o crear un sistema automático que lo detecte cada mes? Escríbenos y te ayudamos.

Ir al contenido