Introducción
En catálogos grandes de productos, es común que se generen entradas duplicadas sin que nadie lo note: títulos iguales, descripciones copiadas, productos repetidos con pequeñas variaciones. Esto afecta negativamente al SEO, a la experiencia del usuario y a la eficiencia del sistema.
En esta guía aprenderás cómo detectar contenido duplicado usando consultas MySQL en tiendas o blogs grandes, especialmente en WordPress y WooCommerce, pero aplicable también a otras plataformas.
Índice
- 1. ¿Por qué el contenido duplicado es un problema?
- 2. Tablas clave que debes revisar
- 3. Consultas para encontrar duplicados por título
- 4. Consultas para detectar descripciones idénticas
- 5. Comparación por hash para detectar duplicados exactos
- 6. Acciones recomendadas una vez identificados
- 7. Conclusión
1. ¿Por qué el contenido duplicado es un problema?
- 📉 Penalización SEO por parte de Google
- 🧭 Mala experiencia de navegación para el usuario
- ❌ Canibalización de palabras clave
- 🔁 Dificultades para campañas en Google Ads
2. Tablas que contienen contenido
Tabla | Campo | Contenido |
---|---|---|
wp_posts | post_title | Título del producto o entrada |
wp_posts | post_content | Descripción larga |
wp_postmeta | meta_value | Contenido SEO u otros campos personalizados |
3. Duplicados por título
SELECT post_title, COUNT(*) as total FROM wp_posts WHERE post_status = 'publish' AND post_type IN ('product', 'post') GROUP BY post_title HAVING total > 1 ORDER BY total DESC;
4. Duplicados por descripción
SELECT post_content, COUNT(*) as coincidencias FROM wp_posts WHERE post_status = 'publish' AND post_type = 'product' GROUP BY post_content HAVING coincidencias > 1 ORDER BY coincidencias DESC;
5. Comparación por hash (checksum)
SELECT MD5(post_content) as hash, COUNT(*) as total FROM wp_posts WHERE post_type = 'product' AND post_status = 'publish' GROUP BY hash HAVING total > 1;
6. ¿Qué hacer con contenido duplicado?
- 🔍 Unificar productos/entradas similares
- ✏️ Reescribir descripciones usando IA (GPT)
- 📤 Exportar a CSV para revisión manual
- 🔗 Usar etiquetas canonical si el contenido debe permanecer
7. Conclusión
Detectar contenido duplicado es fundamental en catálogos grandes si quieres escalar, mejorar SEO y evitar confusiones.
Estas consultas SQL te permiten auditar de forma precisa qué partes de tu sitio están duplicadas.
📩 ¿Quieres que lo analicemos juntos o crear un sistema automático que lo detecte cada mes? Escríbenos y te ayudamos.