A continuación, te cuento cómo solucionar todo este problema del duplicate content, para que puedas subir sin escalas hasta el cielo de las SERPs.
Sin duda que la mejor solución a este problema, es como la mayoría de problemas, prevenirlo.
Para ello, es necesario seguir algunas recomendaciones que te hago aquí.
Si estás comenzando una web de nicho, una web para un cliente, o una web propia, lo que te ayudará a evitar el contenido duplicado SEO desde el minuto cero, es tu estrategia SEO.
Y dentro de ella, la arquitectura web y la investigación de palabras clave resulta fundamental.
Con la arquitectura lograrás definir tus categorías y sub-categorías, así como las secciones que incluirás en la web.
La arquitectura al estar definida previamente te permitirá visualizar un sitio web en los que cada sección ataque keywords diferentes.

Pero para definir la arquitectura web, es necesario hacer un keyword research intenso, en el que conozcas las keywords principales de tu sector y logres así agrupar keywords por intención de búsqueda, categorías y contenidos de blog.
Con ello, ya tendrás resuelto el 90% del problema del contenido duplicado.
Si por el contrario, el sitio ya está activo hace tiempo y tiene una buena cantidad de contenido, deberás hacer una auditoría web para encontrar el mismo.
Este tipo de etiqueta es muy útil para indicarle a Google cuál es la URL que se debe posicionar cuándo hay más de una con contenido similar.
En el mundo del ecommerce son ampliamente utilizadas, por ejemplo cuando un modelo de camiseta tienen diferentes colores y cuentan con una URL por color. Sin embargo la ficha del producto y el contenido es igual en todas a excepción de esto, es por ello que aquí se debe canonicalizar las URLs similares hacia la que queremos dar prioridad.

Las URLs que son únicas deben llevar la canonical autorreferenciada, es decir hacía su propia URL,
Los robots, más precisamente el noindex es muy útil para decirle a Google que una URL no debe ser tenida en cuenta por su algoritmo.
Con esto evitas marear a Google y que tu contenido se duplique al indexar por ejemplo categorías con productos con nombres similares.
Las tags y las categorías suelen dejarse en noindex, para priorizar productos o contenidos, pero esto depende muchísimo de la web.
Lo cierto es que indexar etiquetas si es algo que está en desuso por que generan muchísimo duplicate content.
Por otro lado, las categorías es un tema que requiere un análisis de cada caso.
Puede parecer algo obvio, o de Perogrullo como se dice coloquialmente, pero está bueno repetirlo y dejarlo más claro aún.
¡Nunca copies contenido de otra web!
Obviamente puedes citar contenido, eso si, o parafrasear alguna parte, pero tanto para Google, para tu comunidad, y para el valor de tu marca, es importantísimo que tu contenido sea original y propio.
De hecho, puedes meterte en unos berenjenales legales también si copias contenido de otra web.
Ten cuidado con eso.
Finalmente, ir haciéndole un seguimiento a los nuevos contenidos creados y a las posiciones de las keywords, por ejemplo con DinoRANK, te permitirá ver si existen nuevas duplicidades o si hay problemas de canibalización en tu web.

Es normal que con los años se pueda generar algún inconveniente en este sentido, más cuando contratas redactores y le ocupas poco tiempo a la web.
Aquí las herramientas como DinoRANK resultan importantísimas para ahorrarte trabajo.
Ahora si, una vez que nos damos cuenta que el contenido duplicado está a la orden del día y es un problema latente y a solucionar, es hora de ponerte manos a la obra y terminar con el asunto de una vez por todas.
En DinoRANK, en la sección de Auditoría SEO on page sabrás cuáles son los títulos SEO duplicados, así como las meta descriptions.
Podrás incluso descargarte el CSV para tener todo más organizado.

Deberás cambiar manualmente en tu web las titles y description que se repiten.
Posteriormente el siguiente paso es cambiar los encabezados h1, h2, entre otros, que están duplicándose.
Allí mismo podrás filtrar y conocer cuáles son las URLs y encabezados afectados.
Corrígelos sustituyéndolos por otras keywords que pueden ser interesantes para cada contenido.
Lo siguiente es hacerlo con el texto y sustituir el contenido que esta repetido en tus URLs o que hayan sido copiado de otros sitios.

Siteliner es una herramienta gratuita que te permite conocer si tu sitio tiene contenido que se muestra en otros sitios, y es perfecto para ver si tu web o la de tu cliente copió contenido o si por el contrario, el plagio ha sido realizado por otros.
Algo que muchos SEOs dejan de lado y que es una mala práctica, es el de las imágenes duplicadas.
No hace falta decirlo, pero es obvio que Google puede analizar e identificar imágenes similares.
Es por ello que debes cambiar todas las imágenes que sean similares dentro de los contenidos de tu web.
Por supuesto que el logo y las imágenes recurrentes debes dejarlas, no vayas a enloquecerte tampoco.
Por último y muy pero muy importante están las redirecciones 3XX.
Se deben utilizar cuando tienes dos contenidos o más similares y atacan las mismas keywords.
Deberás mejorar el contenido principal y hacer una redirección 301 (o 308) a esa URL desde las URLs de menor valor.
Con esto logras hacer un contenido más completo, y sacar del foco de Google las URLs que duplicaban y que tenian poco valor de cara al usuario y al buscador.
Redirige todas tus URLs similares hacia la de mayor valor.
Si no puedes por un tema de la arquitectura web, medita ponerla en noindex o bien utilizar la canonical.
Este artículo tiene la finalidad de ayudarte con un tema que es recurrente y que veo muy a menudo cuando trabajo las webs de mis clientes.
El contenido duplicado es uno de los problemas principales que afectan el posicionamiento SEO, pero por suerte es de los inconvenientes más fáciles de solucionar, al menos en webs no tan grandes.
De hecho, es de las implementaciones que mejores resultados suelen traerle a mis clientes, ya que solemos organizar el plan de acción atacando esto en las primeras instancias, dando señales a Google de que solo hay contenido único y original en la web.
Espero que esta guía te haya sido de ayuda, y puedas a partir de ahora darle solución al contenido duplicado y comiences a subir como espuma en los resultados de búsqueda.
¿Qué otro consejo le darías a un webmaster para solucionar este problema?
