Revista Comunicación

Qué es el contenido duplicado y cómo afecta al posicionamiento SEO de tu web

Publicado el 28 agosto 2018 por Mglobal

El contenido en formato de texto de una web es una herramienta perfecta para el posicionamiento SEO de ésta. De ello ya he hablado en el artículo enlazado, de la importancia y empleo de las palabras clave relacionadas con la marca.

Sin embargo, no todo el contenido ayudará a que así sea. Cuando se trata de contenido duplicado, es decir, contenido copiado de otras urls de la red, nuestra web puede verse perjudicada. Veamos porqué.

Qué es el contenido duplicado

Para empezar es importante que quede claro qué es el contenido duplicado. Y para ello acudo a lo que Google dice en su Ayuda de Search Console: El contenido duplicado generalmente hace referencia a bloques de contenido considerables en varios dominios que coinciden completamente o que son muy parecidos.

Esto significa que puede tratarse del contenido de una url entera o de varios párrafos. Quiere decir también que puede tratarse de contenido interno (contenido idéntico dentro de nuestro propio sitio web) o contenido externo (en otros sitios webs).

Google ya ha expresado que procura indexar y mostrar páginas con información diferente como resultado a las búsquedas que realizan los usuarios. El empleo de contenido duplicado es a ojos de Google una práctica engañosa que se traduce en una experiencia negativa para el usuario, ya que se puede encontrar con el mismo contenido repetido en un conjunto de resultados de búsqueda. Por lo tanto, el contenido duplicado sólo servirá para penalizar el posicionamiento SEO de la web o webs que lo contengan. Se debe huir de él a toda costa.

Veamos a continuación cómo se produce el contenido duplicado y cómo resolver este grave problema para el posicionamiento SEO de un sitio web.

Contenido duplicado interno

Lo primero que nos viene a la cabeza es que hemos copiado texto de unas páginas (urls) en otras (urls) de manera inconsciente o al menos, sin ser consciente de la transcendencia de esta acción de cara al posicionamiento SEO de nuestro sitio web.

Esto tan obvio sucede con más frecuencia de lo que pensamos si se desconoce la importancia de publicar contenido fresco y original en la web de nuestra empresa. Algunos ejemplos son:

  • Artículos del blog corporativo que copian textos de páginas estáticas del sitio web.
  • Párrafos extraídos de otros sitios web para la redacción de contenidos del nuestro.
  • Mismas descripciones en las fichas de un producto en un eCommerce cuando tan sólo varía alguna característica (color, por ejemplo) o son productos muy similares.
  • Títulos y meta descripciones duplicadas (deben ser siempre originales).

Sin embargo, este modo “inconsciente” no es la única manera de generar contenido duplicado interno en nuestro sitio web. Veamos qué otras formas hay y cómo solucionarlas.

La importancia del dominio

Con o sin www

Una misma página de un sitio web puede tener diferentes urls: con o sin www (url canónica). Ello da lugar a contenido duplicado para cada una de las urls. Si quieres saber qué url considera Google como canónica o duplicada entra en el enlace.

La solución pasa por indicar al buscador cuál es el dominio preferido, el que debe indexar, a través de Google Search Console o la Herramienta para Administradores de Web en el caso de Bing.

Otra manera de resolver el caso de la url canónica es mediante una redirección en el servidor de manera que sólo la url indicada sea la que salga en los resultados de búsqueda de los usuarios.

Ojo con el cambio de protocolo de http a https, sino se redirige adecuadamente puedes tener el mismo problema.

Diferentes extensiones según país

Igualmente sucede en el caso de los sitios web que emplean diferentes extensiones en función del país pero mostrando el mismo contenido (.co, .cl, .es, etc.). Estamos hablando de SEO internacional. Nuestros contenidos, incluso en el mismo idioma, están orientados a diferentes públicos y los buscadores deben saberlo para que no lo consideren duplicado.

La solución pasa por el empleo de la metaetiqueta hreflang. Puedes ampliar sobre su uso según Google en el enlace.

Diferente url para móvil

Hay una tercera opción relacionada con la duplicidad de contenido por el dominio. Está relacionada con la url que muestran los resultados de búsqueda en el móvil. Si nuestra web no tiene un diseño responsive la url será m.misitio.es/blog en lugar de www.misitio.es/blog.

Estaríamos ante un caso de contenido duplicado que se puede solucionar con un diseño que permita la navegación desde diferentes dispositivos sin necesidad de mostrar una url diferente: el diseño responsive.

La importancia de la organización del contenido

La forma en que se organiza y se muestra el contenido en un sitio web también puede llevarnos a generar contenido duplicado. Estamos hablando de la paginación de un blog, artículos, categorías o etiquetas, por ejemplo.

Paginación

La páginas de un blog, cuando navegamos en orden cronológico de publicación de artículos, por las categorías del blog o los resultados de búsqueda interna, se genera diferentes urls muchas veces con contenido muy similar.

La solución para por el  empleo de las etiquetas rel=”next” y rel=”prev” que sirven para indicar que existe relación existente determinadas urls. Estamos hablando del  contenido paginado.

Categorías y etiquetas

Si no existe un planificación y clasificación adecuada en las categorías o etiquetas del blog corporativo, nos encontraremos con contenido duplicado a ojos de los buscadores.

La solución pasa por hacer un buena planificación de ambas para que no estén duplicadas. Es frecuente encontrarse con que se repiten. Ejemplo:

  • www.misitio.es/blog/category/posicionamiento
  • www.misito.es/blog/tag/posicionamiento

Nuestra recomendación es emplear no más de 10 categorías que abarquen ampliamente los temas a tratar y evitar el uso de las etiquetas. Nuestra experiencia indica que apenas se navega ya por las etiquetas de un blog (para eso tenemos Google Analytics) y, además, la existencia de un buscador en el sitio web permite al usuario encontrar la información que le interesa.

No obstante, si se mantiene el uso de etiquetas, hay que pensar bien en cuáles para evitar duplicidades con las categorías o por similitud. Por ejemplo, debemos evitar tener una etiqueta que se llame “lámparas de mesa” y otra llamada “lámparas mesa”. Una de las dos sobra.

En cualquier caso, la mejor manera de evitar contenido duplicado por el uso de categorías y etiquetas en un blog pasa por el empleo de meta-etiquetas noindex, follow a las páginas de categorías y etiquetas. Se trata una acción sencilla si utilizas el plugin Yoast SEO en tu wordpress.

El caso de los eCommerce

El contenido duplicado interno es muy frecuente en tiendas online debido al empleo de diferentes parámetros a la hora de buscar productos en la tienda online o al copia pega de descripciones de productos y categorías.

Aunque no es el caso de todos los productos, sí es usual que se puedan escoger diferentes parámetros tipo, talla, color, tamaño, precio… a la hora de hacer búsquedas dentro de una tienda online. El resultado no variará mucho conforme se modifique alguno de los parámetros generando así muchas urls diferentes con el mismo contenido.

En la Search Console de Google > Rastreo > Parámetros de URL se puede indicar a Google qué parámetros debe ignorar en la indexación de las páginas de la tienda online. En Herramientas para Administradores Web de Bing también cabe esa posibilidad desde el Panel > Configurar mi sitio > Omitir estos parámetros de URL.

Otra opción es la de insertar la etiqueta rel=canonical hacia la url principal y acabar así con el contenido duplicado a ojos de los buscadores.

Contenido duplicado externo

En cuanto al contenido duplicado externo, éste puede proceder de terceros (contenido plagiado) o incluso podemos ser nosotros mismos quienes lo hemos generado de manera inconsciente.

Contenidos que copiamos

En ocasiones podemos usar textos de otros sitios web que consideramos un referente sin tener en cuenta que copiarlo supone un problema para el posicionamiento tanto de nuestra web como para la de origen. Si deseamos hacer referencia al contenido de otra web (aunque sólo sean unos párrafos), la solución pasar por hacer una redacción o resumen del contenido y enlazar con ella. De esta manera no estaremos copiando sus textos y sí les citaremos como referencia o fuente para ampliar información.

Sindicación de contenidos

La sindicación de contenidos puede dar lugar también a contenido duplicado. El RSS (Really Simple Syndication o Rich Site Summary) es un formato empleado para distribuir titulares de noticias y contenidos por Internet de forma automatizada, como por ejemplo, Feedly. No voy a explicar cómo funcionan estos servicios. Sólo comentaré que el problema del contenido duplicado se produce cuando en vez de publicarse en ellos un extracto de nuestro contenido, se publica el contenido completo de una url.

Contenido plagiado

Otra manera de encontrar contenido duplicado externo, lamentablemente bastante extendida, es la del contenido plagiado. Con frecuencia, bien por desconocimiento o bien por desfachatez, podemos encontrarnos artículos completamente copiados en otros sitios web.

Cuando detectamos que eso sucede es conveniente ponerse en contacto con la web de plagiador para solicitar que eliminen dicho contenido. En Mglobal nos sucede con bastante frecuencia y este método de solicitar la eliminación de contenido suele dar buen resultado. Cómo decía antes, muchas veces el plagiador no es consciente del perjuicio que causa al posicionamiento SEO de ambos sitios web.

Y si no da el resultado esperado, siempre cabe la posibilidad de solicitar a Google que elimine la url plagiada de los resultados de búsqueda presentando una solicitud basada en la ley estadounidense de protección de los derechos de autor (Digital Millennium Copyright Act, DMCA).

Si quieres saber si hay contenido externo plagiado de tu web, dispones de varias herramientas online como Copyscape, por ejemplo. Su uso es tan sencillo que apenas requiere explicación.

copyscape para detectar contenido duplicado

En resumen, el contenido duplicado, sea del tipo que sea, no está bien visto a ojos de los buscadores, que pretenden ofrecer a los usuarios resultados originales y únicos. Por ello es tan importante repasar todos los puntos sobre los que ha tratado este artículo y resolver lo que sea necesario.


Volver a la Portada de Logo Paperblog