Contenido Duplicado en Ecommerce; Como solucionarlo

Si has llegado hasta este artículo, doy por supuesto que ya sabes que el contenido duplicado es perjudicial para el posicionamiento de tu sitio. Y también que sabes que en un ecommerce, el contenido duplicado es inevitable. Así que vamos a ver de que formas podemos solucionarlo.
Y si no lo sabías, bueno, puedes hacer acto de fe y seguir leyendo, que a mí me haría mucha ilusión tener acólitos. En cualquier caso al final del artículo verás la luz.

Hay un sin fin de casos en los que una tienda virtual duplica contenidos y no es un error, vamos a darles un repaso.

 

Caso 0 –  Contenido duplicado copiado del sitio del fabricante u otros.

La verdad es que este caso lo he incorporado a posteriori, porque inicialmente ni lo había incluido por evidente. Si las descripciones y fotos de tu producto son las del fabricante, entonces no vas a ninguna parte. No vas a poder posicionar con un contenido que no es tuyo y que ya existía antes de que tú lo incorporaras… o sea,  que los buscadores saben que tú lo has copiado. No le aportas nada nuevo al comprador y eso el buscador lo sabe.

Solución

¡¡Pero hombre de dios cúrratelo un poco!! Haz más fotos, mejora las descripciones, pon un video…  Esto ya no es SEO es de sentido común, distínguete de los demás.

 

Caso 1 – Filtros o navegación por capas y ordenaciones

Dentro de tu categoría «smartphones molones» la información puedes mostrarla ordenada por precio, por marca, por pulgadas… o filtrada por cualquiera de esas características. Esto da lugar a diferentes páginas con igual título, metas y contenido, y con una lista de productos que son los mismos con diferente ordenación o un conjunto restringido de ellos. Es decir, para el buscador es contenido duplicado.

Solución: Parámetros de Url en Search Console y uso de Robots.txt

Paso 1. – Configurar los Parámetros de Url en Search Console

Hablando claro se entiende la gente. Simplemente dile a Google que tu sitio tiene esos filtros y ordenaciones y como quieres que los trate.

Ve a Google  Search Console, antes Webmaster tools, y en el apartado Rastreo entra en Parámetros de URL .parametros url search console

Probablemente ya tengas allí una lista de parámetros que ha detectado al crawlear tu sitio. Porque todos estos filtros y ordenaciones, tienen forma de parámetros. Los parámetros dependen de tu cms y de los atributos que filtres pero a modo de ejemplo pueden ser cosas como:

www.movilesagogo.com/moviles-molones/?dir=asc&mode=list&order=price

Deberás averiguar que parámetros usa tu tienda y para qué sirven, no es difícil. Así podrás decirle a google que hacer cuando encuentre cada uno.  Por ejemplo, si el parámetro order indica como saldrán ordenados los productos, edítalo y configúralo como en la imagen siguiente. Así le dices que sirve para ordenar y que no es necesario que indexe cada ordenación diferente de un mismo contenido.

Edición parametros de url

 

Paso 2. – Bloquear el acceso en Robots.txt

Google no es el único buscador aunque sí el prioritario para nosotros. Para evitar que cualquier bot pierda tiempo en este tipo de páginas con parámetros, podemos decir en el archivo robots.txt que no queremos que las indexen. De esa forma también ahorramos recursos de servidor disminuyendo las peticiones.

El archivo robots.txt es un archivo que se encuentra en la raíz de un sitio e indica a qué partes no quieres que accedan los rastreadores de los motores de búsqueda. Para decirle que no acceda al parámetro order diríamos

Disallow: /*?order*

y siendo mucho más drásticos, que no acceda a ninguna página con parámetros

Disallow: /*?*

Robots.txt es un archivo que mal usado puede ser peligroso para tu posicionamiento. Ten en cuenta que estás restringiendo el acceso a partes de tu sitio. Así que, si no tienes ni idea de que estamos hablando, antes de que lo modifiques es mejor que aprendas un poco más sobre el uso de robots.txt

Caso 2 – Contenido duplicado por Paginaciones en categorías

Tu tienda muestra en cada página de categoría una parrilla o lista de por ejemplo 6 productos. Y tú tienes muchos más de 6 productos en la categoría. Por consiguiente, es necesario que pagines n veces para que el usuario pueda recorrer todos los productos.

El resultado son n páginas con igual titulo e iguales metas y contenido, salvo por el grid de productos que apenas supone cambio de contenido.  Esto aplicado a varias categorías con situaciones similares, se traduce para el buscador como «este sitio se repite todo el rato, el contenido es de baja calidad«

Soluciones

  1. Mostrar todos los productos de la categoría en una sola página de scroll infinito. Si tenías pocas páginas puede ser una solución pero si tienes muchísimos productos esto puede ser bastante incomodo. Además si optas por esta solución debes tener cuidado con no penalizar la velocidad de carga. Para eso tendrás que usar algún método de ‘carga bajo demanda’ conforme haces el scroll. En cualquier caso para adoptar este tipo de soluciones necesitas ‘alterar’ el código de tu Magento, Prestashop o Woocommerce de turno. Una ventaja de este método, que suele pasar desapercibida, es que supone un mejor enlazado interno para todos los productos al estar todos a un solo click de distancia de su categoría.
  2. Explicarle la situación al buscador. Cuando una página es continuación o predecesora de otra, podemos usar las etiquetas html REL=PREV y/o REL=NEXT para explicar la estructura de la información. Con esto en realidad no le estamos diciendo a Google que no las indexe, lo que hacemos es explicarle la secuencia de la información. El ya es suficientemente listo para saber luego qué deberá mostrar. Para más información de como usarlas aqui tienes lo que google te aconseja sobre el uso de rel=prev y rel=next.

¿Qué solución es mejor de las dos? Depende de tu situación, como todo en la vida esto es relativo. Si no son muchas páginas yo optaría por un scroll infinito pero ojo, bien hecho. Pero para gustos los colores así que investiga, prueba y cuéntanos que opinas tu.

 

Caso 3 – Contenido duplicado por productos casi iguales pero ‘con méritos propios’

Tengo 5 productos casi iguales, o si lo prefieres un mismo producto, pero con diferentes acabados. Aún siendo el mismo producto, sus diferentes acabados le dan muy diferente personalidad. Cuando un cliente ya está en mi tienda, no quiero perder la oportunidad de que alguno de los 5 le enamore. Así que no quiero hacer un producto configurable porque aun poniendo fotos de cada uno, solo se muestra una de ellas en el ‘escaparate’ de la categoría.

Otro caso, tu tienda vende un único producto, ‘gafa de sol chinorra’, en 5 colores. Una sola página de producto te parece una experiencia de usuario muy pobre y quieres mostrar una para cada color.

Creas tus 5 productos cada uno con su propia página. Al cliente en la tienda la diferencia le entra por los ojos, y clica en la parrilla el que le gusta. Pero para el robot de Google las 5 paginas son lo mismo, salvo por la foto y un par de palabras el resto del texto es igual, contenido duplicado.

Solución: etiqueta rel=canonical

Trátalos como productos simples y haz una página para cada uno. Luego escoge uno de ellos y dile a Google que ese será el que debe indexar como ‘representante’ de los demás.

¿Con qué criterio elijo al representante?

Todos están a la vista para el cliente que navega por tu tienda. Pero ‘el representante’ será el que google muestre como respuesta de búsqueda.  Si tu tienda ya lleva tiempo funcionando puedes elegir el más vendido o usar Google Search Console o Analytics para ver si alguno de ellos está ya mejor posicionado y te está trayendo más tráfico.

Si no tienes esos datos objetivos, escoge el que visualmente sea más representativo del conjunto, o si lo prefieres, el menos extremo.

¿Como digo al buscador cuál es el representante?

Usando  la etiqueta rel=Canonical en el código html de las páginas. Si las paginas en cuestión son;

www.misitio.com/version1.html   … /version2.html… hasta la /version5.html

y la representativa es la versión3, en las 5 páginas se debe incluir dentro del elemento Head el código

<link rel=”canonical” href=”http://www.misitio.com/version3.html” />

y de esta forma cuando el buscador entra en cualquiera de ellas tu le dices cual de tus versiones duplicadas es la buena.

Este post se esta alargando demasiado y no puedo entrar en detalles de uso de la etiqueta Canonical, así que si quieres saber más de ‘canonicalizaciones’ te recomiendo este artículo de webpositer.

En el caso de que tengas un site muy extenso es posible que ademas quieras optimizar el tiempo que te dedica el bot de google. En ese caso , marca las 4 páginas que no son ‘la elegida’ como no indexables . Esto lo haces poniéndoles la etiqueta robots=NOINDEX, FOLLOW.

Así le dices que no las indexe pero sí siga sus vínculos y ahorras tiempo que el bot podrá dedicar a otras páginas tuyas.

Recuerda que todo esto tiene sentido si realmente el/los productos lo merecen. No pierdas el tiempo para implementar todo esto en una camiseta básica en 5 colores diferentes, eso es un configurable sin más.

Alguno voluntarioso también estará pensando…»Mejor que todo eso es currarme 5 descripciones de producto diferentes y posiciono las 5 versiones».

No dudo de tus habilidades como copywriter,  pero es muy complicado hacer que 1- se posicionen para los términos que interesa posicionarlos y 2- no se estén canibalizando entre sí.

 

Caso 4 – Contenido duplicado por versiones www y no www

Esto es un error mas común de lo que debiera. Cuando creas un site nuevo debes decidir si te gusta con o sin www. Es una cuestión de gustos créeme, no va a afectar al posicionamiento.

Si no tienes cuidado, o si no te pones en manos de alguien meticuloso, puedes acabar sirviendo todas tus páginas por cuatriplicado:

http://misitiomolon.es

https://misitiomolon.es

http://www.misitiomolon.es

https://www.misitiomolon.es

Y en este caso además no nos limitamos a las tiendas virtuales, todos los sitios pueden tener este problema.

Solución: Servidor web y Google Search Console

Como hemos dicho escoge el que más te guste, puede ser una cuestión puramente estética si tu sitio es nuevo. Si ya llevas tiempo con ambas abiertas el criterio debe ser ¿cual esta mejor posicionada en los buscadores? ¿Hay una de las dos que tenga mas enlaces externos?…

Después debes configurar tu servidor para aceptar ambas peticiones (con y sin www) pero dirigirlas todas a la versión que hayas escogido como principal. Si no sabes como hacerlo no te compliques, díselo a tu proveedor de hosting que le llevará un minuto hacerlo y para eso está.

Con esto ya hemos logrado que siempre se use la misma, ahora para mayor seguridad hay que decirle a Google cual es la versión preferida. Para ello vamos una vez más a Search Console, allí debes tener creadas ambas propiedades, con y sin www. ¿porqué? porque así lo dice el mismísimo señor G.

Entra en la propiedad que has elegido como favorita y en la rueda dentada de la derecha selecciona «Configuración del sitio» y en la sección «Dominio preferido», selecciona la opción que quieras.

Es muy sencillo pero si quieres más detalle aquí te explica google como establecer el dominio preferido.

 

Caso 5 – Contenido duplicado por versiones http y https

Probablemente tu sitio empiece siendo http y con el paso del tiempo decidas aumentar la seguridad pasando a https. De hecho ahora lo recomienda G para el 2017 así que todos a la carrera para migrar.

El problema es que para google no es exactamente el mismo caso que con o sin www. No hay una forma de decirle a google que uno de los dos es el preferido.

Aun así la solución es parecida solo que los resultados son mas lentos y delicados.

Solución: .htaccess y Google Search Console

No voy a dar una solución detallada porque una migración a HTTPS requiere mucho tiempo. Mucho más que cuatro lineas, así que escribiremos un artículo grande y peludo sobre ello.

A modo de resumen,

En primer lugar asegúrate de que todo tu sitio funciona correctamente en https.

Luego hay que redireccionar todo el trafico http a su url equivalente https en el servidor. Redirecciones 301 que pasan todo el pagerank  realizadas en el archivo de configuración htaccess.

Y por ultimo corre y cuéntaselo a Google. Debas hacer varios cambios en Search console y alguno pequeño en analytics pero eso ya es para otro post.

 

Bueno esto ha sido un resumen de los principales problemas de duplicación de contenido y como solucionarlos. Si tienes cualquier comentario o duda estaré encantado de discutirlo contigo, déjanos tu opinión. Y si te ha gustado no dudes en suscribirte, te prometo que no somos nada pesados.

Hasta pronto lector!!

Deja un comentario