Protegete de un posible google proxy hack

Protegete de un posible google proxy hack

Una vulnerabilidad en el algoritmo de Google, podría hacer que un tercero deje a tus páginas fuera del índice. Así lo ha anunciado Dan Thies quien considera la vulnerabilidad como muy grave y ha decidido hacerla pública debido al caso omiso que Google le ha hecho durante un año.

El error reside en el algoritmo que detecta contenido duplicado, y consiste en lo siguiente:

1.- Imaginemos un usuario navegando anonimamente a través de proxy hacia nuestra página web:
algunproxy.com/www.canal-seo.com/última-noticia

2.- Este inocentemente enlaza desde su página hacia la dirección del proxy.

3.- Los buscadores rastrean el enlace y indexan el contenido.

4.- Los buscadores rastrean nuestro artículo original y lo penalizan como contenido duplicado cuando realmente es la fuente original.

Este proceso evidentemente puede realizarse con malas intenciones para quitar a la competencia del índice. Evidentemente el algoritmo de Google para seleccionar la fuente original es altamente eficaz, pero puede dejar de serlo si el robot se encuentra con decenas de proxys con el mismo contenido.

Como podemos prevenirnos del ataque?

Una posible solución sería añadir las etiquetas “nonindex, nofollow” a menos que el cliente se trate de un robot (Ask, Google, MSN o Yahoo) lo cual debería verificarse en el script anti-hacking.