Hace algún tiempo comenté una forma de agregar fragmentos enriquecidos en WordPress con un par de plugins, concretamente las estrellas de votación que se muestran de color amarillo en los resultados.
En las pruebas que he realizado las estrellas pueden aparecer en menos de 24 horas si el sitio nunca antes las había agregado, incluso si apenas se tiene un sólo voto. Aunque así como aparecen de un día para el otro pueden desaparecer, Google se reserva el derecho de mostrar los fragmentos enriquecidos en cada sitio y si considera que se están manipulando o no son de utilidad para los usuarios, simplemente deja de mostrarlos aunque los sigue «leyendo».
Black Hat SEO con estrellas:
Los webspammers no han dejado pasar la oportunidad de resaltar sus contenidos, la siguiente captura muestra los resultados de la primera página de Google para una búsqueda relacionada con viagra y productos farmacéuticos:
Sitios infectados con viagra online y estrellas
Estos sitios se encuentran infectados y fueron manipulados para mostrar fragmentos enriquecidos (las estrellas) con miles de votos que supuestamente los usuarios han realizado.
En realidad la información que vemos es cargada por medio de una técnica denominada cloaking (penalizada por Google) que consiste en mostrarle una cosa a los buscadores y otra diferente a los usuarios.
¿Qué ven los usuarios?
Al acceder directamente a las URLs ya sea escribiéndolas o pegándolas en la barra de direcciones del navegador, el contenido real de cada página se muestra de forma normal y no aparece nada relacionado con el viagra.
Sin embargo, cuando el referer es un buscador, es decir, cuando accedemos desde Google lo que se carga es el contenido de los spammers que puede variar en cada caso. A veces realizan redirecciones automáticas hacia otras páginas infectadas o directamente cargan el contenido spam como en el siguiente ejemplo en el cual se muestra una farmacia online fraudulenta en lugar del contenido original:
Contenido fraudulento cargado en el sitio infectado al acceder desde Google
Esta manipulación de los contenidos suele ser utilizada para confundir o engañar a los propietarios de los sitios, pues ellos al acceder directamente no notan nada extraño y la infección se puede mantener por más tiempo.
¿Qué ven los buscadores?
Al acceder como el robot de Google cambiando el User Agent o bien accediendo a la caché de los resultados, se muestra el contenido spam que los robots interpretan:
Misma página con el contenido que ven los robots (cloaking)
Simplemente es texto generado de forma automática con enlaces hacia otras páginas spam, de esta forma buscan manipular los resultados y posicionarse mejor (ver también un caso parecido pero en el buscador Bing):
Texto y enlaces que buscan manipular los resultados
El enlace marcado con la flecha «Adobe Dreamweaver CS5…» enlaza a un sitio fraudulento que forma parte del famoso fraude de las licencias «originales» baratas.
Finalmente, observando el código fuente se puede ver el contenido que se encuentra marcado para mostrar las estrellas en Google. Como comentaba anteriormente, son valores falsos agregados para simular la interacción de miles de usuarios:
Fragmentos enriquecidos que muestran las estrellas de votación en Google
Y así aparece en los resultados:
En un mundo ideal Google debería detectar esta manipulación sin mayores dificultades, pero se trata de un algoritmo que procesa la mayor parte de la información de forma automática por lo que no es algo perfecto. Además, al analizar unos pocos casos malos no se están teniendo en cuenta todos los que el robot debe detectar y bloquear a diario, pues los spammers infectan y generan miles de páginas falsas como estas todos los días, por lo que al final de cuentas termina siendo una cuestión estadística… siempre algunas se van a terminar filtrando en buenas posiciones.
Mas detalles…
Pueden encontrar más ejemplos sobre estas técnicas en este artículo de Unmask Parasites, además de algunos consejos para webmasters que vale la pena tener en cuenta.