Cómo eliminar referrer spam de Google Analytics

El tráfico referrer spam, tráfico spam o tráfico fantasma, no es más tráfico que recoge Google Analytics que no se corresponden con visitas reales. Este tipo de tráfico debemos eliminarlo de nuestros informes de Google Analytics si no queremos que éstos queden distorsionados.

Cómo eliminer tráfico referrer spam

Pero, ¿cómo es posible que Google Analytics refleje visitas no reales? Esto se debe a que es posible “inyectar” visitas fantasma a sitios web con herramientas como Hit Builder. Esta aplicación permite realizar solicitudes HTTP para enviar datos directamente a los servidores de Google Analytics, es decir, permite entre otras cosas, generar interacciones en los informes de Analytics. Esto puede ser usado por personas malintencionadas, para enviar visitas fantasma a sitios web. En este artículo no voy a indicar cómo hacerlo ya que mi objetivo es mostrar cómo podemos eliminar el tráfico fantasma de nuestros informes, no decir cómo crearlo.

¿Cómo eliminar el referrer spam?

Investigando por Internet, me he encontrado con muchas soluciones para poder deshacernos de este tráfico en nuestros informes. Estas quizás sean las más usadas.

  • Crear un filtro individual para cada página que reconozcamos que está llevándonos tráfico fantasma.
  • Crear un filtro que aglutine todos las páginas reconocidas como spam.
  • Crear una dimensión personalizada y un filtro que recoja únicamente tráfico que incluya un valor predeterminado de esa dimensión creada.

A mí, personalmente, la que más me gusta es la tercera, porque una vez implementada te olvidas de ella. Las dos primeras implican revisar periódicamente el tráfico, por si nos encontramos con una nueva URL que lleve tráfico fantasma. Con la última solución, una vez implementada, nos podemos despreocupar.

Eliminación del tráfico fantasma con una dimensión personalizada y un filtro

La idea de esta solución al tráfico spam es sencilla. Si es posible generar visitas fantasma que realmente no han visitado nuestra web, hagamos que las reales sean identificadas fácilmente. Esto podemos lograrlo asignando a una dimensión personalizada un valor cada vez que una página de nuestro site sea vista.

Para implementar esta solución debemos seguir los siguientes pasos:

  1. Definir nuestra dimensión personalizada. Esto podemos hacerlo en Google Analytics, en el menú de Administrador en la columna Propiedad, en la opción Definiciones personalizadas > Dimensiones personalizadas.Crear dimensión personalizadaCrearemos la dimensión, dándole un nombre Le asignamos un nombre y como ámbito escogemos HitAñadir una dimensión personalizadaCódigo de dimensión personalizadaEn este caso, al ser mi primera dimensión personalizada se le ha asignado a la variable dimesion1, pero si hubiera sido la segunda la variable sería dimension2 (en general sería dimensionN, siendo N un valor numérico que va creciendo).
  2. Asignar un valor a la dimensión creada cada vez que una página de nuestro site sea visitada. Para hacerlo  tenemos dos opciones, en función de si utilizamos Google Tag Manager (GTM) o no.
    • Usando Google Tag Manager

      Debemos acceder a nuestro contenedor, y en la etiqueta que utilicemos para el seguimiento de Universal Analytics, debemos incluir la dimensión personalizada creada y asignarle un valor.

      Añadir dimensión personalizada en Google Tag Manager

      En mi caso, al ser la primera dimensión personalizada que he definido, en el campo Índice indico un 1, y en Valor de la dimensión escojo el valor que quiero asignar a la dimensión, evitarTraficoFantasma en este ejemplo. Es importante anotar bien este valor, porque será el que utilicemos posteriormente para filtrar los datos y dejar únicamente el tráfico real.

    • Sin usar Google Tag Manager

      Si no utilizamos GTM, debemos modificar el código de seguimiento de Universal Analytics en nuestra página web, para asignar el valor a la dimensión personalizada creada e incluir la línea

      ga('set', 'dimension1', <valor_dimension>);
      <script>
        (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
        (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
        m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
        })(window,document,'script','https://www.google-analytics.com/analytics.js','ga');
      
        ga('create', 'UA-XXXXXXXX-1', 'auto');
       <!-- asignación del valor a la dimensión personalizada -->
        ga('set', 'dimension1', 'evitarTraficoFantasma');
        ga('send', 'pageview');
      </script>
      
  3. Creación de un filtro que deje únicamente las visitas que incluyan el valor de la dimensión personalizada asignado

    Una vez que tenemos creada nuestra dimensión personalizada y le hemos asignado un valor, podremos crear un filtro para que se muestre únicamente el tráfico real.  Para ello, crearemos un filtro de tipo personalizado e incluir. Como campo del filtro, seleccionaremos la dimensión personalizada que hemos encontrado (se encuentran al final) y en patrón del filtro escogeremos el valor que le asignamos, en nuestro caso evitarTraficoFantasma. Podemos marcar también la casilla Distinción entre mayúsculas y minúsculas para darle un plus de seguridad. Una vez hecho esto se filtrarán únicamente las visitas que tienen asignado el valor indicado (evitarTraficoFantasma) a la dimensión personalizada que hemos creado.

    Crear filtro para eliminar referrer spam

    Es conveniente que se cree una vista distinta a la vista maestra (la que incluye todos los datos del sitio web) a la que se asigne este filtro para así mantener una vista que incluya todos los datos.

 

Hay que destacar que este método de exclusión del tráfico referrer spam o  tráfico fantasma es muy eficaz pero no 100% fiable ya que pueden seguir inyectándonos visitas si se conoce el índice de la dimensión personalizada y el valor que le asignamos. Por ello es conveniente no dar pistas con el valor que le otorgamos. El ejemplo que he escogido yo (evitarTraficoFantasma), no es el más indicado puesto que revelo mis intenciones. Un valor más adecuado sería uno más ininteligible del tipo sXD12jasfioisYf87k.

Además, si no utilizamos GTM, el valor de la dimensión personalizada se puede ver fácilemente viendo el código fuente de la página.

Sin embargo si utilizamos GTM, no se vería el este valor en el código fuente. No obstante´se puede obtener, pero de una forma más complicada. En este artículo no voy a indicarlo porque no es el fin, pero si alguien está interesado puede ponerse en contacto conmigo y se lo haré saber.

Espero que este artículo os haya servido de ayuda. Si aún así tenéis alguna duda o deseáis dar vuestra opinión podéis dejarme un comentario

Deja un comentario