Seguramente si has empleado alguna herramienta para analizar datos como Google Analytics o Adobe Analytics, te hayas preguntado cómo puedes llevar el uso de estas herramientas al siguiente nivel.
Google se dio cuenta de este problema y decidió desarrollar la herramienta BigQuery dentro de su plataforma de Google Cloud Marketing. La cual se ha diseñado para que puedas sacar el máximo provecho de tus datos y tomar decisiones más complejas en tu negocio. Analizamos qué es BigQuery y cómo utilizarlo.
Qué es la herramienta BigQuery
Como hemos comentado, BigQuery es una herramienta que permite ver todos los datos de Google Analytics sin procesar. Por lo que puedes hacer consultas más precisas con los datos que quieras extraer y que más importancia pueden tener para tu negocio.
Además, algunas herramientas de visualización de datos como Tableau y R permiten conectarse con BigQuery y ofrecer una visualización más completa de los datos y detectar así posibles oportunidades de negocio.
Cómo acceder a BigQuery
Para acceder a BigQuery únicamente se necesita tener una cuenta de Google para darse de alta en la plataforma de Cloud Marketing y después añadir una tarjeta de crédito para activarlo.
Una vez hecho esto, tendrás que crear un nuevo proyecto dentro de “Create a Project” y darle un nombre. Tras lo cual, aparecerá un mensaje indicando que la API se ha creado correctamente.
Después de haber habilitado la API podrás empezar a utilizar BigQuery. Para ello debes acudir a https://bigquery.cloud.google.com/. Si quieres probar tu primera query tienes que acceder a la sección de Compose query y añadir la consulta en la que estés interesado.
Principales consultas a emplear en BigQuery
Las consultas que se realizan en BigQuery usan el mismo formato que en SQL, por lo que si has empleado alguna vez SQL ya estarás familiarizado con el procedimiento. En caso de que no lo estés, no debes preocuparte, ya que en este post te explicamos cómo debe ser el formato de las consultas para obtener los datos.
SELECT
Toda consulta que realices en BigQuery tiene que incluir este parámetro, ya que indica las dimensiones y métricas que se quieren extraer. Cada uno de los elementos que se indiquen dentro del SELECT serán las columnas de la tabla que se formen tras obtener los datos.
La función SELECT permite asignar un alias a las variables con las que se va a trabajar mediante la cláusula AS, haciendo que sea mucho más sencillo trabajar con ellas.
FROM
La variable FROM sirve para indicar la tabla donde se deben extraer los parámetros que se han especificado mediante la cláusula SELECT. Por lo que, como en el caso del SELECT, siempre se debe incluir FROM dentro de cualquier consulta.
WHERE
A diferencia de las cláusulas anteriores, WHERE no es obligatorio. Pero sí se trata de una cláusula de gran utilidad para filtrar los datos que se obtienen mediante las consultas. Además, permite utilizar condiciones como AND y OR que te ayudarán a realizar filtros más complejos.
Para datos de tipo INTEGER o STRING se pueden emplear operados aritméticos para definir las condiciones, como por ejemplo: = (igual a), !=(no igual a), > (mayor que) o < (menor que).
Group by
Dentro de BigQuery y SQL, Group by permite agrupar los valores de las dimensiones que te resulten más interesantes, pudiendo añadir varias dimensiones. Para poder utilizarla únicamente hay que indicar la función por la que se va a agrupar las variables seleccionadas dentro del SELECT, es decir sumar o contar, por ejemplo.
Un ejemplo de consulta en BigQuery con Group By sería la siguiente: SELECT variable1, SUM (variable1) AS sum FROM Tabla1 GROUP BY variable1
ORDER BY
Como su propio nombre indica permite ordenar los datos de forma ascendente o descendente según se haya indicado.
JOIN
Si alguna vez has realizado algún análisis de datos, seguramente te hayas dado cuenta de que a veces se tienen que emplear y comparar datos de dos tablas diferentes. La función JOIN que incorpora Google BigQuery, te permitirá unificar dos tablas para obtener análisis más profundos de las variables.
Dentro de BigQuery existen 5 tipos de JOIN los cuales son:
- Inner join: La tabla resultante tiene únicamente las filas que cumplan las condiciones marcadas.
- Left outer join o right outer join: La tabla que se obtiene tiene el mismo número de filas que la primera tabla. Si hay coincidencia con los datos de la segunda tabla se añadirán los valores, y en aquellos que no haya, se completará con NULL.
- Full outer join: En este caso se consigue una tabla con todas las filas de ambas tablas, añadiendo los valores donde hay coincidencia y rellenando con NULL el resto.
- Cross join: Permite unir cada fila de la primera tabla con todas las filas de la segunda, por lo que no es necesario establecer ninguna condición.
Esperamos que esta pequeña guía de BigQuery te sea de utilidad y puedas obtener el máximo beneficio de esta herramienta para poder llevar a tu negocio al siguiente nivel.