Con Adobe Analytics Data Workbench, los analistas pueden consultar las actividades de los visitantes a través de diferentes canales. Este artículo describe cómo se fusionan en un solo comportamiento de los visitantes para realizar consultas.
Este artículo es estrictamente una ilustración simplificada. Por ejemplo, cada comportamiento de los visitantes consta de referencias/punteros en lugar de cadenas reales y los datos de diferentes fuentes pueden requerir un procesamiento previo para asignar el identificador del visitante.
Vista abstracta
Este diagrama muestra cómo varias fuentes se fusionan en un conjunto de datos. Repasemos cada sección.
Datos de registro sin procesar
A la izquierda, tenemos fuentes de registro. En este ejemplo, utilizamos los registros del servidor web y las transacciones de la tienda (POS). Data Workbench puede coger cualquier dato de registro de eventos, siempre y cuando tenga un identificador de visitante y una marca de tiempo.
Tenga en cuenta que, llegados a este punto, el registro web muestra lo que hacen los visitantes en el sitio web, mientras que el registro POS solo indica los datos de la tienda.
Arquitectura de los datos
En el centro, tenemos la arquitectura del conjunto de datos. Esto define cómo debe encajar cada fuente de registro. También indica cómo se deben transformar en un formulario más legible.
Datos procesados del visitante (conjunto de datos)
Por último, los datos de evento de todos los canales se almacenan en un solo comportamiento de los visitantes, lo que es similar a una tarjeta que contiene todos los datos de evento de un visitante anónimo. Contiene lo que un visitante ha hecho en la Web, además de lo que ha comprado en las tiendas.
En pocas palabras, los datos de entrada sin procesar, situados a la izquierda, están fluyendo hacia el comportamiento de los visitantes procesado, situado a la derecha, utilizando la arquitectura de datos como plantilla.
Más información
Vamos a repasar este proceso de nuevo utilizando datos de ejemplo.
A partir de un registro del servidor web, cada entrada de registro se decodifica y, luego, se coloca en las dimensiones relevantes del esquema. En este ejemplo, el visitante “anonymous001” compró un producto y seleccionó la opción de recogida en tienda.
Las transacciones en la tienda también se decodifican para el mismo visitante. Esta persona recogió el producto al día siguiente y decidió añadir dos artículos más en la caja registradora.
Luego, los datos de la actividad se transforman en un formato adecuado para las consultas. En este caso, el SKU del producto se sustituye por su nombre de producto mediante la transformación de búsqueda.
Una vez que los datos de todos los canales se han combinado, obtenemos un comportamiento de los visitantes en una sola tarjeta.
Esta tarjeta muestra que un cliente anónimo pidió un artículo en línea, lo recogió en la tienda y compró artículos adicionales. A diferencia de los datos de entrada originales, una tarjeta proporciona datos holísticos de las actividades de los visitantes a través de diferentes canales.
Ejecución de consultas
Ahora que se ha procesado un comportamiento de los visitantes, consideremos la siguiente consulta analítica.
Entre los clientes que hicieron pedidos con recogida en la web, ¿cuántos compraron artículos adicionales en la tienda? Además, ¿qué productos eran populares como complemento en la tienda?
Mirando la tarjeta de arriba, el motor de solicitudes debería contar:
más de 1 visitante para la métrica de recogida en tienda
más de un 1 producto para “Cable USB” para la dimensión de compra adicional
más de 1 producto para “Kale Chips” para la dimensión de compra adicional
La repetición de esta microconsulta para todas las demás tarjetas dará, finalmente, la respuesta para todo el conjunto de datos.
Consideración del rendimiento
Este enfoque ofrece las siguientes ventajas:
- Las tarjetas son independientes, por lo que las microconsultas se completan con menos referencias externas costosas.
- Estas tarjetas se pueden distribuir fácilmente para el procesamiento paralelo.
Conjunto de datos
Todas las tarjetas se almacenan en un tarjetero conocido como Conjunto de datos, al que comúnmente se le llama “temp.db” debido a su nombre de archivo.
A medida que esta rueda sigue girando, todas las tarjetas se pueden evaluar una a una. Cuando se vuelve a mostrar la misma tarjeta, sabrá que ha terminado un barrido y que se ha evaluado todo el conjunto de datos.
En el siguiente artículo, disponible aquí, tratamos el ciclo de vida total del conjunto de datos.