Dati analitici multicanale per un solo visitatore

Con Adobe Analytics Data Workbench, gli analisti possono eseguire una query delle attività dei visitatori attraverso vari canali. Questo articolo mostra come si fondano in dati di un unico visitatore per le query.

Nota:

Questo articolo è rigorosamente un'illustrazione semplificata. Ad esempio, i dati di ogni visitatore sono costituiti da riferimenti/puntatori invece che da stringhe reali e i dati provenienti da fonti diverse possono richiedere una pre-elaborazione per tracciare l'identificativo del visitatore.

Vista astratta

Questo diagramma mostra come più sorgenti si fondano in un unico dataset.  Esaminiamo ogni sezione.

Dati di log grezzi

Sulla sinistra, abbiamo le fonti di log. In questo esempio utilizziamo i log del server Web e le transazioni in negozio (POS). Data Workbench può accettare qualsiasi dato di log degli eventi a condizione che abbiano l'identificativo del visitatore e il timestamp.  

A questo punto sono conservati, il Web log mostra le attività dei visitatori sul sito Web mentre il POS log indica solo i dati in negozio.

Architettura dei dati

Al centro, si trova l'architettura dataset. Questo definisce il modo in cui ogni fonte di log dovrebbe adattarsi. Inoltre, indica come trasformarli in una forma più leggibile.

Dati dei visitatori elaborati (dataset)

Infine, i dati degli eventi di tutti i canali sono memorizzati nei dati di un unico visitatore, in modo simile a una carta contenente tutti i dati dell'evento per un visitatore reso anonimo. Contiene l'attività di un visitatore sul Web oltre a ciò che ha acquistato nei punti vendita.

In parole povere, i dati di input grezzi a sinistra confluiscono nei dati dei visitatori elaborati a destra, utilizzando l'architettura dei dati come modello.

Esame più attento

Ripercorriamo questo processo utilizzando dati di esempio.

Da un log di un server Web, ogni voce di log viene decodificata e quindi posizionata nelle dimensioni rilevanti dello schema. In questo esempio, il visitatore "anonymous001" ha acquistato un prodotto e ha selezionato il ritiro in negozio.

Anche le transazioni in negozio vengono decodificate per lo stesso visitatore. Questa persona ha ritirato il prodotto il giorno successivo e ha deciso di aggiungere altri due articoli arrivato al registratore di cassa.

I dati relativi all'attività vengono poi trasformati in un formato adatto per le query.  In questo caso, la SKU del prodotto viene sostituita con il nome del prodotto utilizzando la trasformazione di ricerca.

Una volta che i dati di tutti i canali si sono combinati insieme, ottieni i dati di un visitatore su una singola scheda.

Questa scheda mostra che un cliente anonimo ha ordinato un articolo online, l'ha ritirato nel negozio e ha acquistato altri articoli.  A differenza dei dati di input originali, una sola scheda fornisce un'informazione approfondita olistica delle attività dei visitatori attraverso i diversi canali.

Query in corso

Ora che i dati di un visitatore sono stati elaborati, considera la seguente query analitica.

"Tra i clienti che hanno inoltrato ordini di ritiro sul Web, quanti hanno acquistato articoli aggiuntivi in negozio? Inoltre, quali prodotti erano popolari come aggiunte in negozio?"

Guardando la scheda qui sopra, il motore di query dovrebbe eseguire un conteggio:

+1 metrica visitatore per il ritiro in negozio
+1 prodotto per "Cavo USB" per la dimensione acquisto aggiuntivo
+1 prodotto per "Kale Chips" per la dimensione acquisto aggiuntivo

Ripetendo questa micro query per tutte le altre schede, alla fine si otterrà la risposta all'intero dataset.

Considerazione delle prestazioni

Questo approccio offre i seguenti vantaggi:

  1. Le schede sono autonome, per cui le micro query sono completate da meno riferimenti esterni costosi.
  2. Queste schede possono essere facilmente distribuite per l'elaborazione parallela.

DataSet

Tutte le schede sono memorizzate su un contenitore di schede noto come DataSet, che viene comunemente chiamato "temp.db" a causa del nome del suo file.

Poiché questa ruota continua a girare, è possibile valutare le schede una a una. Quando la stessa scheda è stata mostrata di nuovo, sai che una scansione è terminata e che l'intero dataset è stato valutato.

L'intero ciclo di vita del dataset viene trattato nel prossimo articolo qui.

Ottieni supporto in modo più facile e veloce

Nuovo utente?