Mit Adobe Analytics Data Workbench können Analysten Besucheraktivitäten über verschiedene Kanäle abfragen. Dieser Artikel zeigt, wie sie für Abfragen zu einzelnen Besucherdaten zusammengeführt werden.
Dieser Artikel ist eine vereinfachte Illustration. Zum Beispiel bestehen die Besucherdaten aus Referenzen / Zeigern anstelle von tatsächlichen Zeichenfolgen, und Daten aus verschiedenen Quellen müssen möglicherweise vorverarbeitet werden, um die Kennung des Besuchers abzubilden.
Abstrakte Ansicht
Dieses Diagramm zeigt, wie mehrere Quellen zu einem Datensatz zusammengeführt werden. Lassen Sie uns jeden Abschnitt durchgehen.
Rohprotokolldaten
Auf der linken Seite haben wir Protokoll-Quellen. In diesem Beispiel verwenden wir Webserver-Protokolle und In-Store-Transaktionen (POS). Data Workbench kann alle Ereignisprotokolldaten verwenden, sofern sie über Besucher-ID und Zeitstempel verfügen.
Beachten Sie, dass sie an dieser Stelle isoliert sind. Das Webprotokoll zeigt an, was Besucher auf der Website tun, während das POS-Protokoll nur In-Store-Daten angibt.
Datenarchitektur
In der Mitte haben wir die Datensatz-Architektur. Dadurch wird festgelegt, wie die einzelnen Protokoll-Quellen übereinstimmen sollen. Dies weist auch an, wie sie in eine lesbarere Form umgewandelt werden sollten.
Verarbeitete Mitarbeiterdaten (Datensatz)
Schließlich werden Ereignisdaten von allen Kanälen in einer Besucherdatei gespeichert, dies ist vergleichbar mit einer Karte, die alle Ereignisdaten für einen anonymisierten Besucher enthält. Sie enthält die Handlungen eines Besuchers im Web, zusätzlich zu dem, was er oder sie an den Verkaufsorten erworben hat.
Vereinfacht gesagt, fließen die Rohen Eingabedaten auf der linken Seite in die Verarbeiteten Besucherdaten auf der rechten Seite mithilfe der Datenarchitektur als Vorlage.
Nähere Betrachtung
Wiederholen wir diesen Vorgang erneut mit Beispieldaten.
Jeder Protokolleintrag aus einem Webserver-Protokoll wird dekodiert und dann auf relevante Dimensionen des Schemas platziert. In diesem Beispiel hat Besucher „anonymous001“ ein Produkt gekauft und „In-store Pickup“ ausgegewählt.
In-store-Transaktionen werden für denselben Besucher ebenfalls dekodiert. Diese Person hat das Produkt am folgenden Tag aufgenommen und entschieden, zwei weitere Artikel an der Registrierkasse hinzuzufügen.
Aktivitätsdaten werden dann in ein für Abfragen geeignetes Format umgewandelt. In diesem Fall wird Produkt-SKU mithilfe der Nachschlageumwandlung mit seinem Produktnamen ersetzt.
Sobald die Daten aller Kanäle kombiniert sind, erhalten wir Besucherdaten auf einer einzelnen Karte.
Diese Karte zeigt, dass ein anonymer Kunde einen Artikel online bestellt, es im Geschäft abgeholt und zusätzliche Artikel gekauft hat. Anders als ursprüngliche Eingabedaten enthält eine Karte ganzheitliche Einsichten in Besucheraktivitäten auf verschiedenen Kanälen.
Ausführen von Abfragen
Nachdem jetzt eine Art Besucherdaten verarbeitet wurde, ziehen wir die folgende analytische Abfrage in Betracht.
„Wie viele der Kunden, die Abholaufträge im Web gemacht haben, kauften zusätzliche Artikel im Store? Welche Produkte waren außerdem am beliebtesten als Zusatzverkäufe im Geschäft?“
Auf der obigen Karte sollte die Abfrage-Engine folgendes aufzählen:
+1 Besucher in der In-store Pickup-Metrik
+1 Produkt unter „USB-Kabel“ als zusätzliche Kaufoption
+1 Produkt unter „Kohl-Chips“ als zusätzliche Kaufoption
Das Wiederholen dieser Mikro-Abfrage für alle anderen Karten führt letztendlich zur Antwort für den gesamten Datensatz.
Leistungserwägungen
Dieser Ansatz bietet folgende Vorteile:
- Die Karten sind eigenständig, sodass Mikro-Abfragen mit weniger kostspieligen externen Verweisen abgeschlossen werden.
- Diese Karten können zur parallelen Verarbeitung verteilt werden.
Datensatz
Alle Karten werden auf einem Kartenhalter gespeichert, der als Datensatz bekannt ist, welcher aufgrund des Dateinamens häufig als „temp.db“ bezeichnet wird.
Während sich dieses Rad dreht, kann jede Karte einzeln bewertet werden. Wenn dieselbe Karte erneut angezeigt wurde, wissen Sie, dass ein ganzer Sweep abgeschlossen und der gesamte Datensatz ausgewertet wurde.
Wir reden über den Gesamtlebenszyklus des Datensatzes im folgenden Artikel hier.