Com o Adobe Analytics Data Workbench, os analistas podem consultar as atividades dos visitantes em diferentes canais. Este artigo mostra como eles se mesclam em um único dado do visitante para consultas.
Este artigo é uma ilustração simplificada estritamente. Por exemplo, cada dado do visitante consiste em referências/ponteiros em vez de sequências reais, e dados de diferentes origens podem exigir pré-processamento para mapear o identificador do visitante.
Visão abstrata
Esse diagrama mostra como várias fontes se mesclam em um conjunto de dados. Vamos analisar todas as seções.
Dados de log não processados
À esquerda, temos origens de log. Usamos logs do servidor web e transações na loja (PDV) neste exemplo. O Data Workbench pode obter todos os dados do log de eventos, desde que eles tenham identificador de visitante e carimbo de data e hora.
Observe que eles estão em silos neste ponto, o log da Web mostra o que os visitantes fazem no site, enquanto o log do PDV informa somente os dados da loja.
Arquitetura de dados
No meio, temos a arquitetura do conjunto de dados. Isso define como cada origem de log deve se ajustar. Ele também instrui como eles devem ser transformados em um formato mais legível.
Dados de visitantes processados (conjunto de dados)
Por fim, os dados de eventos de todos os canais são armazenados em dados de um visitante, isto é semelhante a um cartão que contém todos os dados do evento para um visitante anônimo. Ele contém o que um visitante fez na Web além do que ele ou ela comprou nos locais da loja.
Simplificando, os Dados de entrada não processados à esquerda estão fluindo para os Dados de visitantes processados à direita usando a Arquitetura de Dados como um template.
Visualização detalhada
Vamos analisar esse processo novamente usando dados de exemplo.
A partir de um log do servidor web, cada entrada de log é decodificada e, em seguida, colocada em dimensões relevantes no esquema. Neste exemplo, o visitante "anonymous001" comprou um produto e selecionou a retirada na loja.
Transações na loja também são decodificadas para o mesmo visitante. Essa pessoa retirou o produto no dia seguinte e decidiu adicionar mais dois itens na caixa registradora.
Os dados da atividade são então transformados em formato adequado para consultas. Nesse caso, o SKU do produto é substituído pelo nome do produto usando transformação de pesquisa.
Após combinar dados de todos os canais, teremos os dados de um visitante em um único cartão.
Esse cartão mostra que um cliente anônimo solicitou um item on-line, retirou-o na loja e comprou itens adicionais. Ao contrário dos dados de entrada originais, um cartão fornece uma visão holística das atividades dos visitantes em diferentes canais.
Execução de consultas
Agora que um dado de visitante é processado, vamos considerar a seguinte consulta analítica.
"Entre os clientes que fizeram pedidos na web para retirar na loja, quantos compraram itens adicionais na loja? Além disso, quais produtos eram populares como um complemento na loja?"
Ao olhar para o cartão acima, o mecanismo de consulta deve calcular:
+1 visitante para métrica de retirada na loja
+1 produto para “Cabo USB” para uma dimensão de compra adicional
+1 produto para "Kale Chips" para a dimensão de compra adicional
Repetir esta micro consulta para todos os outros cartões acabará gerando a resposta para todo o conjunto de dados.
Consideração de desempenho
Essa abordagem oferece as seguintes vantagens:
- Os cartões são independentes, portanto, as micro consultas concluem com menos referências externas dispendiosas.
- Esses cartões podem ser facilmente distribuídos para processamento paralelo.
Conjunto de dados
Todos os cartões são armazenados em um titular de cartão conhecido como Conjunto de dados, normalmente referido pelo seu nome de arquivo "temp.db".
Como continua progredindo, cada cartão pode ser avaliado individualmente. Quando o mesmo cartão é exibido novamente, significa que uma varredura foi concluída e todo o conjunto de dados foi avaliado.
Nós cobrimos o ciclo de vida geral do conjunto de dados no próximo artigo aqui.