Objetivo

Este artigo descreve os problemas mais comuns de ingestão de ativos do AEM e como analisá-los.

  • Processamento elevado
  • Volume elevado
  • Repositórios de DAM grandes
  • Muitos autores simultâneos

Cenários e Soluções de Ingestão

Cenário 1: processamento elevado

Situações como importações em massa, como 2000 imagens de uma só vez, causam instâncias de autor de alta CPU e memória.

Solução: Descarregar trabalhos para outra instância do AEM. É possível descarregar workflows inteiros ou apenas algumas etapas pesadas, conectando a instância de processamento às instâncias principais do autor por meio de trabalhadores proxy do DAM. A instância principal do autor, portanto, permanece livre para atender a outros usuários. Os trabalhadores proxy do DAM são responsáveis por supervisionar as tarefas remotas, reunir os resultados e alimentá-los na execução do workflow local.

 

Cenário 2: Volume elevado

Instâncias com banco de dados de alguns milhões de produtos que têm 12.000 modificações por dia. O repositório se torna o gargalo em tais sceanrios. Enquanto as gravações estão acontecendo, as leituras são bloqueadas para fins de consistência.

Solução: Para evitar essa situação, separe o processo de importação em uma instância de autor dedicada com seu repositório próprio. Na conclusão, replique um delta completo para o ambiente do autor, com replicação encadeada para o ambiente de publicação, se necessário. Use uma fila de replicação reservada para evitar o atraso na publicação de alterações editoriais importantes.

 

Cenário 3: Repositórios DAM grandes. Repositórios enormes, por exemplo com mais de 7 milhões de ativos, 20 milhões de nós e 15 TB de tamanho de disco. Isso afeta o desempenho da instância. 

Solução: Divida o armazenamento persistente e o armazenamento de dados (otimizado para lidar com binários grandes). O armazenamento persistente requer E/S de latência muito baixa, portanto, o armazenamento local funciona melhor. Para o armazenamento de dados, uma latência maior é aceitável.

 

Cenário 4: Muitos autores simultâneos podem afetar o desempenho e o processamento.

Solução: Autores simultâneos são usuários que estão trabalhando ativamente no sistema. Autores logados, mas inativos, não colocam carga adicional no sistema. Operações como edição, upload de recursos, disparo de workflows da CPU, ativos de pesquisa, download e memória modificam metadados. A formação de um cluster de instâncias de autor com um dispatcher na frente ajuda a distribuir a carga da CPU uniformemente. Com um grande número de autores em produção ativa, recomenda-se desmembrar cada projeto em uma instância ou ambiente de autor separado onde ocorre o trabalho em andamento. Essa técnica é chamada de particionamento de conteúdo.