Ir para o conteúdo

Página de execução de experimento

Como visualizar e gerenciar execuções de experimentos

Ao entrar em um projeto e selecionar uma definição de experimento, é possível listar todas as execuções realizadas dessa definição e o status das que estão em andamento. A página lista as execuções em ordem cronológica (do mais recente para o mais antigo), conforme lista a figura a seguir:

Execução de Experimentos

Atualmente, cada execução permite as seguintes ações:

  • Monitorar em tempo real (apenas disponível para execuções em andamento)

  • Acompanhamento do status: Uma barra de progresso é disponibilizada para que o experimentador identifique o estado atual da execução e estime o tempo restante considerando o tempo total do experimento.

  • Atualmente, a implementação considera os últimos 10% da execução do experimento como a etapa responsável por salvar dados. O tempo necessário para concluir esta etapa pode variar dependendo da quantidade de dados salvos

  • Deletar execuções: Esta ação irá eliminar a execução da tabela. Após essa ação, apesar de não ser garantido, os resultados ainda estarão salvos no sistema, podendo ser possível a recuperação mediante contato com os administradores do sistema.

  • Baixar logs: Esta ação irá baixar um arquivo .tar.gz que contém logs e informações relacionadas ao experimento gerada pelo sistema, e também os resultados persistentes especificados nas definições de experimento que podem ser especificadas por meio da chave persitent_volume_path de cada conjunto de nós simulados. Dentre as informações padrões encontradas no arquivo, estão:

    • experiment_logs_X.tar: Arquivo que contém os logs dos containers executados no cluster Kubernetes, que incluem o STDOUT e STDERR de cada container. Dentro desse arquivo é possível obter um arquivo txt com o log de cada container.

    • MENTORED_IP_LIST.[json|yaml]: Arquivo que lista o IP atribuído a cada nó do experimento atribuído no início da execução

    • MENTORED_READY.txt: Arquivo utilizado para gerenciar o WARMUP do experimento e que contém o timestamp em que o experimento de fato foi iniciado.

    • <Node-Actor>/<Node-Actor>-X_container.tar: Diretório contendo os arquivos salvos para cada container do experimento que teve o seu persistent_volume_path definido.

Exemplo da estrutura dos logs de um experimento:

Exemplo da Estrutura dos Logs

Monitoramento de experimentos em tempo real

Para executar o monitoramento em tempo real, o usuário pode monitorar o ataque em tempo real usando a ferramenta Web Kubectl, com monitoramento mais detalhado disponível em Monitor em Tempo Real.

Monitoramento em tempo real da execução de experimentos

Verificação do status do experimento

Além disso, você pode verificar o status do experimento por meio das cores exibidas na coluna de status:

  • Cinza significa que o experimento ainda não foi executado ou encontrou um erro antes de iniciar.
  • Amarelo significa que o experimento está sendo executado no momento.
  • Vermelho significa que o experimento foi executado, mas ocorreu um erro durante a execução.
  • Verde significa que o experimento foi executado sem erros e foi concluído.

Status de Execução de Experimentos