No dia 25 de maio, entre 10h40 e 14h00, identificamos uma instabilidade em um de nossos serviços de mensageria, que impactou temporariamente o processamento de algumas mensagens.
A Engenharia da OmniChat identificou que a origem da lentidão estava em um dos nossos principais serviços, responsável pelo processamento de eventos e pela integração com sistemas internos. Durante o período, esse serviço apresentou uma instabilidade crítica, o que causou degradação no funcionamento da plataforma e resultou na interrupção temporária no envio e recebimento de mensagens.
Resolução e prevenção:
A Engenharia da OmniChat tomou conhecimento dos primeiros relatos às 10h50 do dia 25 de maio. A partir desse momento, o time responsável iniciou imediatamente a investigação e atuou para reduzir os impactos.
Durante o período, foram realizadas análises detalhadas nos serviços que apresentaram degradação, com o objetivo de identificar e isolar a causa do problema.
Às 13h50 do mesmo dia, a causa foi identificada e uma ação de manutenção emergencial foi aplicada, normalizando o funcionamento da plataforma.
Para evitar a recorrência e aumentar a resiliência dos nossos serviços, estamos adotando as seguintes melhorias: