Instabilidade no envio de mensagens e interações com o atendente virtual
Incident Report for OmniChat
Postmortem

O que aconteceu?

Entre 11:01 de 24 de novembro de 2022 e 12:07 de 24 de novembro de 2022, a plataforma da OmniChat apresentou um problema que causou instabilidade nos atendimentos efetuados via atendente virtual.

 

Causa Raiz:

A Engenharia da OmniChat identificou o problema, que aconteceu devido à sobrecarga em um componente de cache responsável por auxiliar na sincronização dos atendimentos.

 

Resolução e prevenção:

A Engenharia da OmniChat identificou o problema às 11h05 do dia 24 de novembro, através de alarmes de monitoramento e chamados no suporte. Desde então a engenharia da OmniChat trabalhou para isolar e atenuar o problema. 

Foram executadas análises em todos os serviços que foram afetados pelo mau funcionamento, a fim de isolar a encontrar a causa raiz .

Às 11:36h do dia 24 de novembro a engenharia da OmniChat encontrou a causa do problema e executou o procedimento de manutenção emergencial para que o problema fosse sanado.

 Para evitar a recorrência do problema, agir de forma ativa e mais assertiva, a equipe de engenharia está tomando as seguintes ações:

 

  • Adição de novos alarmes e monitoramentos específicos para esse tipo de problema.
  • Execução de medidas preventivas para auto resolução em caso de falha no componente afetado.
  • Escala adequada para o componente em questão.

 

A OmniChat está comprometida em melhorar continuamente nossa tecnologia e operações para evitar interrupções e degradações do serviço. Agradecemos sua paciência e pedimos desculpas por qualquer impacto em sua organização.

Posted Nov 25, 2022 - 16:45 GMT-03:00

Resolved
O problema com a plataforma foi resolvido. Lamentamos o transtorno e agradecemos a paciência. Tenha certeza de que a confiabilidade do sistema é uma prioridade para a Omnichat, estamos fazendo aprimoramentos contínuos para tornar a sua experiência cada vez melhor. O postmortem será publicado nos próximos dias com maiores detalhes sobre o incidente.
Posted Nov 24, 2022 - 17:42 GMT-03:00
Monitoring
Efetuamos uma correção em nosso ambiente que resolveu o problema do bot. Nosso time continua monitorando o tema para garantir que o problema foi, de fato, sanado.
Posted Nov 24, 2022 - 12:50 GMT-03:00
Identified
Foi identificado o problema que causou a instabilidade. Estamos efetuando as tratativas necessárias.
Posted Nov 24, 2022 - 12:07 GMT-03:00
Investigating
Estamos investigando relatos de um problema no envio de mensagens. Forneceremos mais informações em breve. Os usuários afetados enfrentam lentidão no envio de mensagens e interações com o bot.
Posted Nov 24, 2022 - 11:36 GMT-03:00
This incident affected: API, App - https://app.omni.chat and Automations (Bot).