Instabilidade no serviço de especialista de produtos
Incident Report for OmniChat
Resolved
O que aconteceu?

Entre 09:00 e 17:00 do dia 15/04/2024 a funcionalidade de especialista de produtos apresentou problemas em seu funcionamento.

Causa Raiz:

Às 09:15 o time de engenharia da Omni identificou um problema de conectividade com o banco de dados do serviço de especialista de produtos. O problema impactou a geração das repostas da funcionalidade em questão.
Foram realizados diversos testes de conectividade com o banco de dados, inclusive revisão do componente responsável por gerenciar as conexões com o banco.
O time responsável focou em entender o problema, e após análise minuciosa, foi constatado a causa do problema.
Foi identificado que houve uma falha por parte do nosso fornecedor de Cloud, onde o serviço de dados não inicializou como deveria. Pela natureza de seu funcionamento de desligamento automático em caso de não requisições por um período, o banco não era reinicializado como era esperado em uma próxima requisição. Impossibilitando o correto funcionamento da aplicação.

Resolução e prevenção:

Aproximadamente as 16:00 do mesmo dia, após identificado a origem do problema, onde foi forçada uma reinicialização do serviço de dados, ação esta que reestabeleceu o serviço de forma definitiva às 17 horas.
Contactamos ainda nosso fornecedor de Cloud sobre o ocorrido em busca da garantia da confiabilidade do componente em que houve a falha.
De maneira preventiva, e a fim de evitar que problemas do mesmo tipo venha a afetar nossos serviços, planejamos a implementação de alarmes e verificações específicas para o serviço de banco de dados utilizados nessa aplicação.
Posted Apr 15, 2024 - 09:00 GMT-03:00