Huggy incident

Lentidão no recebimento de mensagens pelo Canal WhatsApp

Minor Resolved View vendor source →

Huggy experienced a minor incident on May 21, 2025 affecting WhatsApp, lasting 5h 45m. The incident has been resolved; the full update timeline is below.

Started
May 21, 2025, 03:15 PM UTC
Resolved
May 21, 2025, 09:00 PM UTC
Duration
5h 45m
Detected by Pingoru
May 21, 2025, 03:15 PM UTC

Affected components

WhatsApp

Update timeline

  1. investigating May 21, 2025, 03:38 PM UTC

    Estamos enfrentando uma lentidão no recebimento de mensagens via WhatsApp, afetando todos os provedores. O time de engenharia está investigando o caso com prioridade. Vale ressaltar que o envio de mensagens através do painel está funcionando normalmente. Verificamos também que instabilidade impactou o serviço de controle de status e notificações em tempo real. Agradecemos pela compreensão e manteremos todos atualizados sobre o andamento da resolução.

  2. monitoring May 21, 2025, 05:20 PM UTC

    Identificamos um pico de demanda em alguns de nossos serviços, o que ocasionou lentidão no processamento de mensagens e instabilidade temporária no controle de status dos usuários. Nossa equipe de Engenharia agiu rapidamente para implementar melhorias nos pontos críticos. Após a aplicação das correções e o autoescalonamento do sistema, os incidentes foram resolvidos e a operação foi totalmente normalizada. Agradecemos pela paciência e compreensão durante esse período. Continuamos monitorando ativamente nossos serviços para assegurar a estabilidade e a qualidade contínua para todos os usuários. Em caso de dúvidas, nossa equipe está à disposição.

  3. investigating May 21, 2025, 08:03 PM UTC

    Identificamos, novamente, uma recorrência de instabilidade em alguns de nossos serviços, o que pode causar lentidão no processamento de mensagens. Nossa equipe de Engenharia já está atuando na análise da causa raiz e trabalhando para solucionar o incidente o mais rápido possível. Manteremos todos atualizados conforme avançarmos com as investigações e correções necessárias. Agradecemos pela compreensão e permanecemos à disposição para qualquer dúvida.

  4. monitoring May 21, 2025, 08:46 PM UTC

    O incidente identificado anteriormente em alguns de nossos serviços foi resolvido. Nossa equipe de Engenharia concluiu as ações corretivas necessárias, e os serviços afetados já operam normalmente. Seguiremos monitorando para garantir a estabilidade do serviço. Agradecemos pela paciência e seguimos à disposição para quaisquer esclarecimentos.

  5. resolved May 22, 2025, 01:31 AM UTC

    A causa do problema foi identificada e a solução implementada. Pedimos desculpas pelo ocorrido e agradecemos a sua compreensão e paciência.

  6. postmortem May 30, 2025, 07:52 PM UTC

    ## Sumário Este relatório reúne informações do **incidente que impactou a plataforma Huggy no dia 21 de maio de 2025.** Identificamos que um serviço utilizado pela nossa infraestrutura de nuvem passou por uma instabilidade que deixou o processamento de dados mais lento, a ponto de causar indisponibilidade no servidor devido à sobrecarga de tarefas não concluídas. O incidente teve como impacto lentidão na troca de mensagens do canal WhatsApp, nas requisições da API, no serviço de controle de status do usuário e na entrega das notificações em tempo real. Como solução, ampliamos a capacidade de processamento do serviço para que a plataforma esteja mais preparada para lidar com situações adversas de soluções de terceiros. ## Linha do tempo * 📆 **21/05/2025 12:15 \(GMT-3\):** Identificação da instabilidade * 📆 **21/05/2025 14:20 \(GMT-3\):** Descoberta da causa raiz do incidente * 📆 **21/05/2025 14:20 \(GMT-3\):** Correção do sistema * 📆 **21/05/2025 17:03 \(GMT-3\):** Reincidência da instabilidade * 📆 **21/05/2025 17:46 \(GMT-3\):** Correção crítica do sistema * 📆 **21/05/2025 18:00 \(GMT-3\):** Normalização da plataforma ## Causa raiz do incidente Um dos serviços utilizados pela nossa infraestrutura de nuvem passou por uma instabilidade que deixou o processamento de dados mais lento, a ponto de causar indisponibilidade no servidor devido à sobrecarga de tarefas não concluídas. ## Impacto Detectamos inicialmente um impacto no envio e recebimento de mensagens do canal WhatsApp, mas os efeitos se estenderam a outros recursos da plataforma, como as requisições de API, o status dos usuários e a entrega em tempo real de notificações. ## Plano de ação Uma vez identificada a causa raiz, tentamos inicialmente reiniciar o serviço, mas pouco tempo depois houve uma nova queda no servidor. Visando aplicar uma solução definitiva, decidimos redimensionar a capacidade de processamento do serviço, o que impediu que houvesse uma nova indisponibilidade dos recursos enquanto a instabilidade do serviço não fosse resolvida. Nossa equipe de tecnologia continua atenta e em busca de melhorias para prevenir que situações adversas de soluções de terceiros não gerem impactos negativos no uso da plataforma Huggy.