Unico incident
Instabilidade no Processamento de Eventos Assíncronos - Webhook
Unico experienced a notice incident on May 7, 2026, lasting —. The incident has been resolved; the full update timeline is below.
Update timeline
- resolved May 07, 2026, 02:18 PM UTC
Resumo Executivo e Impacto Identificamos uma intercorrência em nossa plataforma entre 21:00 e 21:08, resultando em um atraso no processamento de filas assíncronas e no envio de notificações de saída (webhooks). Durante este intervalo de 8 minutos, o sistema apresentou latência na entrega de eventos, afetando a execução de fluxos em tempo real. O impacto deu-se para uma parcela mínima de clientes. Reiteramos que não houve perda de dados; todas as notificações acumuladas foram processadas e entregues integralmente após a estabilização do componente. Clientes que não identificaram elevação no tempo de resposta em seus logs de integração durante este período específico não foram afetados. Causa Raiz e Resolução A causa raiz foi uma falha em um componente de infraestrutura responsável pela gestão de mensagens e eventos assíncronos. Esta instabilidade causou o reinício (restart) automático do serviço, interrompendo momentaneamente a vazão das filas. A resolução ocorreu de forma automática através dos mecanismos de autorrecuperação da nossa camada de infraestrutura, que restabeleceu o serviço e permitiu o escoamento das tarefas represadas até que o processamento voltasse ao estado de normalidade. Compromisso e Próximos Passos Estamos comprometidos com a alta disponibilidade de nossos serviços. Como ação imediata, nossa equipe de SRE e Integrações iniciou a revisão das métricas de monitoramento e a criação de novos indicadores de nível de serviço (SLO) para garantir maior previsibilidade e robustez neste componente. Um Postmortem detalhado com a análise técnica profunda e o plano de mitigação de longo prazo será compartilhado em breve. Pedimos desculpas profissionalmente pelo transtorno causado à sua operação. Equipe Unico.
- postmortem Jun 02, 2026, 07:54 PM UTC
**Data do Incidente:** 06 de maio de 2026 **Duração do Impacto:** 21:00 às 21:08 \(Horário de Brasília\) **Status:** Resolvido **Resumo Executivo** Em 06 de maio de 2026, nossa plataforma registrou uma degradação temporária no processamento de eventos assíncronos, afetando o serviço de entrega de notificações \(_webhooks_\). O incidente durou aproximadamente 8 minutos e foi causado por uma falha em um componente interno da nossa infraestrutura. O sistema se recuperou de forma autônoma, processando os eventos retidos e normalizando as entregas logo em seguida. **Impacto** Clientes que dependem do recebimento de notificações \(_webhooks_\) em tempo real para a continuidade de seus fluxos de negócio experimentaram atrasos na recepção das confirmações. * **Sintomas:** Os eventos gerados pela plataforma entraram em uma fila de espera e sofreram atrasos de até 240 segundos para serem efetivamente disparados aos servidores dos clientes. * Nenhum dado ou evento foi perdido; o impacto restringiu-se exclusivamente à latência \(tempo de espera\) na entrega das mensagens. **Causa Raiz** A instabilidade foi desencadeada por uma anomalia em um componente responsável por capturar e gerenciar eventos em segundo plano \(processamento assíncrono\). Nossa equipe também identificou que oportunidades de monitoramento específico no tempo de entrega \(_latência_\) de webhooks que potencialmente reduziria o tempo de ação pela equipe técnica. **Resolução e Mitigação** O serviço demonstrou resiliência e capacidade de autorrecuperação \(_auto-healing_\) diante da anomalia. * O componente reiniciou automaticamente com sucesso, processou toda a fila acumulada e restabeleceu o tráfego contínuo. * Não foi necessária a intervenção manual da nossa equipe de engenharia para reestabelecer o funcionamento da plataforma. * A estabilidade total das entregas em tempo real foi confirmada a partir das 21:08. **Lições Aprendidas e Ações Preventivas** Com o objetivo de aumentar a robustez e a observabilidade da nossa arquitetura, nossa equipe técnica definiu os seguintes direcionamentos: * **Métricas Específicas de Latência:** A implementação de indicadores de qualidade focados exclusivamente no tempo de entrega dos _webhooks_ foi estabelecida como prioridade. Isso permitirá uma detecção proativa e imediata caso novas instabilidades ocorram nas filas de mensageria. Nosso foco é garantir estabilidade em nossa infraestrutura e seguimos engajados na melhoria contínua em nossas soluções. Equipe Unico.