Tilroy experienced a critical incident on April 29, 2024 affecting Point Of Sale and E-commerce and 1 more component, lasting 1h 30m. The incident has been resolved; the full update timeline is below.
Affected components
Update timeline
- investigating Apr 29, 2024, 02:18 PM UTC
Tilroy is not available at the moment. Investigation in progress.
- investigating Apr 29, 2024, 02:33 PM UTC
We identified a problem with session management in the system. Investigation in progress. Use offline mode in the Store.
- investigating Apr 29, 2024, 02:55 PM UTC
We are working on the case with the hosting provider. will keep you informed as soon as we have an update.
- investigating Apr 29, 2024, 03:26 PM UTC
Problem is identified, we are working on a solution
- identified Apr 29, 2024, 03:30 PM UTC
we estimate a few minutes
- resolved Apr 29, 2024, 03:48 PM UTC
This is solved. This was a severe downtime, more info about the problem later this evening.
- postmortem Apr 29, 2024, 06:15 PM UTC
\(English version located after Dutch\) In dit bericht meer informatie over de serviceonderbreking van Tilroy e-commerce- als kassafunctionaliteiten op 29/04/2024 tussen 16:15 en 17:45. We bieden onze oprechte excuses aan voor het ongemak en de verstoring van je winkel en webshop die dit heeft veroorzaakt. Dit is de langste uitval sinds 2016, de start van Tilroy. **Samenvatting van het Incident** De uitval werd veroorzaakt door een storing in ons centrale sessieopslagsysteem \(AWS Redis\), dat cruciaal is voor het beheren van gebruikerssessies over ons platform. Het falen van dit onderdeel maakte ons systeem volledig onbeschikbaar of onwerkbaar traag. **Genomen Stappen** Na het detecteren van het probleem werd een oplossing gezocht in samenwerking met support van AWS, de hosting provider. Onmiddellijke acties werden ondernomen om de functionaliteit te herstellen door het vervangen van de Redis database, en onze systemen werden systematisch weer online gebracht. Volledige service werd hervat na 1,5 uur downtime. **Over de Offline Modus** We zien dat vele klanten de offline modus gebruikt hebben om de verkopen te registreren. Deze verkopen zullen verwerkt in de loop van deze nacht. Gezien het aantal vraagt dit enkele uren tijd voor verwerking. We merkten ook dat niet iedereen zich bewust was van deze optie of in staat was om deze functie te gebruiken tijdens de uitval. De offline modus is ontworpen om de continuïteit van uw verkoopactiviteiten tijdens dergelijke onvoorziene onderbrekingen te waarborgen. We raden al onze klanten aan om de offline modus te testen en zich vertrouwd te maken. Zorg ervoor dat alle medewerkers worden geïnstrueerd over hoe deze modus te activeren en te bedienen mocht dit nodig zijn. **Blijf Geïnformeerd** Om tijdige updates en statusmeldingen over ons platform te ontvangen, controleer en abonneer op [http://status.tilroy.com](http://status.tilroy.com) In het geval van een aanzienlijke pannen kunnen we onmogelijk u telefonisch te woord staan. Door u te abonneren op de statuspagina, zorgt u ervoor dat u direct op de hoogte wordt gebracht van eventuele problemen en updates. **Focus op Betrouwbaarheid** We willen u verzekeren dat incidenten van deze omvang zoals deze zeldzaam zijn en we blijven voortdurend streven naar het onderhouden en verbeteren van de betrouwbaarheid van onze diensten. Onze toewijding aan betrouwbaarheid van Tilroy blijft onze hoogste prioriteit en we nemen extra stappen om toekomstige incidenten te voorkomen. Komende dagen zullen we aanpassingen doorvoeren om het probleem van vandaag te voorkomen. We begrijpen het kritieke belang van onze diensten voor uw bedrijfsvoering en waarderen uw begrip in dit zwaar incident. Met vriendelijke groet, Peter De Ranter CEO --- In this message, more information about the service interruption of Tilroy e-commerce and cash register functionalities on 04/29/2024 between 16:15 and 17:45. We offer our sincere apologies for the inconvenience and disruption to your store and webshop this has caused. This is the longest outage since 2016, the start of Tilroy. **Incident Summary** The outage was caused by a malfunction in our central session storage system \(AWS Redis\), which is crucial for managing user sessions across our platform. The failure of this component rendered our system completely unavailable or painfully slow. **Steps Taken** Upon detecting the issue, a solution was sought in collaboration with AWS support, our hosting provider. Immediate actions were taken to restore functionality by replacing the Redis database, and our systems were systematically brought back online. Full service was resumed after 1.5 hours of downtime. **About Offline Mode** We see that many customers have used the offline mode to register sales. These sales will be processed over the course of this night. Given the number of sales, it will take several hours to process. We also noticed that not everyone was aware of this option or able to use this feature during the outage. The offline mode is designed to ensure the continuity of your sales activities during such unforeseen interruptions. We advise all our customers to test the offline mode and familiarize themselves with it. Ensure that all employees are instructed on how to activate and operate this mode if necessary. **Stay Informed** To receive timely updates and status notifications about our platform, check and subscribe to [http://status.tilroy.co](http://status.tilroy.com)m In the event of a significant outage, we may be unable to speak with you by phone. By subscribing to the status page, you ensure that you are directly notified of any issues and updates. **Focus on Reliability** We want to assure you that incidents of this magnitude are rare, and we continue to strive to maintain and improve the reliability of our services. Our commitment to Tilroy's reliability remains our highest priority, and we are taking extra steps to prevent future incidents. In the coming days, we will make adjustments to prevent today's problem. We understand the critical importance of our services to your business operations and appreciate your understanding in this severe incident. Kind regards, Peter De Ranter CEO