Karte.io experienced a major incident on August 1, 2025 affecting 管理画面 and 接客の配信 and 1 more component, lasting 1h 39m. The incident has been resolved; the full update timeline is below.
Affected components
Update timeline
- investigating Aug 01, 2025, 03:29 AM UTC
KARTEで障害が発生しています。 想定される主な影響は次の通りです。 ■ 対象プロジェクト - 調査中のため判明次第更新します。 ■ 発生している現象 KARTEの機能について広範囲で不具合が発生しています。確認ができた事象については以下の通りです。 - 「Insight > ユーザーリスト > ユーザーストーリー」 でエンドユーザーデータの読み込みに失敗する - Talk及びChatのメッセージの送信に失敗することがある - ターゲット配信に失敗することがある ユーザーデータやイベントデータを取得する際にエラーが発生することがあり、詳しい影響範囲を調査中です。 現在、開発チームが原因を調査中です。 約1時間以内に続報を掲載します。
- resolved Aug 01, 2025, 05:08 AM UTC
障害が解消したのでご報告します。 ■ 発生期間 2025/08/01 11:40頃〜13:20頃 ■ 対象プロジェクト KARTEおよびRightSupport by KARTEを利用中の全プロジェクトに影響がございました。詳しい影響は次項をご確認ください。 ■ 発生した現象 - 「Insight > ユーザーリスト > ユーザーストーリー」 でエンドユーザーデータの読み込みに失敗する - Talk及びChatのメッセージの送信に失敗することがある - APIv2へのリクエストがエラーになることがある - 紐づけテーブルを更新するジョブフローが失敗することがある - 「RightConnect > コネクトボード」でユーザー情報(ユーザーID、セグメント等)が表示されない - 「RightConnect > コネクトボード」でKARTE Liveが表示されない ※ 先般の報告のターゲット配信については当障害の影響外でした。失礼いたしました。 ■ 原因 - 詳細調査中。 ■ 実施した対応 - サーバーのタイムアウト設定値の見直し - サーバー台数の増強 この度はご迷惑をおかけし、大変申し訳ございませんでした。 なお、本障害の詳細や事後対応については、追って記載します。
- postmortem Aug 05, 2025, 03:32 AM UTC
この度発生した KARTEおよびRightSupport by KARTE に関する障害について、下記の通りご報告致します。 --- **発生期間** 2025年08月01日11時40分頃 〜 13時20分頃 **対象のプロジェクト** KARTEおよびRightSupport by KARTEを利用中の全プロジェクトに影響がございました。詳しい影響は次項をご確認ください。 **発生した現象** KARTE Web * 「Insight > ユーザーリスト > ユーザーストーリー」 でエンドユーザーデータの読み込みに失敗することがある KARTE TALK * エンドユーザーがチャットのメッセージ送信に一部失敗する、遅延する * エンドユーザーがチャットのメッセージ受信に一部失敗する、遅延する * 接客サービス機能を使ったウェブチャット・Sendgridメール・LINEのイベント応答配信が一部失敗する、遅延する API v2 * API v2へのリクエストが一部エラーになる * https://api.karte.io/v2/talk/message/sendFromOperator * https://api.karte.io/v2/talk/message/sendFromUser * https://api.karte.io/v2beta/action/actionTable/records/upsert * https://api.karte.io/v2beta/track/event/get ※ 特に強く影響をうけたエンドポイントをピックアップしています。 RightConnect * 「RightConnect > コネクトボード」でユーザー情報(ユーザーID、セグメント等)が表示されない * 「RightConnect > コネクトボード」でKARTE Liveが表示されない **発生原因** サーバー間の通信において、予期せぬ遅延が断続的に発生しました。 この影響により、サーバーが正常に稼働しているかを確認する処理(データベースとの通信など)がタイムアウトし、システムが正常なサーバーを「異常」と誤判断してしまいました。結果として、多数のサーバーで再起動が繰り返され、サービス全体が不安定な状態となりました。 **実施した対応** * サーバーの疎通確認のタイムアウト設定を一時的に調整し、システムが不安定になる状況を回避しました。 * サーバーの台数を一時的に増強し、サービス全体の安定性を確保しました。 **今後の対応** 今回のような予期せぬ通信遅延を伴う複合的な障害の再発を完全に防ぐことは困難のため、影響を最小限に抑える対応を行います。 * 障害の予兆を自動検知する仕組みの強化 * 迅速なサービス復旧を可能にするための、サーバー起動プロセスの改善 * 障害の影響が全体に波及するのを防ぐための、システム構成の見直し --- この度はご迷惑をおかけしてしまい、誠に申し訳ございませんでした。