Karte.io incident

KARTEの管理画面、Messageβの配信、Datahubの一部機能にて障害が発生しています

Major Resolved View vendor source →

Karte.io experienced a major incident on May 30, 2024 affecting 管理画面, lasting 3h 53m. The incident has been resolved; the full update timeline is below.

Started
May 30, 2024, 09:09 AM UTC
Resolved
May 30, 2024, 01:03 PM UTC
Duration
3h 53m
Detected by Pingoru
May 30, 2024, 09:09 AM UTC

Affected components

管理画面

Update timeline

  1. investigating May 30, 2024, 09:09 AM UTC

    KARTEの管理画面にて障害が発生しています。 想定される主な影響は次の通りです。 ■ 対象プロジェクト - 全プロジェクト ■ 発生している現象 - Insight、Actionの画面で表示に失敗することがあります。 - その他の管理画面についても影響が考えられ、現在調査中です。 現在、開発チームが原因を調査中です。 約1時間以内に続報を掲載します。

  2. investigating May 30, 2024, 10:27 AM UTC

    現在、障害解消のための対応を行い、影響の詳細調査を行っています。

  3. resolved May 30, 2024, 01:03 PM UTC

    障害が解消したのでご報告します。 ■ 対象プロジェクト - KARTEを利用中の全プロジェクト ■ 発生期間 - KARTE管理画面で表示が失敗する可能性があった期間 - 2024/05/30 17:07頃 〜 2024/05/30 18:20頃 - MessageβやDatahubで、通常よりも遅延や失敗が発生する可能性が高かった期間 - 遅延:2024/05/30 17:00頃 〜 2024/05/30 19:00頃 - 失敗:2024/05/30 18:22頃 〜 2024/05/30 19:24頃 ■ 発生した現象 - KARTEの管理画面で表示に失敗することがありました。 - 次の配信や実行に失敗する可能性、及び通常よりも時間がかかる可能性がありました。 - ターゲット配信 - Messageβ - Datahubのクエリ実行 - Datahubのジョブフロー ■ 実施した対応 - 負荷の高いSQLの実行をキャンセルしました。 この度はご迷惑をおかけし、大変申し訳ございませんでした。 なお、本障害の詳細や事後対応については、追って記載します。

  4. postmortem Jun 10, 2024, 12:04 AM UTC

    この度発生したKARTEの管理画面、Messageβの配信、Datahubの一部機能に関する障害について、下記の通りご報告致します。 --- **発生期間** * KARTE管理画面で表示が失敗する可能性があった期間 * 2024/05/30 17:07頃 〜 2024/05/30 18:20頃 * MessageβやDatahubで、通常よりも遅延や失敗が発生する可能性が高かった期間 * 遅延:2024/05/30 17:00頃 〜 2024/05/30 19:00頃 * 失敗:2024/05/30 18:22頃 〜 2024/05/30 19:24頃 **対象のプロジェクト** * KARTEを利用中の全プロジェクト **発生した現象** * KARTEの管理画面で表示に失敗することがありました。 * 次の配信や実行に失敗する可能性、及び通常よりも時間がかかる可能性がありました。 * ターゲット配信 * Messageβ * Datahubのクエリ実行 * Datahubのジョブフロー **発生原因** * 利用しているデータベースのジョブの数や負荷が上昇した結果、処理可能な量を超えたため。 **実施した対応** * 負荷の高いSQLの実行をキャンセルしました。 **今後の対応** * データベース内での処理やスケールについて、負荷が集中しないように設定値等の見直しを行います。 * 再発時に迅速に対応できるように監視を見直します。 --- この度はご迷惑をおかけしてしまい、誠に申し訳ございませんでした。