【障害・復旧情報】2020/1/30 ABEJA Platform障害のお知らせ

表題の件につきまして、ABEJA PlatformのHTTP Service提供に障害が発生しております。

2020/1/30 18:17 発生
2020/1/30 19:23 復旧

主に、以下の機能がご利用頂けない状態となっています。

  • HTTP Service機能について、推論実行時に「Internal Server Error」が発生

原因につきましては、現在調査中となっております。

復旧情報、および今回の詳細な原因につきましては、判明次第こちらのスレッドにてご報告いたします。

ご利用のユーザ様には、大変ご迷惑をおかけし、誠に恐れ入ります。
どうぞよろしくお願いいたします。

表題の件につきまして、ABEJA PlatformのHTTP Service提供に障害が発生し、2020/1/30 19:23 現在 復旧していることを確認しております。

主に、以下の機能がご利用頂けない状態となっておりました。

  • HTTP Service機能について、推論実行時に「Internal Server Error」が発生。
    推論結果が返ってこない状態

詳しい原因につきましては、現在調査中となっており、判明次第こちらのスレッドにてご報告いたします。

ご利用のユーザ様には、大変ご迷惑をおかけし、申し訳ございませんでした。
引き続き、どうぞよろしくお願いいたします。

1/30 ABEJA Platform障害発生における原因と対策のご報告

この度は、弊社提供サービス (ABEJA Platform)において、障害が発生し、お客様にご迷惑をおかけしましたこと、深くお詫び申し上げます。

下記、判明しました障害原因、および対策につきまして、ご報告いたします。

■原因
今回の障害における原因につきましては、以下の通りとなります。

  • ABEJA Platform ではお客様からのアクセスをゲートウェイサーバーが受け取り、その HTTPリクエストを、認証や有効期間の確認と検証をした上で、URL に基づきバックエンドのサービスにルーティングする機能があります。

  • 今回、発生しました障害では、上記の機能に対し、内部的なルーティング処理の変更(オーガニゼーションのトライアル有効/無効の確認)を追加し、リリースを実施後、以下の条件下でご利用いただいているお客様の環境でルーティング動作が正常に実施されない状態となっていた事が原因と判明しました。

□今回の障害発生影響

  • プロジェクトを複数利用されていないお客様の環境 (オーガニゼーション)

あわせて、リリース時に実施しているテストケースに、上記の条件に対するテストケースが網羅されておりませんでした。

■対策
今回の障害発生における対策として、以下の対策を2019年1月30日に実施しております。

  • ステージング環境、および本番環境へのリリース前テストに上記条件を網羅するテストケースを新規追加
  • および、ステージング、本番環境へのリリース後の動作確認におけるテストにも同様のテストケースを新規に追加、動作確認の実施を行うフローに変更

□追加テストケース内容

  • 障害が発生した条件が満たされる環境(オーガニゼーション)に対し、HTTP リクエストを送信して正常にルーティング確認を実施

今回の障害におきまして、ご利用のユーザ様には、大変ご迷惑をおかけし深くお詫び申し上げます。

引き続き、サービス全体の信頼性を向上に努めてまいりますので、今後とも、どうぞよろしくお願いいたします。