【障害/復旧情報】2019/12/16 ABEJA Platform障害のお知らせ

表題の件につきまして、ABEJA Platformの学習・モデル機能に障害が発生しておりました。

2019/12/16 11:07発生
2019/12/16 11:58現在 復旧しております。

主に、以下の機能がご利用頂けない状態となっておりました。

  • 学習・モデル管理機能について、ABEJA Platform上に画面表示がご利用いただけません。

原因につきましては、学習・モデル管理機能へアクセスを実施するコントローラの機能が正常に機能しなくなり、セキュリティグループのアクセス制御が正しく機能しなくなったため、ご利用いただけない状態となっておりました。

今回の詳細な原因につきましては、判明次第こちらのスレッドにてご報告いたします。

ご利用のユーザ様にはご不便をおかけし、大変ご迷惑をおかけし、誠に恐れ入ります。
どうぞよろしくお願いいたします。

12/16 ABEJA Platform障害発生における原因と対策

この度は、弊社提供サービス (ABEJA Platform)において、障害が発生し、お客様にご迷惑をおかけしましたこと、深くお詫び申し上げます。

下記に判明しました障害原因、および対策につきまして、ご報告いたします。

■原因

今回の障害における原因につきましては、以下の通りとなります。

  • ABEJA Platformインフラ環境で利用している通信制御を実施するためのコントローラ機能の不具合

各種API操作およびHTTP Serviceへの通信を制御するためのロードバランサーで利用しているコントローラ機能に不具合が発生。そのため、ホストへの通信が正常に機能せず、サービス提供ホストがダウンし障害が発生しておりました。

■対策

今回の障害発生における対策として、以下の対策を2019年12月16日に実施しております。

  • サービス提供ホスト数の厳密な監視、ホスト数減少推移を検知、回復する仕組みの導入

今回の障害におきまして、ご利用のユーザ様には、大変ご迷惑をおかけし深くお詫び申し上げます。

引き続き、サービス全体の信頼性を向上に努めてまいりますので、今後とも、どうぞよろしくお願いいたします。