デフォルト画像 障害発生時の緊急メンテナンス自動化【ゲーム・ソーシャルアプリ】

サーバー障害や致命的なバグを検知した際に、自動またはワンクリックで「メンテナンスモード」に切り替え、ユーザーのアクセスを遮断する仕組みを構築する施策です。被害拡大(データ破損、不正利用)を最小限に食い止めます。メリットは、リスク回避と、初動対応の迅速化です。成功には、ロードバランサーでの切り替え設定と、関係者のみアクセスできる裏口(IP制限)の整備が必要です。

職種 情報システム 施策難易度 ★★☆☆☆
業界① ゲーム・ソーシャルアプリ 目的 障害対応
業界② ゲーム・ソーシャルアプリ 対象 インフラ 運営
費用 50〜300万円 実施期間 30

主なToDo

  • ロードバランサー(ALB等)でメンテ画面への振り分けを設定する
  • Slackからコマンド一つでメンテ入りできるBotを作る
  • 関係者(開発IP)だけはアクセスできる穴あけ設定を行う

期待できる効果

深夜に障害が起きても、家からスマホで即座にサービスを止められる。データの巻き戻り(ロールバック)範囲を最小限にできる。

躓くところ

誤操作でメンテに入れてしまうリスク(機会損失)があるため、承認フローや二段階認証が必要。

狙えるチャネル

インフラ