インシデント発生時のチーム対応を支援する「Grafana Incident」、無料でGrafana Cloudが提供。SlackやGitHubなどと連携
Grafana Labsは、インシデント発生時にチームでのインシデント対応を支援するクラウドサービス「Grafana Incident」をGrafana Cloudで無料提供することを発表しました。
Read more about Grafana Incident, it's features, and how to get started here:https://t.co/4Rmqujt2oh
— Grafana (@grafana) September 13, 2022
システム運用中に何らかのインシデントが発生した場合、インシデントの状態把握、原因の調査、インシデントからの復旧、ユーザーや関係者への報告など、それぞれの役割をアサインされた担当者がチームとなってインシデント対応にあたることになります。
Grafana Incidentは、これらのインシデント時に要求される担当者のアサインとそれぞれの業務の支援、進捗の共有などを支援し管理できるクラウドサービスです。
インシデント宣言、専用会議室の設定、担当者のアサイン、タスク管理など
Grafana Incident上でインシデント発生が宣言されると、自動的にそのインシデント専用のZoomやGoogle Meetのオンライン会議室、Slackの専用チャンネル、Google Driveのフォルダなどが設定され、調査担当、管理者(Commander)など担当者のアサインも行うことになります。
また、チャットボットがGrafana Incidentのコマンドライン上で関連するダッシュボードへのリンクを投稿。GitHub Issueと同期し、Grafana Incident上でIssueの状況も把握できます。
管理者はタスクマネージャを利用して各担当者へタスクを割り振り、タスクの進捗を管理できます。
これらの機能によってタスクの管理と進捗、インシデントの状況などをGrafana Incidentで管理できるとともに、Grafana Incident上では「Activity timeline」と呼ばれる機能で、何が起きているのか、何が行われているのかが時系列でまとめられます。これにより途中からインシデント対応チームに参加したメンバーもこれまでの経緯を容易に把握可能です。
インシデントが解消したあとは、ポストモーテム(事後検証)プレゼンテーション機能が、インシデントの振り返りとまとめを支援してくれます。
Grafana IncidentはGrafana Cloudのフリーティアを含めた全てのユーザーが無料で利用できるとのことです。インシデント対応のベストプラクティスを体験し、参考にできるサービスではないでしょうか。
関連記事
あわせて読みたい
「Banking-as-a-Service」を大手銀行などが新たな収入源として展開し、2年以内にメインストリームとなるとガートナーが予測
≪前の記事
JavaScriptのメモリリークを検出するフレームワーク「MemLab」、メタがオープンソースで公開