Amazon CloudWatch、機械学習により異常値(アノマリー)を自動検出できる新機能
ITシステムの運用監視において、通常とは異なる状態、例えば急にトラフィックが跳ね上がる、動作速度が遅くなる、プロセッサの使用率が上がる、ネットワークのレイテンシが大きくなる、などを検知し、警告を発することはもっとも基本的かつ重要な機能です。
しかし、通常の状態にはある程度の幅があります。一体どの程度の範囲を超えたら異常であると判断するのか、閾値の設定は容易ではありません。
閾値を低くすれば、ひんぱんに異常と判断されて警報がいつのまにか軽視されてしまう心配があります。逆に閾値を高くすれば、小さな異常が見過ごされてしまう恐れがあるため、適切な設定には試行錯誤が必要です。
しかも昼と夜、平日と休日では適切な閾値は異なるでしょうし、キャンペーン期間やテレビコマーシャルの投入など特定の期間も閾値は変化するなど、閾値の設定は動的に行う必要もあります。
こうした難しい異常値の検出を機械学習により自動的に行う「Anomaly Detection」(異常検知)機能を、AWSの監視サービスであるCloudWatchが搭載したことが発表されました。
下記は「New – Amazon CloudWatch Anomaly Detection」から、CloudWatch Anomaly Detectionの説明を一部引用します。
CloudWatch Anomaly Detection has its roots in over 12,000 internal models. It will help you to avoid manual configuration and experimentation, and can be used in conjunction with any standard or custom CloudWatch metric that has a discernible trend or pattern.
CloudWatch Anomaly Detectionは、1万2000を超える内部モデルを起源に持ち、手作業による設定と試験を不要とし、識別可能な傾向やパターンを持つCloudWatchの標準もしくはカスタムなあらゆるメトリクスを扱えます。
CloudWatch Anomaly Detectionは、管理画面からアイコン(下図の波型アイコン)をクリックするだけで指定されたメトリクスの履歴データを読み込み、機械学習を基に正常値の範囲を自動的に設定します(画像も上記記事より引用)。
機械学習の結果グレイの範囲が正常値の範囲として設定され、この範囲から外れた値が自動的に異常値と判断されるわけです。
機械学習の対象から取り除きたい履歴の期間も設定でき、機械学習のモデルもカスタマイズ可能。
CloudWatch Anomaly Detection機能は全リージョンで利用可能になっているとのことです。
あわせて読みたい
Docker社、WSL2に最適化した次期「Docker Desktop」でKuberntesサポートなど、さらなる機能強化を表明
≪前の記事
AWS、Azure、GCPのどの仮想マシンからでもiSCSIでアクセス可能なブロックストレージ「HPE Cloud Volumes」、HPEが国内リージョンで提供開始