Kubernetesにわざと障害を起こさせる仕組みを組み込める「LitmusChaos」がCNCFのインキュベーションプロジェクトに昇格
Kubernetesなどを始めとするクラウドネイティブを実現するためのオープンソース群の開発などを推進する団体Cloud Native Computing Foundationは、Kubernetesをベースにカオスエンジニアリングを実現できるソフトウェア「LitmusChaos」が、実験的なサンドボックスプロジェクトから、育成のためのインキュベーションプロジェクトに昇格したことを発表しました。
The @LitmusChaos project has officially moved from the #CNCF Sandbox to the Incubator! https://t.co/ptrzk2a34n pic.twitter.com/X7pq5vmbA5
— CNCF (@CloudNativeFdn) January 11, 2022
カオスエンジニアリングとは、実行環境にあるソフトウェアに対してわざとさまざまな障害を発生させることで、障害発生時の挙動などを検証し、ソフトウェアの耐障害性を高めることを目指す手法です。
そのためのソフトウェアとしては、NetflixのChaosMonkeyがよく知られています。
参考:サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開
LitmusChaosはKubernetesにフォーカスしたカオスエンジニアリングのためのソフトウェアです。
Kubernetesの機能を拡張するためのオペレータである「Chaos Operator」を用いて障害(LitmusChaosでは「Chaos experiments」:カオス実験と呼ぶ)をKubernetesに組み込むことができ、「ChaosHub」と呼ばれるさまざまな障害を発生させる設定のリポジトリから任意のカオス実験を読み込んで発生させることができます。
カオス実験は「Litmus Workflows」によってスケジュールやシナリオを設定でき「ChaosCenter」で全体を管理運用、モニタリングできます。
カオス実験のモニタリングとレポートは「Chaos Observability」からPrometheusへメトリクスをエクスポートすることで、リアルタイムにダッシュボード表示することなどが可能。
カオスエンジニアリングの機能は、AWSが「AWS Fault Injection Simulator」として備えるようになり、Microsoft Azureも「Azure Chaos Studio」として発表するなど、プラットフォームが備えるべき機能となりつつあります。
- AWS、わざとクラウド障害を起こす新サービス「AWS Fault Injection Simulator」提供開始。カオスエンジニアリングをマネージドサービスで
- Microsoft Azure、わざと障害を発生させてサービスの耐障害性を鍛える「Azure Chaos Studio」発表
今回、インキュベーションプロジェクトになったことで、LitmusChaosがプラットフォームとしてのKubrnetesが備える標準的なカオスエンジニアリング機能になることが予想されます。
(追記:2022/1/25 当初「Chaos experiments」を「カオス体験」と訳しており、「カオス実験」に修正しました。お詫びして訂正いたします)
あわせて読みたい
オープンソースcURLの作者、某大企業から「24時間以内にこの質問に答えるように」との無礼なメールを受け取る
≪前の記事
NGINX開発者のIgor Sysoev氏が引退を発表。F5とNGINXから退任