NetflixのChaos Monkeyがバージョンアップ。マルチクラウドに対応し、AWS、Google CloudのインスタンスやDockerコンテナが落とせるように
わざと稼働中のサーバを落とすことで、システムの耐障害性を日常的に検証し続けるためのツール「Chaos Monkey」がバージョンアップして「Chaos Monkey 2.0」になったと、開発元のNetflixによってがブログ「Netflix Chaos Monkey Upgraded」で報告しています。
Chaos Monkey 2.0では、同社がオープンソースで公開している継続的デリバリのためのツール、「Spinnaker」と連係できるようになりました。
連係によってChaos MonkeyはSpinnakerからシステムのデプロイ状況を把握できるようになり、そのデプロイ状況に基づいてSpinnaker経由でインスタンスを落とすようになります。
SpinnakerはAmazonクラウド、Google Cloud、そしてDokcerオーケストレーションツールのKubernetesに対応しているため、Chaos MonkeyもAmazonクラウドやGoogle Cloudのインスタンス、Kubernetes上のコンテナを落とすことができるようになっています。
またChaos Moekyの操作もSpinnaker経由で行えるようになったため、以下のように分かりやすいユーザーインターフェイスで設定できるようになっています。
またChaos Monkey 2.0では外部のトラッキングサービスとの連携も可能になったため、Chaos Monkeyがインタンスを落とす状況について正確にトラックできるようにもなりました。下記のグラフはNetflix社内で使われているイベントトラッキングシステムのChronosと、テレメトリプラットフォームのAtlasによるレポート画面です。
これまでのバージョンのChaos Monkeyは、インスタンスを落とすだけでなくCPUの負荷を高めたり、ストレージをオフラインにするなどの障害状況も引き起こすことができましたが、Chaos Monkey 2.0ではインスタンスを落とすだけになっています。そのため、インスタンスを落とす以外の障害状況を利用したい場合はバージョンアップしないようにと注意喚起されています。
あわせて読みたい
伊藤直也氏が語る、サーバーレスアーキテクチャの性質を解剖する(前編)。QCon Tokyo 2016
≪前の記事
モバイルアプリのテスト自動化ツール「Appium」、開発元のSauce Labsが著作権をJS Foundationへ譲渡