NetflixのChaos Monkeyがバージョンアップ。マルチクラウドに対応し、AWS、Google CloudのインスタンスやDockerコンテナが落とせるように

2016年10月24日

わざと稼働中のサーバを落とすことで、システムの耐障害性を日常的に検証し続けるためのツール「Chaos Monkey」がバージョンアップして「Chaos Monkey 2.0」になったと、開発元のNetflixによってがブログ「Netflix Chaos Monkey Upgraded」で報告しています。

The Netflix Tech Blog: Netflix Chaos Monkey Upgraded

Chaos Monkey 2.0では、同社がオープンソースで公開している継続的デリバリのためのツール、「Spinnaker」と連係できるようになりました。

連係によってChaos MonkeyはSpinnakerからシステムのデプロイ状況を把握できるようになり、そのデプロイ状況に基づいてSpinnaker経由でインスタンスを落とすようになります。

SpinnakerはAmazonクラウド、Google Cloud、そしてDokcerオーケストレーションツールのKubernetesに対応しているため、Chaos MonkeyもAmazonクラウドやGoogle Cloudのインスタンス、Kubernetes上のコンテナを落とすことができるようになっています。

またChaos Moekyの操作もSpinnaker経由で行えるようになったため、以下のように分かりやすいユーザーインターフェイスで設定できるようになっています。

fig

またChaos Monkey 2.0では外部のトラッキングサービスとの連携も可能になったため、Chaos Monkeyがインタンスを落とす状況について正確にトラックできるようにもなりました。下記のグラフはNetflix社内で使われているイベントトラッキングシステムのChronosと、テレメトリプラットフォームのAtlasによるレポート画面です。

fig

これまでのバージョンのChaos Monkeyは、インスタンスを落とすだけでなくCPUの負荷を高めたり、ストレージをオフラインにするなどの障害状況も引き起こすことができましたが、Chaos Monkey 2.0ではインスタンスを落とすだけになっています。そのため、インスタンスを落とす以外の障害状況を利用したい場合はバージョンアップしないようにと注意喚起されています。

あわせて読みたい

AWS 運用・監視 IaaS




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本