AWSとFacebookが機械学習「PyTorch」で協力。「TorchServe」と「TorchElastic」をオープンソースでリリース

2020年4月23日

機械学習ライブラリ「PyTorch」の開発チームは、PyTorch 1.5のリリースと同時に、AWSとFacebookが協力して開発した新たなライブラリ「TorchServe」と「TorchElastic」を発表しましたAWSによる発表)。

PyTorchはFacebookのAIリサーチラボが開発した、Python言語によるオープンソースの機械学習ライブラリです。世の中にある機械学習ライブラリのなかでも、もっとも人気があるものの1つといえます。

TorchServeとTorchElasticは、PyTorchをクラウドやKubernetesで活用するためのソフトウェアです。

TorchServe:PyTorchのモデルを迅速に本番環境で実行

TorchServeは、PyTorchのモデルをカスタムコードなどを書かなくともそのまますぐに本番環境で実行できるというもの。

一般的な用途であるオブジェクトの検出やテキストの分類用のデフォルトハンドラーに加え、マルチモデルサービング、A/Bテストのためのモデルバージョニング、メトリクスによるモニタリング、アプリケーションと統合するためのRESTfulエンドポイントなども備えています。

AWS上ではEC2やAmazon SageMakerなどで実行可能と説明されています。

TorchElastic:スケーラブルでフォールトトレラントな実行

TorchElasticは、PyTorchのトレーニングを分散環境においてフォールトトレラントかつスケーラブルに実行できるようにするソフトウェア。

これまでの分散トレーニングは、フォールトトレラントではなく、またノードの追加などスケールの変更に対してはリスタートが必要であり、TorchElasticはこうした課題に対応するものだと説明されています。

TorchElasticはKubernetesに対応しており、Amazon EKSのようなKubernetes環境で分散トレーニングが実行できるようになります。

TorchServeおよびTorchElasticともにまだ実験的実装の段階であり、今後さらに開発が進められていくことになります。

あわせて読みたい

AWS 機械学習・AI Facebook Python




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本