VMwareとNVIDIAが提携、vSphereがNVIDA GPUのハードウェア分割機能に対応、GPUの共有やvMotionが可能に
VMwareとNVIDIAは提携を発表、vSphereの最新バージョンとなるvSphere 7 Update 2が、NVIDIAのGPUを用いた同社のAI向けソフトウェア基盤「NVIDIA AI Enterprise」に対応すると発表しました(VMwareの発表、NVIDIAの発表)。
Enterprises today look to #AI to transform their business – that's why we partnered with @NVIDIA to unleash AI. Get the scoop: https://t.co/fOJUdOBkDE pic.twitter.com/urwIhE6uMx
— VMware vSphere (@VMwarevSphere) March 9, 2021
Introducing the next era of enterprise AI. Deploy and scale #AI in the data center with NVIDIA AI Enterprise on @VMware vSphere. Learn more:
— NVIDIA Data Center (@NVIDIADC) March 9, 2021
これまでAIや機械学習処理のためのシステムは、GPUの能力を引き出すためにベアメタルで構築することが一般的でした。そのために仮想化基盤とは別に構築され、仮想化によるコンピュータリソースの効率的な共有や大規模システムの統合管理といったメリットを受けることができませんでした。
今回の提携で、vSphereの仮想化基盤がNVIDIAのAI向けGPUがハードウェアレベルで備えている分割機能「NVIDIA Multi-Instance GPU」(MIG)に対応。最大でGPUの能力を7つのインスタンス向けに分割して提供できます。ソフトウェアによる時分割を用いたリソースの共有ではなく、GPUがハードウェアレベルで備える分割機能のため、仮想化基盤上で効率的にリソースを共有しつつ、ベアメタルと遜色のない性能を引き出せると説明されています。
特にMIGを用いた分割機能は、GPUに対するワークロードが比較的軽い推論処理においては多数の仮想マシンでGPUを共有して処理することで効率的なGPUの利用が可能。
さらにMIGはvSphereのvMotionにも対応するため、GPUを使った処理が長時間にわたるような機械学習処理のトレーニングであっても処理を中断することなくvMotionによって物理マシンを切り替えることができます。
NVIDIAは今回のvSPhereとNVIDIA GPUの統合により、企業において管理が難しかったAIシステムのサイロ化とシャドウIT化を解決するとしています。
あわせて読みたい
「GitHub Discussions」がプライベートリポジトリでも利用可能に。電子掲示板を用いたコミュニティ機能を追加
≪前の記事
Red Hat、企業におけるオープンソースの調査レポート「The State of Enterprise Open Source」公開。87%がオープンソースはプロプライエタリと同等かそれ以上にセキュアと