Google、第6世代のAI専用TPU「Trillium」発表。前世代より約5倍の性能向上、2倍のメモリ容量と帯域など
Googleは、日本時間5月15日から開催中のイベント「Google I/O 2024」で、TPU v5eに続く第6世代のAI専用TPU(Tensor Processing Unit)である「Trillium」を発表しました。
Trilliumは前世代のTPUとなるTPU v5eと比較して、チップあたりのピーク演算性能が4.7倍。高帯域幅メモリー(HBM:High Bandwidth Memory)の容量と帯域幅が2倍になり、チップ間相互接続(ICI: Interchip Interconnect)の帯域幅もTPU v5eに比べて2倍になりました。
さらに、Trillium TPUは、TPU v5eよりも67%以上エネルギー効率が向上しているとのこと。
Trilliumは、単一の高帯域幅、低レイテンシを備えたポッドで最大256 TPUまで拡張でき、さらに並列処理などを実現するマルチスライステクノロジーとTitanium Intelligence Processing Units (IPU)により数百のポッドに拡張することで、数万チップの接続が可能なビルディングスケールのスーパーコンピュータとなります。
これにより、大規模な基盤モデルをより速くトレーニングし、レイテンシーを削減し、低コストでこれらのモデルを提供することを可能にすると説明されています。
Trilliumは2024年後半にクラウドユーザーに提供予定です。
Google I/O 2024バックナンバー
- [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開
- Google、第6世代のAI専用TPU「Trillium」発表。前世代より約5倍の性能向上、2倍のメモリ容量と帯域など
- Flutter/DartのWebAssemblyコンパイル機能が安定版に。より高速でスムーズなユーザー体験などを実現
- Chrome DevToolsにもGeminiを搭載へ。エラーの解決策などAIが支援
- FirebaseのバックエンドをGoogle Cloud SQLと接続「Firebase Data Connect」発表。AI用のベクトルサーチも可能に
- Google、フルスタックのWebアプリホスティング環境「Firebase App Hosting」パブリックプレビュー開始。AngularとNext.jsをサポート
あわせて読みたい
Flutter/DartのWebAssemblyコンパイル機能が安定版に。より高速でスムーズなユーザー体験などを実現
≪前の記事
[速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開