Google、第6世代のAI専用TPU「Trillium」発表。前世代より約5倍の性能向上、2倍のメモリ容量と帯域など

2024年5月16日

Googleは、日本時間5月15日から開催中のイベント「Google I/O 2024」で、TPU v5eに続く第6世代のAI専用TPU(Tensor Processing Unit)である「Trillium」を発表しました

第6世代のAI専用TPU「Trillium」発表

Trilliumは前世代のTPUとなるTPU v5eと比較して、チップあたりのピーク演算性能が4.7倍。高帯域幅メモリー(HBM:High Bandwidth Memory)の容量と帯域幅が2倍になり、チップ間相互接続(ICI: Interchip Interconnect)の帯域幅もTPU v5eに比べて2倍になりました。

Trilliumは前世代のTPUとなるTPU v5eと比較して、チップあたりのピーク演算性能が4.7倍

さらに、Trillium TPUは、TPU v5eよりも67%以上エネルギー効率が向上しているとのこと。

Trilliumは、単一の高帯域幅、低レイテンシを備えたポッドで最大256 TPUまで拡張でき、さらに並列処理などを実現するマルチスライステクノロジーとTitanium Intelligence Processing Units (IPU)により数百のポッドに拡張することで、数万チップの接続が可能なビルディングスケールのスーパーコンピュータとなります。

これにより、大規模な基盤モデルをより速くトレーニングし、レイテンシーを削減し、低コストでこれらのモデルを提供することを可能にすると説明されています。

Trilliumは2024年後半にクラウドユーザーに提供予定です。

fig

Google I/O 2024バックナンバー

あわせて読みたい

Google Cloud クラウド ハードウェア 機械学習・AI Google




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本