Cloudflare、CDNエッジで生成AIを実行できる「Workers AI」正式サービスに。世界150都市のデータセンターでGPU基盤を提供
Cloudflareは、同社のグローバルに展開するCDNのエッジで生成AIの推論処理を実行できる「Workers AI」の正式サービス化を発表しました。
Today, we’re excited to make a series of announcements, including Workers AI, Cloudflare’s inference platform becoming GA and support for fine-tuned models with LoRAs and one-click deploys from HuggingFace. Read all about it. https://t.co/phcPIaW24v #DeveloperWeek
— Cloudflare (@Cloudflare) April 2, 2024
同社はCDNエッジにおけるアプリケーション実行基盤「Cloudflare Workers」を提供しています。今回正式サービスとなったWorkers AIを利用することで、このWorkers上のアプリケーションから生成AI機能が簡単に利用できるようになります。
Cloudflare AIは同社のCDNエッジを構成しているデータセンター上のGPU基盤を用いて高速に実行されます。同社は2024年第1四半期時点で世界150都市にGPU基盤を備えたデータセンターを展開していると説明しており、今後さらに充実させていくとしました。
生成AIのモデルをWorkers AIにデプロイ
Workers AIには、あらかじめ下記の機能を実現する多数の生成AIモデルが用意されており、これらを導入することですぐに生成AIの機能を実現可能です。
- 音声認識
- 画像解析
- 画像分類
- オブジェクトの検出
- 文章の要約
- テキストの分類
- テキストのエンベディング
- テキスト生成
- テキストから画像を生成
- 翻訳
LoRAを用いたファインチューニングやベクトルデータベースによる精度向上なども可能とされてます。
さらに今回、CloudflareはHugging Faceとの提携を発表。Hugging FaceがキュレーションしたWorkers AIに適したAIモデルを、簡単にWorkers AIにデプロイすることも可能になりました。
あわせて読みたい
Cloudflare WorkersがPythonをサポート、WebAssembly版Pythonランタイムの「Pyodide」を採用で
≪前の記事
JavaScriptランタイム「Bun 1.1」正式リリース。Windows版登場、Node.jsとの互換性向上、前バージョンより高速化など