Meta、コード生成や解釈に特化した大規模言語モデル「Code Llama」公開
Metaは、コードもしくは自然言語によるプロンプトから、コードの生成およびコードに関する自然言語の説明を生成できる大規模言語モデル「Code Llama」を公開しました。
Code Llamaは、先月(2023年7月)にMetaが発表した大規模言語モデル「Llama 2」をベースに、コードに特化したデータセットでさらに訓練したバージョンだと説明されています。
対応するプログラミング言語はPython、C++、Java、PHP、JavaScript、Typescript、C#、Bashなどを始めとする主要な言語。
GPUで処理できるサイズやPython特化のモデルも
Code Llamaは3つのサイズ、7B、13B、34Bが提供されています。
7Bモデルは1つのGPUで処理できる一方で、34Bモデルは最善の結果を返し、より良いコーディング支援を可能にする能力があります。
一方、7Bおよび13Bモデルは高速に動作するため、リアルタイムコード補完のような低レイテンシを必要とするタスクに適しているなど、それぞれに適した用途が存在します。
さらに、Pythonの能力に特化してファインチューニングした「Code Llama - Python」および人間が自然言語で入力したプロンプトから何を期待しているのかをよりよく理解できるようにファインチューニングした「Code Llama - Instruct」も提供されます。
特有のライセンス条件に注意
Code LlamaはLlama本体と同じく研究目的や商業用途で利用可能なLlama 2 Community Licenseで提供されます。
ただし月間アクティブユーザーが7億人以上のサービスで利用する場合にはMetaから別途ライセンスを取得する必要があるなど、このライセンス特有の制限項目などがあるため、念のためライセンスを確認した上で利用されることをおすすめします。
あわせて読みたい
狩野教授自身が語る、Kano Modelの理解と品質とは何か?/Hondaによる自動運転レベル3システムとその開発プロセスとは?[ソフトウェア品質シンポジウム 2023][PR]
≪前の記事
Kubernetes上でイベントドリブンなオートスケーリングを提供する「KEDA」、本番環境で使えるレベルに到達したとしてCNCFの卒業プロジェクトに