Anthropicもコーディングエージェント「Claude Code」発表。新バージョンのClaude 3.7 Sonnetを基盤に

2025年2月26日

Anthropicは、大規模言語モデルと推論モデルを1つに統合した「Claude 3.7 Sonnet」を発表しました

大規模言語モデルと推論モデルのハイブリッド

大まかに言えば、大規模言語モデルは、ある言葉の次に来る確率が高いと考えられる言葉を並べて文章を作成することに優れた仕組みであり、推論モデルはデータの中から何らかのパターンを認識することにより新たな結論を導き出すことに優れた仕組みです。

Claude 3.7 Sonnetはこの2つのモデルを統合したハイブリッド推論モデルであると同社は説明しています。

その上で、Claude 3.7 Sonnetの「スタンダードモード」では前バージョンのClaude 3.5 Sonnetのアップグレード版として機能する一方、「拡張思考モード」(Extended Thinking Mode)では、回答する前に自己検証を行うことで数学や物理、コーディング、指示への対応などの多くのタスクでの性能が向上するとしています。

また最適化において、数学やコンピュータサイエンス、競技プログラミングなどの能力よりも、現実のビジネス現場におけるタスクの解決能力にフォーカスしたとしています。

これらによって、Claude 3.7 Sonnetはソフトウェアエンジニアリング領域において既存の他のモデルよりも優れた能力を備えていると同社は主張し、下記のベンチマークを示しています(左端の赤いマーカーがClaude 3.7 Sonnet)。

fig

コーディングエージェント「Claude Code」発表

このClaude 3.7 Sonnetを基盤として、自律的にプログラミングを行うコーディングエージェントとして発表されたのが「Claude Code」です。現在、リミテッドリサーチプレビューとなっています。

fig

Claude Codeはコマンドラインから利用するツールです。プログラマはコマンドラインを通じて指示を出し、それに対して結果もコマンドラインで返ってきます。

以下は同社が公開したClaude Codeの紹介動画から、動作の様子を画面キャプチャで見ていきましょう。

Claude Codeはコマンドラインから利用

ここではNext.jsを用いた簡単なチャットアプリケーションのコードをClaude Codeで機能追加していきます。

コードが保存されているディレクトリをカレントディレクトリとした状態で、Claude Codeを実行すると、Claude Codeのコマンドプロンプト画面となります。ここでプログラマは指示としてのプロンプトを入力します。

まずは、このコードがどのようなものなのかをClaude Codeに説明してもらうため、「explain to me this project structure」とプロンプトを入力(赤線はPublickeyによる)。

fig

早速、Claude Codeがプロジェクトの処理を開始。

fig

さらに処理が進み、詳細な説明が出力されます。

fig

機能追加を指示するとコードを自動で変更、生成

次に、このチャットアプリケーションに、チャットの履歴を保存する機能追加を次のように指示します。

fig

Claude Codeは、まずは「Let's start by examining the current components.」と、現在のコンポーネントの調査から作業を開始。

fig

実装計画を立てた後に、コードの変更部分を提案してきます。プログラマがここで「Yes, and don't ask again this session.」(はい、以後これについての確認は不要)と返答。

fig

するとClaude Codeは順次コードの変更を実行し、完了後にどのような変更を行ったかを報告してきます(デモでは、きちんと実装されていることも確認されました)。

fig

テストコードも自動生成、実行

次に、Claude Codeに今行った変更に関するテストコードの生成を指示します。

fig

Claude Codeはプロジェクトの内容を理解した上で、テスティングライブラリのインストールが必要だと判断。インストールの実行を行うためのBashコマンドを実行してよいかどうかを確認してきます。

fig

ここでも、イエス、以下確認不要と返答をすると、Claude Codeは次に次ぎにテストコードの生成やそのための変更を実行していきます。

fig

テストコードを生成後にテスト実行も自動的にClaude Codeによって行われ、全てパスしたこと、変更内容などが報告されました。

fig

ビルドのエラーも自律的に修正

続いて、コード全体のビルドを指示します。

fig

ビルドコマンドを実行してよいかどうかを尋ねてくるため、ここでも以下全部イエスと返答。

fig

ビルドに失敗してエラーが発生すると、エラーメッセージを認識して自律的に修正を行います。

fig

エラーのたびに修正を自律的に繰り返し、最終的にビルドに成功しました。

fig

最後にGitHubへのプッシュを指示すると、コマンドと同時にコメントを生成して実行許可を待ちます。

fig

プログラマは指示した後にイエスと答えるだけで、全ての作業が終了しました。

あわせて読みたい

機械学習・AI 開発ツール




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本