アントロピックは9月29日、 Claude Sonnet 4.5を発表し、iOS版も利用可能になった。同社はこれを「世界最高のコーディングモデル」と称し、エージェント行動、コンピュータインタラクション、推論、数学といったタスクにおいてGPT-5 CodexやGemini 2.5 Proを上回る性能を発揮すると主張している。
Sonnet 4.5 の新機能
Anthropicはバージョン番号を上げただけではありません。Sonnet 4.5では、実際の開発者ワークフローに焦点を当てたいくつかの機能が追加されています。
- Claude Code の新しいターミナル インターフェイスとチェックポイントを使用すると、進行状況を保存して以前の状態にロールバックできます。
- 会話の中で直接コードを実行したり、ファイル (スプレッドシート、スライド、ドキュメント) を作成したりすることをサポートします。
- Anthropic は、カスタム エージェントを構築するためのClaude Agent SDK を発表しました。
- このモデルは徹底的な安全訓練に耐え抜いた。アントロピック社によると、今ではごますり、欺瞞、権力欲、幻覚などの行動が減少しているという。
社内テストでは、Sonnet 4.5 は 30 時間自律的に動作し、前モデルの 7 時間という制限を大幅に上回りました。
パフォーマンスの主張と市場の現実

Anthropic の売り文句は非常に大胆です。Sonnet 4.5 は、複雑なエージェント ワークフロー、コンピューター制御、推論において競合製品よりも優れています。
しかし、GPT-5 などと比較した場合、実際にはどこに位置するのでしょうか?
- Sonnet 4.5 は Augment Code のモデル ピッカーを強化し、Sonnet 4 の出力品質に匹敵しながら、タスクの完了が 26% 高速化し、ツール呼び出しが 34% 減少すると報告されています。
- いくつかの比較では、Sonnet の「拡張思考」モードは、特定のタスクで GPT-5 を上回るスコアを上げています。
これまでのところ、証拠によれば、Sonnet 4.5 は、より制約のある、エージェント的な、またはインタラクティブな設定では GPT-5 を上回る可能性がありますが、GPT-5 は、より広範なコーディングおよび推論タスクで依然として非常に競争力があります。
iOSユーザー(および開発者)向け
- ユーザーは iPhone または iPad から Sonnet 4.5 にアクセスでき、モバイルでより多くのパワーを活用できるようになります。
- iOS またはクロスプラットフォーム ツールを構築する開発者は、エージェント フレームワークにアクセスし、会話の中でインラインでコード実行を行うことができます。
- 安全性の強化により、Anthropic は、本来の能力と信頼性を組み合わせるというストーリーを推進しています。
もし私なら、Sonnet 4.5とGPT-5の両方を実際のプロジェクトでテストします。時間が経てば、Sonnetの真の利点がどの領域にあるのかが分かるでしょう。