
Anthropicは、太平洋時間5月22日午前9時30分(北京時間5月23日午前0時30分)に「Code with Claude」記者会見を開催することを公式発表した。海外メディアが公開した公式サイトの設定ファイルによると、新型Claude Sonnet 4とClaude Opus 4モデルは社内テストを終えて発表間近で、今回の記者会見で初公開される予定だという。構成ファイルでは、これら 2 つのモデルを総称して「Claude 4」シリーズと呼びます。ファイル内の「本番環境での使用不可」や「厳格なレート制限」などのラベルは、まだ開発の最終段階にあることを示しています。 「show_raw_thinking」関数コードの公開は、新しいモデルが推論プロセスの基盤となる論理チェーンを表示することを示唆しています。
テストデータによれば、Claude Opus 4 は GSM8K 数学的推論テストで 95.7% の精度を達成し、前モデルより 12 パーセントポイント向上しました。ロジックチェーンの長さは4096トークンまで拡張され、エラー率は同レベルのモデルの1/4に削減されました。これは、Anthropic の「説明可能な AI」戦略と非常に一致しています。 CEOのダリオ・アモデイ氏はかつて「AIによる意思決定は、財務監査と同じくらい透明性と信頼性がなければならない」と公に強調したことがある。この「思考の可視化」機能は、最大の技術的ブレークスルーとなるかもしれません。
この新製品の発売は、統一されたモデルインタラクション標準を通じて急速にエコロジカルバリアを構築している MCP プロトコルのサポートを OpenAI が発表してから 5 日後のことでした。業界観測筋は、もしClaude 4シリーズが漏洩情報にあるように本当に推論レベル9.8点に到達すれば、サードパーティの評価リストを刷新するだけでなく、ChatGPTとGemini Ultraが支配する市場環境を一新する可能性が高いと指摘している。注目すべきは、構成ファイルには新しいモデルに MCP プロトコル サポートが統合されていることが示されており、Anthropic がさらに多くのエンタープライズ レベルのインターフェイスを開く可能性があることを示していることです。
GitHub のモニタリングによると、Claude API に関連するコード提出数は過去 24 時間で 183% 急増しており、主に自動テスト フレームワークとマルチモーダル ワークフローの最適化の分野に集中しています。カウントダウンが最後の12時間に入る中、設定ファイルの漏洩によって引き起こされたこの技術カーニバルは、AIの進化の歴史を新たな臨界点へと押し進めています。