
欧州のAI企業Mistralは、現地時間5月7日、高性能と低コストという2つの利点を特徴とするMistral Medium 3言語モデルを正式にリリースしました。このMistral Medium 3は、プログラミング、STEM(科学、技術、工学、数学)、マルチモーダル理解といった専門分野で優れたパフォーマンスを発揮し、エンタープライズレベルの機能の導入コストを大幅に削減すると公式に謳われています。
Mistral Medium 3は、ベンチマークテストにおいてClaude Sonnet 3.7の90%以上のパフォーマンスを発揮しながら、入力トークン100万個あたりわずか0.4ドル、出力トークン100万個あたりわずか2ドルという低価格を実現しました。これは、Claudeの1ドル入力/5ドル出力価格から60%の削減となります。同時に、そのパフォーマンスはLlama 4 MaverickやCohere Command Aといったオープンおよびエンタープライズレベルのモデルを上回り、API呼び出しコストはDeepSeek v3よりも低くなっています。
このモデルは、継続的な事前学習と完全なパラメータ微調整をサポートし、エンタープライズのプライベートナレッジベースをシームレスに統合できます。関係者は、企業顧客がビジュアルインターフェースを通じてモデルの導入を完了できること、そしてハードウェアリソースの消費量が前世代と比較して30%削減されていることを強調しました。さらに、マルチモーダルインターフェースは、画像、コード、構造化データの共同処理をサポートします。
技術ハイライト
プログラミング最適化:20以上のプログラミング言語に対応したデバッグツールを内蔵し、コード生成精度が92%に向上しました。
長文テキスト処理:単一のコンテキストウィンドウが128Kトークンまで拡張され、非常に長い技術文書の解析をサポートします。
リアルタイム学習:テラバイトレベルのデータによる増分学習が1時間ごとに完了し、業界知識の動的な更新をサポートします。
Mistralはリリース発表の中で、Medium 3シリーズのアップグレード版であるLargeをリリースすると発表したと報じられています。Largeは、パラメータスケールの拡張とマルチタスク機能を備えています。現在、Medium 3はクラウドAPIアクセスとローカライズされた導入ソリューションを展開しています。エンタープライズユーザーは、1,000万トークンが割り当てられた30日間の無料トライアルにお申し込みいただけます。
Mistralの共同創設者は、この新モデルがEU GDPRコンプライアンス認証を取得し、AWSおよびGoogle Cloudとのホスティング提携に至ったことを明らかにしました。サードパーティによるテストでは、API応答速度がGPT-4 Turboよりも17%高速化し、エラー率が23%減少したことが示されています。本稿執筆時点では、AnthropicやCohereなどの競合他社からはまだこのリリースへの反応が得られていません。