
OpenAIは先日、2019年のGPT-2以来となるオープンソース言語モデルをリリースすることを正式に発表しました。関係者によると、このモデルは研究担当副社長のエイダン・クラーク氏が開発しており、今夏初頭のリリースが予定されています。主な目標は、Meta LlamaやGoogle Gemmaといった主流のオープンソースモデルを推論能力で凌駕し、「ゼロ閾値」の商用ライセンス契約を採用することです。
TechCrunchが公開した情報によると、このモデルはプレーンテキスト生成ツールとして位置付けられており、開発者は「推論モード」のオン/オフを自由に切り替えられます。この設計は、Anthropicが最近リリースしたモデルロジックに似ています。推論を有効にすると精度は向上しますが、応答遅延が増加します。市場の反応が良好であれば、OpenAIは将来的に、より合理化されたバージョンのモデルをリリースする可能性があります。
今回のオープンソースリリースは、OpenAIが業界競争に対応するための重要な動きと見られています。近年、Meta社のLlamaシリーズのオープンソースモデルの世界ダウンロード数は10億を超え、中国企業のDeepSeekなどのオープンソース製品も急速に登場しています。一方、OpenAIは、そのクローズドソースポリシーと制約的な取引条件について、開発者から繰り返し疑問視されてきました。新モデルは、LlamaとGemmaの「セミオープン」モデルを直接ターゲットとし、自由な利用、改変、商用化を可能にする、ほぼ制約のないライセンス契約を採用します。
OpenAIのCEOであるサム・アルトマン氏は、新モデルは厳格な「レッドチームテスト」とセキュリティ評価を受け、同時に詳細な技術レポート(モデルカード)を公開し、社内ベンチマーク結果を開示すると強調しました。しかし、この約束は外部の疑念を完全に払拭したわけではありません。一部のAI倫理学者は、OpenAIが最近実施した一部モデルのセキュリティレビュープロセスが性急であり、完全なテスト文書が公開されていないと指摘しています。さらに、アルトマン氏は2023年に「モデルのセキュリティレビューの進捗状況について経営陣を誤解させた」として社内混乱を引き起こし、この件も再び取り上げられました。
アルトマン氏は、OpenAIは将来的にオープンソース戦略を調整する可能性があるものの、現時点では「より優れたモデルを継続的にリリースすること」に注力していると述べました。現在、このオープンソースプロジェクトは開発の初期段階にあり、チームは推論パフォーマンスの最適化とシステムレイテンシ問題の解決に注力しています。すべてが順調に進めば、これはOpenAIにとって業界のオープンソース標準を再定義する上で重要な戦いとなる可能性があります。