
2月6日,OpenAI宣布推出新一代AI程式設計模型GPT-5.3-Codex,公司宣稱這是其迄今最強大的智能體程式設計模型。該模型在多項基準測試中表現突出,不僅在程式設計任務上刷新紀錄,在複雜環境下的操作能力也有顯著提升。
根據官方公佈的測試數據,GPT-5.3-Codex在SWE-bench Pro(公開版)程式設計任務基準中獲得56.8%的得分,略高於前代模型的56.4%。在更側重於命令列操作的Terminal-Bench 2.0測試中,其得分從前代的64.0%大幅提升至77.3%。最引人注目的是在OSWorld-Verified智能體電腦操作基準測試中,得分從38.2%躍升至64.7%,顯示其在執行複雜、開放式環境任務方面取得了突破性進步。
除了能力提升,新模型在運作效率上也進行了最佳化。官方稱其運行速度較前代GPT-5.2-Codex提升了25%,有助於進一步提高開發者的工作效率。 OpenAI強調,GPT-5.3-Codex旨在成為更貼近協作的開發者工具。新模型支援在任務執行過程中進行即時互動與引導,且不會遺失情境資訊。在Codex應用程式中,模型會持續更新工作進度,讓開發者隨時介入、提問、討論方案並調整方向。該公司表示,Codex正從專注於程式設計的智能體,向更通用的電腦協作者演進,從而降低應用開發的門檻。
目前,GPT-5.3-Codex已針對ChatGPT Plus、Team及Enterprise等付費訂閱用戶全面開放,用戶可透過Codex應用程式、命令列工具、IDE擴充插件及網頁端存取。 API版本也將在近期內推出。