
Google昨日正式推出基於Gemma 3架構的全新開放翻譯模型系列TranslateGemma。此系列包含4B、12B及27B三種參數規模,支援55種核心語言及多模態影像翻譯,現已於Kaggle及Hugging Face平台開放下載。
效能測試顯示,TranslateGemma在翻譯品質上實現顯著突破。其12B版本在WMT24++基準測試中,表現甚至優於參數量更大的27B基準模型,這意味著開發者能以更低的算力成本獲得更高品質的翻譯結果,有效提升效率並降低延遲。同時,小巧的4B模型效能可與12B基準媲美,為手機等行動裝置提供了強大的端側翻譯能力。
這項成就得益於獨特的兩階段微調製程。谷歌首先使用合成數據與人工翻譯數據對模型進行監督微調,隨後透過強化學習階段,利用先進獎勵模型引導產生更自然、更符合語境的譯文。該系列重點優化了55種核心語言,並初步探索訓練近500種語言,為包括瀕危語言在內的學術研究提供了新工具。
此外,由於Gemma 3架構,模型繼承了多模態能力,無需額外調整即可有效翻譯影像中的文字。為滿足不同場景需求,4B模型專為手機及邊緣設備優化,12B模型適配消費級筆記本,27B模型則面向追求極致品質的雲端或單卡部署。此次發布進一步降低了高品質機器翻譯的應用門檻。