
▲樂天株式會社創辦人暨執行長三木谷浩史。(圖/記者湯興漢攝)
記者楊庭蒝/綜合報導
日本樂天集團近日發布號稱「國內最大、性能最強」的人工智慧模型Rakuten AI 3.0,宣稱具備6710億參數、並在日語測試中表現亮眼,卻在發布後短時間內被開源社群發現,其核心實為基於中國模型DeepSeek-V3微調而來,引發透明度與授權爭議。
據外媒報導,樂天在發布時強調該模型整合開源社群成果並結合自有日語資料訓練,未明確說明底層來源。不過開發者在開源平台Hugging Face檢視模型設定檔後,發現config.json中標示「model_type: deepseek_v3」,且整體架構與DeepSeek-V3高度一致,包括採用混合專家(MoE)架構、總參數6710億、單次推論啟用370億參數,以及128K上下文視窗等關鍵特徵。
社群普遍認為,這些技術細節如同模型「指紋」,足以證實Rakuten AI 3.0並非從零開發,而是以DeepSeek-V3為基礎進行日語優化的版本。事實上,在人工智慧產業中,基於開源模型進行微調屬常見做法,可有效降低成本並提升特定語言或領域表現。
爭議焦點主要集中在授權與揭露問題。DeepSeek-V3採用MIT授權,允許商業使用與修改,但需保留原始版權聲明。樂天最初發布時,未附上相關授權資訊,並改以Apache 2.0名義重新釋出,被開源社群質疑有「洗授權」之嫌。隨著輿論升溫,樂天已更新相關儲存庫文件,補上版權聲明並承認使用DeepSeek技術。
值得注意的是,Rakuten AI 3.0亦屬日本政府「生成式AI開發支援計畫(GENIAC)」的一環,獲得經濟產業省與相關機構提供算力與資源支持。在此背景下,外界關注政府資助項目是否應更明確區分「自主訓練」與「基於開源模型微調」的技術差異。
