▲ElevenLabs宣布推出新一代語音模型Eleven v3。(圖/Eleven Labs)
記者吳立言/綜合報導
AI語音生成領導品牌ElevenLabs宣布推出新一代語音模型「Eleven v3(alpha版)」,主打更深層的語意理解與情緒表達能力,支援使用「音訊標籤」精準控制語音情感、語氣與非語言反應。該版本目前開放體驗,六月期間提供2折優惠,並預告即將開放API。
Introducing Eleven v3 (alpha) - the most expressive Text to Speech model ever.
Supporting 70+ languages, multi-speaker dialogue, and audio tags such as [excited], [sighs], [laughing], and [whispers].
Now in public alpha and 80% off in June. pic.twitter.com/n56BersdUc— ElevenLabs (@elevenlabsio) June 5, 2025[廣告]請繼續往下閱讀...
Eleven v3的核心特點包括:
音訊標籤控制:用戶可透過簡單文字標籤(如 [sad]、[whispers]、[laughs])來指定情緒與語氣,大幅提升輸出語音的表現力與真實感。
多角色對話支援:模型能自然處理多角色對話中的語氣轉換、中斷、情感流動,使生成內容更貼近真實對話。
更深語意理解:全新架構可準確掌握上下文,並在語音輸出中呈現語境與情緒變化。
官方指出,Eleven v3適合創作者與開發者應用於影片製作、有聲書與媒體工具中,而目前即時應用如語音對談建議仍以v2.5 Turbo或Flash為主,v3的即時版則正在研發中。
ElevenLabs並釋出專屬提示詞指南,協助用戶熟悉標籤使用與語音風格導引。未來API版本將於近期開放,開發者可提前聯繫銷售團隊以申請搶先試用。