
▲Gemini Live迎來重大更新。(圖/Google)
記者吳立言/綜合報導
Google 今(13日)宣布針對語音互動服務「Gemini Live」推出多項重大更新,新增語速即時調整、語氣自適應、口音選擇與多模態整合等功能,進一步提升語音 AI 的自然度與互動流暢性。
[廣告] 請繼續往下閱讀.
根據官方文件與技術說明,本次更新基於強化後的語音模型,能更準確處理語調、停頓、節奏與音高細節,使 Gemini Live 具備更貼近真人的聲音表現。Google 指出,此次更新將會逐步推送至支援的 Android 裝置。
升級後的 Gemini Live 支援以語音指令控制語速,例如「講快一點」或「慢慢講」,可立即調整說話節奏,並提供多種語音風格,讓故事敘述或語言練習更具個性化。同時系統會依據對話情境調整語氣,在面對焦慮、緊張或敏感主題時,自動轉為較平穩的聲線,降低機械化回應造成的不適感。
在多模態整合方面,用戶可利用手機、相機畫面或生活場景直接與 Gemini 互動,搭配查詢、指引與資訊處理功能,使語音助理更容易融入日常需求。Google 也表示,本次更新同步考量無障礙需求,語速與語音節奏經調整後更利於理解,並維持語音資料預設不儲存的隱私政策。
本次更新無疑將加劇語音 AI 市場競爭,特別是在語音自然度與互動體驗方面。隨著語音 AI 技術邁向更高擬真度,如何兼顧個人化體驗與隱私安全,將成為後續觀察的重點。
[廣告] 請繼續往下閱讀..