Gemini生態再擴張 Live API提供AI串流互動能力

▲▼Google I/O 202。(圖/Google)

▲Google I/O 2025開發者大會。(圖/Google)

記者吳立言/綜合報導

Google在I/O 2025開發者大會中正式揭露其升級版「Live API」,帶來更即時、更智慧的語音與視訊串流互動技術,並支援多種新一代應用場景,包括語音辨識、即時工具串接、主動式音訊輸出等。為開發者與AI應用生態注入即時、靈活與多工的交互能力,支援影音串流、語音活動辨識、工具鏈整合等功能,為AI與人類互動的未來開啟新篇章。

▲▼Live API。(圖/Google)

[廣告]請繼續往下閱讀...

此次更新的Live API重點包含:

音訊與視訊串流支援:開發者可直接串流音訊與影像資料,適用於遠端協作、客服機器人、智慧設備等場景。
多架構選擇:提供「Cascaded」與「Audio-to-Audio」兩種音訊處理架構選擇,讓應用彈性更大。
工具鏈整合支援:可將多個工具串接使用,強化跨功能整合能力。
語音活動偵測(Voice Activity Detection):可自動偵測、設定或停用語音輸入,提升互動準確性。
會話管理功能:支援壓縮、恢復、媒體解析度調整與發言輪替管理,提升串流效能。
臨時憑證(Ephemeral tokens):用以提升連線安全性與臨時授權的彈性。
原生音訊輸出能力
提供「Proactive audio」與「Affective dialog」等情緒化回應語調。
支援「Thinking」狀態輸出,模擬思考過程中的聲音提示,提升自然語感。
Google表示,此次Live API的升級,標誌著互動式AI應用朝向更即時、更情感化的發展邁進。該技術未來預計將廣泛應用於虛擬助理、智慧客服、教育學習與無障礙輔助裝置等場景。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【這個收回帥到炸裂】婚禮主持人拋彩帶 天女散花瞬間秒收回

【這個收回帥到炸裂】婚禮主持人拋彩帶 天女散花瞬間秒收回

【員工急倒車逃命】巨大棕熊襲擊北海道牧場! 追車「一拳打凹引擎蓋」

【員工急倒車逃命】巨大棕熊襲擊北海道牧場! 追車「一拳打凹引擎蓋」

《再見愛人5》李施嬅「眼睛開刀4次」 男友「私下幫她保險」完全沒說!

《再見愛人5》李施嬅「眼睛開刀4次」 男友「私下幫她保險」完全沒說!

【5兆男來了】黃仁勳被要求「國語致詞」! 感性說「沒台積電就沒輝達」

【5兆男來了】黃仁勳被要求「國語致詞」! 感性說「沒台積電就沒輝達」

李光洙為贏「用臉玩躲避球」XD 穿指壓拖鞋被笑「像剛出生長頸鹿」

李光洙為贏「用臉玩躲避球」XD 穿指壓拖鞋被笑「像剛出生長頸鹿」

讀者迴響

ChatGPT能免費使用嗎?

有免費版本,適合多數基本用途。若升級付費(如 ChatGPT Plus),可使用更強大的GPT-4模型,回應速度快、理解力更好、支援圖片與檔案分析。免費用戶功能有限,無法使用進階工具。

最夯影音

更多

熱門快報

回到網頁頂端