連「晶晶體」都聽得懂!台灣大「聽寫大哥」準確率達97% 打造最懂在地商務的AI大腦

▲▼ 台灣大哥大資訊長專訪蔡祈岩, 蔡祈岩       。(圖/記者徐文彬攝)

▲生成式AI的崛起,讓語音辨識從「聽音」進化為「懂意」。台灣大哥大資訊長蔡祈岩指出,AI懂得掌握上下文邏輯後,團隊也成功打造出最懂台灣在地語境的「AI聽寫大哥」,引領集團邁向全新戰略新局。(圖/記者徐文彬攝)

◎專訪:萬玟伶、曾雅玲
◎攝影:徐文彬

文/萬玟伶

在台灣的商業會議中,常見這樣的對話場景,「這個Project有點delay,請幫我預定一個Meeting。」或是更在地的生活用語,「這筆款項要去Seven繳。」若將場景延伸至中南部或客家聚落,耳邊傳來的可能是帶有海口腔的台語,或是桃竹苗地區夾雜著「四縣」、「海陸」不同腔調的客語交談。這些南腔北調與中英夾雜的「晶晶體」,構成了台灣獨有的在地聽覺風景,卻也成為國際科技巨頭在發展語音辨識時,難以跨越的技術鴻溝。

[廣告]請繼續往下閱讀...

然而,這道鴻溝,正被台灣電信業者填平!隨著生成式AI技術突破,台灣大哥大運用電信本業龐大的語音數據優勢,開發出「AI聽寫大哥」的語音辨識系統(ASR),實現了從實驗室走向商業落地的關鍵突破,也標誌著台灣大哥大正式邁向「提供算力與大腦」的戰略佈局。

當AI學會「上下文邏輯」 台灣大哥大掌握契機、打造ASR高準確率天花板
「過去的語音辨識只能『聽音』,但現在的AI能『懂意』。」台灣大哥大資訊長蔡祈岩指出技術突破的關鍵。

蔡祈岩分析,傳統語音辨識發展數十年,準確率始終卡在70%至80%的瓶頸,主因在於人類語言充滿同音異義字,例如「ㄧ ㄕㄥ」,究竟是看病的「醫生」還是這輩子的「一生」?光靠聲學模型無法準確判斷。

直到2022年ChatGPT崛起,Transformer模型的強大語意理解能力,讓AI除了具備常識,也學會了「上下文邏輯」,能根據前後文自動校正錯字與意思。蔡祈岩興奮道,「這讓我們看見了契機,既然台灣大哥大擁有最豐富的語音場景,那我們何不訓練出最懂在地語言的AI模型?」

AI訓練關鍵解密 一場從「雜訊」到「黃金」的資料煉金術
若將AI訓練視為一場「資料煉金術」,其過程可拆解為三大關鍵。首先就是「原礦開採」,台灣大哥大雖坐擁海量的語音數據,但原始資料仍需經過整理分類,才能作為「有效燃料」前往下一階段。蔡祈岩更指出,為了克服客語等方言資料稀缺的挑戰,台灣大哥大不惜投入成本,特聘專業客語人才進入錄音室錄製高品質語料,以最嚴謹的態度充實資料庫,確保這些「原礦」能成為有效的燃料。

接著進入耗時的「人工清洗與標註」,這一步驟由專業人員及客服團隊肩負重任,利用其深厚的領域經驗,例如將對話中的「Seven」精準標註為「超商」,而不僅止於數字,進一步教會AI識別台灣在地的溝通邏輯與語意。

最後則是「微調」。蔡祈岩表示,經過前兩階段訓練出的「通用模型」,已具備基礎溝通能力,為企業奠定了強大的應用基底。企業僅需將模型部署於雲端或地端,再由內部IT人員輸入該公司的組織架構、專有名詞與人名等進行微調。「預計經過約兩至三個月的內部密集訓練與優化,辨識率也可達到甚至超越97%。」讓這位「AI聽寫大哥」真正進化為企業專屬的AI全能助理。

從紀錄到洞察 透過AI發現被忽略的「潛在數據」
當企業擁有了這顆精準的AI大腦後,下一步便是將技術轉化為商業價值。蔡祈岩觀察,初期導入「AI聽寫大哥」的企業,最直觀的應用是用來製作會議記錄,解決打字與整理的痛點。但隨著應用場景深化,來自製造業與零售業的一線回饋,讓他看見了「語音轉文字」背後更深層的「數據挖掘」戰略意義。

▲▼ 台灣大哥大資訊長專訪蔡祈岩, 蔡祈岩     。(圖/記者徐文彬攝)

▲蔡祈岩指出,「AI聽寫大哥」已超越會議記錄功能,成為製造與零售業「數據挖掘」的戰略利器。透過將一線語音轉化為洞察,協助企業捕捉被忽略的潛在數據,創造更深層的商業價值。(圖/記者徐文彬攝)

蔡祈岩表示,不少客戶回饋指出,過去在製造業的維修現場,師傅往往需要經過多次的測試、檢修,才能找出問題所在並成功解決,但最後往往只會在維修單上勾選「已修復」,中間的檢測過程與判斷邏輯完全流失。如今透過語音AI,師傅可以邊維修邊口述維修過程,例如「電容看起來沒壞,但我換了線路就好了」,當這些非結構化的語音被轉錄後,經過整理與分析就能成為原廠改善製程的關鍵數據。

同樣的場景也發生在零售業。蔡祈岩指出,門市人員每天可能會面對無數顧客詢問「有沒有賣某某商品?」,過去這些未成交的詢問不會特別被記錄下來,現在透過AI聽寫,企業總部就能即時掌握「顧客想買但沒貨」的潛在商機,進而調整採購策略。

經由貼近現場的觀察,AI不只能產出「語音紀錄」,進化為「過程診斷」,更能協助捕捉「被忽略的商機」,將過去稍縱即逝的對話,轉化為企業永續經營的戰略資產。

築起資安護城河 以「地端部署」防止機密外洩風險
然而,隨著AI應用深入企業核心,無論是涉及機密數據的政府部門與大型企業,或是需嚴格保護會員個資的中小企業,都在導入過程中面臨資安挑戰。這也成為台灣大哥大在技術佈局時,最為重視的關鍵課題。

為此,台灣大哥大透過與群聯電子合作,進行「地端部署」,利用群聯獨家的aiDAPTIV+技術,降低企業建置私有AI的硬體門檻。更關鍵的是,此架構也能確保如醫療病歷、商業機密等敏感資料完全不出公司內網,阻絕外洩風險,也精準解決了金融、醫療業對資安的疑慮。

▲▼台灣大哥大,蔡祈岩,AI,聽寫大哥,語音辨識,ASR,生成式AI,人工智慧,地端部署,群聯電子,資安,數位轉型。(圖/品牌提供)

▲台灣大哥大攜手群聯電子,推動AI「地端部署」。利用SSD運算架構降低門檻,確保機密數據不出內網,為金融與醫療等產業,築起堅實的資安護城河。(圖/品牌提供)

展望未來 以台灣為基地,向國際輸出AI實力
這套專為台灣人打造、且是目前市場上唯一可落地部署的語言模型,已在業界獲得廣泛的實戰驗證。「AI聽寫大哥」目前已成功導入系統整合商、資訊服務、金融、製造、法律與媒體等垂直領域,包括碩網資訊、凌群電腦、安永金融科技及蒙恬科技等知名企業皆是合作夥伴。

不僅如此,該技術目前更深入醫療體系,協助醫護人員將口頭交接轉為文字,並同步串接醫院資訊系統(HIS),減輕作業負擔的同時,也確保病患資訊能整合追蹤。而在外勤管理領域,台灣B2B行動應用服務品牌「業務王APP」亦導入此模型技術,以高達97%的準確率解決業務員與客戶對話「國台語夾雜」的痛點,讓AI化身隱形助手,業務員得以專注在最有價值的客戶經營。

▲▼台灣大哥大,蔡祈岩,AI,聽寫大哥,語音辨識,ASR,生成式AI,人工智慧,地端部署,群聯電子,資安,數位轉型。(圖/品牌提供)

▲「AI聽寫大哥」支援手機與電腦跨平台應用,打破場域限制,無論是外勤業務或一般使用者,皆能透過隨身裝置,將中、英、台、客語夾雜的口述即時轉為精準文字,讓AI化身隱形助手。(圖/品牌提供)

奠基於服務數以千計企業夥伴與廣大會員的成功經驗,台灣大哥大的下一步,是將這套ASR技術升級為進軍國際的關鍵利基點。蔡祈岩強調,除了前述難以複製的時間、經濟成本與語料積累,團隊更已針對核心技術申請多項專利。除了欲確立台灣大哥大在「在地化語音辨識」的領先地位,打造品牌護城河,更為跨國佈局奠定堅實底氣。

憑藉這份技術自信,台灣大哥大也將目光投向台灣龐大的移工族群。「『AI聽寫大哥』推出後,我們的實驗室仍然持續進行新一代的優化,廣納更多的新創詞彙。除了中、英、台、客多語言混用,接著我們將致力服務來自越南、印尼、泰國、菲律賓的移工!」

從解決會議記錄的瑣碎痛點,到挖掘企業暗數據,再到輸出國家級AI實力,蔡祈岩引領的團隊,將以「AI聽寫大哥」這套經過台灣在地淬鍊的模型為核心,持續助攻台灣大哥大於2026年啟動國際佈局,再次刷新台灣AI產業的新高度。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【警緊急壓制】北捷東門站又出事! 目擊乘客:女大叫「肚子餓」放火

【警緊急壓制】北捷東門站又出事! 目擊乘客:女大叫「肚子餓」放火

【有種餓是阿嬤怕你餓】突襲回家阿嬤第一反應是:攏沒飯啊

【有種餓是阿嬤怕你餓】突襲回家阿嬤第一反應是:攏沒飯啊

【公聽會爆口角】莊瑞雄嗆學者「我來不是讓你罵」 韓國瑜:喝咖啡靜下心

【公聽會爆口角】莊瑞雄嗆學者「我來不是讓你罵」 韓國瑜:喝咖啡靜下心

【你什麼咖?】格陵蘭總理選丹麥不要美國被川普嗆

【你什麼咖?】格陵蘭總理選丹麥不要美國被川普嗆

【太誇張】轎車違停平交道旁 阿里山林鐵急煞險撞上

【太誇張】轎車違停平交道旁 阿里山林鐵急煞險撞上

讀者迴響

用AI可以生成影片嗎?

可以。像Pika、Runway、Veo等工具能根據文字或圖片自動產生影片,長度多為數秒到一分鐘。這些影片支援動態畫面、配樂、過場效果,適合社群短片製作、創意發想或故事展示。

最夯影音

更多

熱門快報

回到網頁頂端