ETtoday新聞雲

>

ETtoday AI科技

ETtoday新聞雲

>

ETtoday AI科技

2025年05月13日 07:23

OpenAI進攻醫療產業　推出HealthBench建立全球AI評估新標準

▲OpenAI。（圖／OpenAI）

▲OpenAI公布醫療AI評測新基準HealthBench，刷新模型表現指標。（圖／OpenAI）

記者吳立言／綜合報導

OpenAI今（13日）宣布推出HealthBench，一項全新開源評估基準，用以測量大型語言模型（LLMs）在醫療領域的效能與安全性。該基準由全球262位執業醫師共同設計，涵蓋5,000個多輪醫療對話、48,562個醫師撰寫的細緻評分標準，標誌著AI醫療能力評估邁入全新階段。

在OpenAI的內部測試中，GPT系列模型展現出穩健成長，從GPT-3.5 Turbo的 16%，到GPT-4o的32%，再到最新o3模型達60%的總體得分。而成本大幅降低的小型模型GPT-4.1 nano更令人驚艷，以僅約1/25成本超越GPT-4o，凸顯小模型在醫療應用上的潛力。

[廣告]請繼續往下閱讀...

OpenAI 表示，HealthBench 的設計基於三大核心理念：
• 有意義（Meaningful）：評分標準聚焦真實世界的影響力，不僅是紙上考題，更涵蓋實際就診流程中的對話、推理與個別化需求。
• 可信賴（Trustworthy）：由醫師親自撰寫的評分標準與加權系統，確保評估準則與臨床標準一致。
• 具進步空間（Unsaturated）：現有頂尖模型仍有明顯提升空間，讓開發者能持續優化。

HealthBench 所涵蓋的對話涵蓋多語言、不同醫療專科、病患與醫師視角、難度高、極具挑戰性，並依七大主題分類，如急診處理、資訊不確定性處理、全球健康議題等。每個對話均以醫師撰寫的客製化評分規則進行評估，涵蓋「正確性」、「表達溝通」、「上下文理解」等多個維度。模型的回應會由GPT-4.1擔任自動評分員，逐項檢查是否符合每條標準，最後依得分占比生成總體評分。

OpenAI強調，改善人類健康將是AGI帶來最具決定性的改變之一。若能妥善設計與部署，大型語言模型將有潛力協助全球提升醫療知識可及性、支援臨床決策、強化民眾自我健康倡議能力。HealthBench的推出，正是通往這一未來願景的關鍵基礎建設。

關鍵字: OpenAI HealthBench 醫療AI

分享給朋友：

追蹤我們：

※ 本文版權所有，非經授權，不得轉載。 [ ETtoday著作權聲明 ]

留言

推薦閱讀

字節跳動否認出貨傳聞　稱豆包AI眼鏡暫無銷售計畫

字節跳動否認出貨傳聞　稱豆包AI眼鏡暫無銷售計畫

3小時前

CES 2026 展出智慧長壽鏡　主打臉部掃描AI評估健康狀態

CES 2026 展出智慧長壽鏡　主打臉部掃描AI評估健康狀態

4小時前

不靠App、不用螢幕　樂高「智慧積木」CES 2026首度亮相

不靠App、不用螢幕　樂高「智慧積木」CES 2026首度亮相

5小時前

Motorola「別針式穿戴裝置」外流？外媒爆：新型AI助手

Motorola「別針式穿戴裝置」外流？外媒爆：新型AI助手

6小時前

拆解醫療資訊、規劃作息　OpenAI：每天數百萬人用ChatGPT管理健康

拆解醫療資訊、規劃作息　OpenAI：每天數百萬人用ChatGPT管理健康

7小時前

黃仁勳點名台供應鏈「AI系統量產關鍵角色」　Rubin估下半年出貨

黃仁勳點名台供應鏈「AI系統量產關鍵角色」　Rubin估下半年出貨

7小時前

黃仁勳帶「輝達版瓦力」亮相驚艷全場：機器人ChatGPT時刻來臨

黃仁勳帶「輝達版瓦力」亮相驚艷全場：機器人ChatGPT時刻來臨

8小時前

輝達「實體AI生態系」曝光　想當通用機器人的機器人

輝達「實體AI生態系」曝光　想當通用機器人的機器人

9小時前

學生交出顧問級滿分作業卻理解不足　教授改用AI口試檢驗成效

學生交出顧問級滿分作業卻理解不足　教授改用AI口試檢驗成效

9小時前

快訊／黃仁勳發表最新AI硬體平台「Rubin」：已全面投產

快訊／黃仁勳發表最新AI硬體平台「Rubin」：已全面投產

10小時前

【比人還會停車】聰明警犬甩尾入褲一次到位XD 駕駛技術滿分❤

【比人還會停車】聰明警犬甩尾入褲一次到位XD 駕駛技術滿分❤

熱門影音更多>>

王祖賢首曝「當年引退真實原因」　曾得憂鬱症：不知道自己是誰

王祖賢首曝「當年引退真實原因」　曾得憂鬱症：不知道自己是誰

【這表情落差太大了】寶寶嬌羞笑容只給爸爸一見媽媽直接皺眉處理XD

【這表情落差太大了】寶寶嬌羞笑容只給爸爸一見媽媽直接皺眉處理XD

【想看雪的代價】為了上合歡山掛雪鏈　結果車框直接刮爛QQ

【想看雪的代價】為了上合歡山掛雪鏈　結果車框直接刮爛QQ

劉在錫長相醜or帥?觀相老師直接失言XD

劉在錫長相醜or帥?觀相老師直接失言XD

【這題太難了啦！】小弟弟被問選檸檬還是雅英　秒當機XD

【這題太難了啦！】小弟弟被問選檸檬還是雅英　秒當機XD

AI新知熱門新聞

快訊／黃仁勳公布全新AI「Alpamayo」　合作賓士搭載自駕系統

快訊／黃仁勳發表最新AI硬體平台「Rubin」：已全面投產

黃仁勳點名台供應鏈「AI系統量產關鍵角色」　Rubin估下半年出貨

AI電子寵物正式亮相　51等將成不死之身、不用照顧也能自己旅行

黃仁勳帶「輝達版瓦力」亮相驚艷全場：機器人ChatGPT時刻來臨

改程式碼竟被AI罵「傻逼」　騰訊急致歉：非人工、模型異常

輝達「實體AI生態系」曝光　想當通用機器人的機器人

OpenAI：全球每天4千萬人找ChatGPT問診

不靠App、不用螢幕　樂高「智慧積木」CES 2026首度亮相

學生交出顧問級滿分作業卻理解不足　教授改用AI口試檢驗成效

讀者迴響

我也要留言，快前往新聞雲App！

我可以用AI畫卡通嗎？

可以！只要在提示詞中加入anime、cartoon、pixar等字樣，就會產生可愛卡通風格。

科技術語了解更多

熱門AI新知更多新聞

熱門3C家電更多新聞

最夯影音

更多

抖音正妹巨變恍惚怪咖　浙江工作為何遭丟包柬埔寨街頭　真相讓父母崩潰

抖音正妹巨變恍惚怪咖　浙江工作為何遭丟包柬埔寨街頭　真相讓父母崩潰

談兩年條款曝柯文哲曾提「留在立院」　黃國昌：今天已簽辭職書了

談兩年條款曝柯文哲曾提「留在立院」　黃國昌：今天已簽辭職書了

吳姍儒曝兒子像到吳宗憲　笑嘆：好種不傳，壞種不斷

吳姍儒曝兒子像到吳宗憲　笑嘆：好種不傳，壞種不斷

馬杜洛坐直升機被押往紐約受審　大批警力戒備上囚車畫面曝！

馬杜洛坐直升機被押往紐約受審　大批警力戒備上囚車畫面曝！

大選贏馬杜洛3百萬票！　委國流亡領袖宣布「我才是總統」

大選贏馬杜洛3百萬票！　委國流亡領袖宣布「我才是總統」

熱門快報

東森廣場投籃趣，揪團來打球

東森廣場投籃趣，揪團來打球

假日怎麼安排？來東森廣場免費吹冷氣投籃，輕鬆運動一下！

ETtoday 會員限定爆夾抓抓樂

ETtoday 會員限定爆夾抓抓樂

超好夾零門檻，新手也能一夾入魂！東森廣場抓抓樂，等你來挑戰！

農會解酒泡麵來了！

農會解酒泡麵來了！

「文里補習班」開課啦！今天開箱「農會泡麵」！幫你找到解宿醉的良伴~

ETtoday攝影棚租借

ETtoday攝影棚租借

ETtoday攝影棚提供完整設施與高品質服務，提供創作者最佳支援，滿足你各種拍攝需求！

我要投稿人才招募關於我們廣告刊登/合作提案客服信箱服務條款隱私權政策著作權聲明免責聲明

東森新媒體控股股份有限公司版權所有，非經授權，不許轉載本網站內容
© ETtoday.net All Rights Reserved.
電話：+886-2-5555-6366

回到網頁頂端

我要投稿人才招募關於我們廣告刊登/合作提案客服信箱服務條款隱私權政策著作權聲明免責聲明

東森新媒體控股股份有限公司版權所有，非經授權，不許轉載本網站內容
© ETtoday.net All Rights Reserved.
電話：+886-2-5555-6366