小米宣布MiMo API永久降價 最高狂砍99%、舊用戶額度全部重置

▲▼小米宣布MiMo API永久降價。(圖/小米微博)

▲小米宣布MiMo API永久降價。(圖/小米微博)

記者吳立言/綜合報導

小米今(27日)宣布,旗下 AI 模型服務 MiMo-V2.5 系列即日起全面調降 API 價格,最高降幅可達 99%,同時調整 Token Plan 計費制度,號稱在代理與程式開發等場景下,可用 Token 數量提升至原本的 5 至 8 倍。此次更新已於 2026 年 5 月 27 日凌晨正式生效。

根據小米技術公告,這次除了永久性調降模型 API 價格外,也同步取消不同上下文窗口長度的差異化定價,希望降低開發者接入門檻,進一步擴大 MiMo 的使用規模。

[廣告]請繼續往下閱讀...

MiMo API 價格大砍 官方稱最高降幅達 99%

小米指出,本次調價屬於「永久降價」,並已於全球同步實施。官方強調,隨著底層推理技術持續優化,現在有能力重新設計整個價格體系,讓模型服務成本大幅下降。

公告中提到,新版 Token Plan 在「加量不加價」的前提下,提高整體可用額度,尤其是在 AI Agent 與 Code 類型場景中,用量提升最為明顯。

百萬億 Token 活動提前結束

小米同時宣布,「百萬億 Token 創造者激勵計畫」已正式結束。官方表示,活動自 4 月 28 日推出後,累計發放的 100T Tokens 已於 5 月 26 日下午全數送完,因此提前收官。不過,針對 Apache 軟體基金會成員提供的專屬福利活動,則仍會持續開放申請。

現有付費用戶額度全面重置

此次更新另一項重點,是所有目前仍在有效期內的 Token Plan 用戶,其額度將全面重置。這項措施涵蓋一般訂閱用戶、參與百萬億 Token 活動取得資格的用戶,以及 Apache 軟體基金會福利方案使用者,並全面套用新的計費規則。

此外,小米也預告,針對過去已過期的歷史付費用戶,未來一周內還會公布額外補償或優惠方案。

推理系統優化 降低 GPU 與快取成本

小米技術團隊表示,本次價格調整背後,核心原因來自推理系統的優化。

官方提到,團隊已基於 SGLang HiCache 完整支援 SWA(Sliding Window Attention)技術,讓 KV Cache 在 GPU 顯存、CPU 記憶體與 SSD 多層儲存之間的資料搬運量降至原本約七分之一,同時可快取 Token 數量提升近五倍。小米也透過專家並行方案、輸入長度分桶策略等方式,提高整體叢集吞吐能力,進一步降低單位 Token 成本。

中國 AI 模型市場競爭愈發激烈,各家業者近期陸續展開大規模價格調整。從 DeepSeek、阿里巴巴、百度到小米,近期都開始強調低成本推理與高性價比模型服務,希望吸引更多開發者與企業客戶導入。

小米則表示,未來仍將持續投入推理基礎設施與模型能力優化,希望透過低成本與高效能模型服務,推動更大規模的 AI 應用落地。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

孫淑媚北流開唱 公布「醫生」真面目

孫淑媚北流開唱 公布「醫生」真面目

周迅.金高銀驚喜同框 中文羞澀告白:我很喜歡妳

周迅.金高銀驚喜同框 中文羞澀告白:我很喜歡妳

黃仁勳跳〈GOLDEN〉 這真的不是AI嗎!

黃仁勳跳〈GOLDEN〉 這真的不是AI嗎!

【福利給好給滿!】韓國追星追到黃仁勳 現場尖叫+歡呼聲超熱鬧XD

【福利給好給滿!】韓國追星追到黃仁勳 現場尖叫+歡呼聲超熱鬧XD

【要收保護費!】半夜看見浪貓在約會 牠發現人類馬上來討吃XD

【要收保護費!】半夜看見浪貓在約會 牠發現人類馬上來討吃XD

讀者迴響

Midjourney是什麼?

Midjourney是AI影像生成工具,只需輸入文字就能畫出照片級圖片,適合創作、設計參考使用。

最夯影音

更多

熱門快報

回到網頁頂端