小米自研大模型 MiMo-V2.5 API 永久降价最高 99%:不再区分上下文长度
2026-05-27 15:46:46
5 月 27 日消息:今日,小米宣布旗下「MiMo-V2.5」系列大模型 API 迎来永久降价。
据介绍,相比原始API定价,MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。
本次调价已于北京时间5月27日0:00正式生效,全球同步调整。
具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。

其中,MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens,最高降幅达99%;MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,最高降幅达98%。
输出价格方面,MiMo-V2.5 Pro降至6元/百万tokens,最高降幅86%;MiMo-V2.5降至2元/百万tokens,最高降幅93%。
除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化。
优化后的Token Plan在加量不加价的基础上,用量提升至原来的5至8倍,同时引入Credits概念,让计费规则更清晰、更易理解。

小米称,本次价格调整背后,离不开技术团队在推理系统上的持续优化。
据了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍,从而显著提升缓存命中率和推理效率。
同时,小米还通过优化专家并行方案、输入长度分桶策略等方式,进一步提升集群输入吞吐能力,在保障服务质量的前提下,持续降低单位token服务成本。
相关阅读
-
麒麟 9050 Pro 流片完成!华为 Mate 90 首发搭载,史上最强 Mate 稳了金融科技前沿 2026-05-27 15:44:35
-
电梯变水帘洞!男子手抖按不停急停键,这画面我真没绷住深度解读 2026-05-27 15:40:51
-
6 月 1 日起实施!灵活车驾驶人委靡驾驶认定例则详解与细节解读金融科技前沿 2026-05-27 15:38:37
-
华为 FreeClip 2 典藏版官宣 6 月 1 日发布:珠宝盒灵感设计,典礼感拉满深度解读 2026-05-27 15:35:34
-
海尔发布 AI 运动外骨骼机器人:1.75kg 全碳纤维钛合金机身破纪录深度解读 2026-05-27 15:29:35
-
运营商开卖 AI 流量包:是救命稻草还是新管道?深度解读 2026-05-27 15:24:24
-
阿里 Qwen3.7-Max 编程力登顶国产第一:1541 分超越全球仅次 Claude深度解读 2026-05-27 15:18:40
-
国产 AI 新爆发:MiniMax M3 大模型即将发布,性能提升 10-15 倍金融科技前沿 2026-05-27 15:13:26
-
潮汕 00 后博士创业:千元眼罩 3 个月获融资,揭秘新消费爆款逻辑深度解读 2026-05-27 15:12:51
-
武契奇称买不起小米汽车?雷军回应 YU7 定价 23.35 万:年薪不足 20 万金融科技前沿 2026-05-27 15:07:04