世界杯官方认证平台 西游取经团再出征:小米 Token Plan 能把 Token 价钱打下来吗?

雷峰网讯 大模子要怎样收费,众说纷纭。今天最常见的是订阅制,齐说模子是新时间的基建,但没见谁家电表是包月的。当作模子层的青出于蓝,4 月 3 日,小米发布了第一款"走字儿"的 Token Plan。

在这套计费有缠绵中,Token 糜费的最小计数单元被归拢为 Credit。用户为后者付费,购买额度不一的套餐。在调用 MiMo 系列的不同模子时,每个 Credit 点数也对应着不同的 Token 额度,换算比举例下:
MiMo-V2-Omni 256k 高下文:1x(糜费 1 Token = 1 Credit)
MiMo-V2-Pro 256k 高下文: 2x(糜费 1 Token = 2 Credits)
MiMo-V2-Pro 256k~1M 高下文: 4x(糜费 1 Token = 4 Credits)
MiMo-V2-TTS:0x(限时免费,不糜费 Credit)
雷同流量包的设计让用户对模子调用有了更大的解放度。在 Anthropic、OpenAI、阿里等主流模子厂商齐通过" 5 小时滚动窗口"左右用户的使用时期时,小米这次推出的 Token Plan 取消了这一划定,复古用户逼近糜费 Token,编程 vibe 到爽。
这是一套富余不同的计费逻辑。
对用户而言,传统的订阅制是用固定资本换取模子调用权力,逻辑通俗澄澈,易于给与。但任务难度的波动让平台资本难以预计,模子厂商对用户加以使用时期和每周肯求次数上限的左右,齐是为搞定这一问题。
另一种常见有缠绵是按模子调用次数计费,相似不错幸免用户际遇帐单冲击。但相似是一次肯求,复杂任务编程和修改一份简历的 Token 资本天悬地隔,这种有缠绵难以在计费上体现出不同任务的复杂度,专科斥地者的 Token 资本最终会被小白玩家沿途摊派。
而小米从 Credit 到 Token 的换算,是对模子文本处理量径直计费,逻辑上照实更易于自制地预计每个任务的骨子资本。它把 AI 作事从一种固定消费,变成了随任务难度转念的弹性糜费。
但问题在于,Token 是模子念念考的最小单元,普通用户却难以预估一项任务的骨子糜费。当模子输出从单轮的回答转向径直委用任务终端,Token 糜费量更是会呈指数级增多,对用户而言又是一重分解职守。
模子成为新一代基础设施的改日已成定局。在 Claude Code、OpenClaw 越发平常地插足坐褥环境时,什么是更合理的计费有缠绵?
Xiaomi MiMo Token Plan 提供了一种全新的可能,对它的评价相似应该回到真实场景。为此咱们向 Mimo V2 Pro 下达了真实的任务辅导,望望模子的进展如何,以及小米为此开出了什么样的价钱。
01
核心实测:复杂架构设计与多 Agent 协同科研
在 OpenClaw 框架之下,咱们基于 MiMo V2 Pro 搭建了一套多变安设合系统,将科研过程拆解为五个相对巩固的职责:标的运筹帷幄、算法终了、学术写稿、文件整理与数据处理。对应地,咱们引入了五个不同变装的 Agent,分别承担不同类型的任务:
唐僧:科研政策与标的运筹帷幄(想显著要去哪)
孙悟空:算法斥地和工程落地(把事干出来)
猪八戒:学术写稿与抒发(把话说显著)
沙僧:文件整理与学问照拂(把信息理顺)
白龙马:数据处理与过程自动化(把基础打好)
现在大模子落地诈骗在工程技能上存在诸多挑战。一个常见风景是小范围的代码生成已不在话下,但面对复杂架构时,模子常常会出现一致性等问题。
为此咱们将首个测试任务交给孙悟空 Agent,条款它基于公开文分内类数据集,完成一个"小样本垂直范围文分内类基线系统"的斥地,借此不雅察 MiMo V2 Pro 在代码终了、复现以及工程封装上的进展。

经过 3-4 小时的运行,悟空构建了完好的框架与细节。



核心功能方面,悟空按需务终明晰 TF-IDF+LogReg 传统机器学习路子和 BERT fine-tuning 深度学习路子,覆盖了不同估计资源场景,况兼从数据下载、读取、清洗、阔别、锤真金不怕火到评估的全过程闭环,造成了可复现的 ML pipeline。
工程化委用相似圭表。通过 train.py 和 evaluate.py 提供归拢进口,相宜 Python 方式通例。实际终端表格纠合模子优劣分析的结构化输出,更展现了 MiMo V2 Pro 的才能不啻于跑通代码,更在于解说终端。
另一项测试任务是多 Agent 的协同科研。
咱们条款五个 Agent 协同完成一个微型科研方式,方式主题为"面向垂直范围 LLM 的轻量化蒸馏征询",任务内容覆盖了从课题立项到可投稿初稿的完好闭环。这一任务旨在查考 OpenClaw 场景下 MiMo V2 Pro 的智能体配合才能。


值得把稳的是,收到具体单干之后,MiMo V2 Pro 并未径直输出终端,而是进行即时的变装分离,让每个 Agent 齐凭据自身变装明确了输入依赖和输出居品。其中唐僧的输出会成为另外四个 Agent 的输出,沙僧检索到的文件会成为孙悟空实际设计的参考,后者又是白龙马进行 workflow 设计的依据,终末通盘中间终端齐作事于猪八戒的论文初稿。
这种有向无环图式的依赖结构能被模子自动识别,标明 MiMo V2 Pro 不仅对 Agent 的配合鸿沟有着澄澈的分解,况兼果真归拢了任务。


不错看到,在职务第一阶段领先由唐僧界说了"医疗 + 金融,≤ 3B 小模子蒸馏"的征询缠绵,沙僧后续的文件调研进一步覆盖了白盒 / 黑盒 / 垂直范围,识别出 DDK、MiniLLM、GKD 等 SOTA 门径。
同期当作和解核心,唐僧后续还实施了两轮配合反馈和对中间效劳的归拢验收,卓越是在职务的第三阶段实时识别出了孙悟空和白龙马的委用延长问题,启动扶持机制。
值得把稳的是在第二轮配合反馈中,唐僧提议建议"驳斥迭代周期至 3 天 checkpoint "。在资历了孙悟空和白龙马的拖延之后,进展出了对任务的迭代复盘,这是 MiMo V2 Pro 实施长程任务不能或缺的才能。

MiMo V2 Pro 的编程和器具调用才能使其卓越擅所长理多才略任务,同期 1M 级的超长高下文配置,让该模子在处理具有长代码需求的架构级任务中愈加胜任。这些进展,齐意味着 MiMo V2 Pro 不是通俗的对话模子,而是为复杂任务和斥地场景而生。
两次委用终端均水平在线,那么资本如何?

谜底约为一个 Lite 套餐额度的 60%。
02
从订阅制到流量包,2026美加墨世界杯中国认证平台谁动了我的肯求次数
Xiaomi MiMo Token Plan 提供了四档套餐:

Lite(中国 ¥ 39/ 月,国外 $6/ 月) —— 0.6 亿(60M)Credits,可实施约 120 个中等 ~ 复杂任务 。适当刚构兵 AI 斥地的探索者,以一杯咖啡的价钱运行。
Standard(中国 ¥ 99/ 月,国外 $16/ 月) —— 2 亿(200M)Credits,可实施约 400 个中等 ~ 复杂任务 。为日常依赖 AI 提效的办公与斥地者用户打造的主力有缠绵。
Pro(中国 ¥ 329/ 月,国外 $50/ 月) —— 7 亿(700M) Credits,可实施约 1400 个中等 ~ 复杂任务 。面向将 AI 深度镶嵌责任流的专科用户。
Max(中国 ¥ 659/ 月,国外 $100/ 月) —— 16 亿(1600M)Credits,可实施约 3200 个中等 ~ 复杂任务 。为全天候高强度使用的斥地者准备,近乎无左右的使用体验。
这种多档位套餐、按 Credit 点数折算 Token 糜费的模式,意味着在传统"一个会员打包天下"的作事有缠绵之后,又出现了果真按量计价的 AI 套餐。
但不知说念小米有莫得料料到的是,这种计费模式在诈骗中带来了全新的困惑:我开的套餐到底能用多久?一次 Coding 任务会糜费几许 Token?多轮调试的过程,会不会花光我的通盘额度,以致代码没调试完额度就没了?
用户再次想起了被账单冲击主宰的忌惮。
卓越是在 Coding 场景中,不同于一般的对话,多轮调试、复制粘贴长代码、束缚追问与修改的任务属性,齐会将 Token 糜费量拉到惊东说念主的高度,而这是东说念主脑难以预估的。至少在追求澄澈的预算照拂时,今天的大无数用户对 Token 糜费尚不具备可靠的直观,这不免让小米的 Token Plan 变成一笔"糊涂账"。
那么抛应许绪要素,小米让模子更低廉了吗?

对比各家厂商面向专科用户的 Pro 版块套餐,单一价钱维度上,小米在一众厂商中不占上风。但这个对比的不自制之处在于,用户为智能付费,各家套餐背后的模子性能却各不相易。
MiMo V2 Pro 原生复古 1M 高下文窗口,上表的套餐中,只须阿里云百真金不怕火的 qwen3.5-plus 和 qwen3-coder-plus 达到了这一水平,其余模子高下文窗口多左右在 256K 以下。
小米对 MiMo 的定位是 " 面向 Agent 时间的旗舰基座模子 "。不言而喻的是,Agent 在多轮运筹帷幄任务中保留历史对话时,累计 Token 会赶紧增长,每次调用器具的复返终端也会追加到高下文中,而长链推理自己又是另一个 Token 糜费大户。
在这一场景下,Credit 和 Token 的换算,更像是复古用户为高下文窗口自己付费,将 1M 的超长高下文从资本职守变成价值锚点。当作 MiMo-V2-Pro 的核心才能,这恰是其在坐褥环境中的各别化价值地方。低廉与否,取决于任务场景。
而值得把稳的是,固然小米是 Token "流量包"的开创者,但今天更常见的订阅制也并非无穷 Token。
除了单次任务中,模子高下文窗口的硬性技能左右除外,用户还濒临着隐性的经济约束机制。此前就曾灵验户反应称,火山方舟 Coding Plan 标称配额为每 5 小时 6,000 次肯求,但骨子会凭据单次肯求的 Token 糜费量折算为屡次肯求,且不同模子的隐敝倍率不同。
火山的回话则是,"常常一次用户发问会触发屡次模子调用,且每次模子调用均管帐入一次额度糜费,因此骨子糜费的肯求次数一般会多于用户发问次数。"
阿里云百真金不怕火的 Coding Plan 也存在雷同的左右,当输入超出允许长度时模子会复返报错信息,官方推选的搞定有缠绵是精简输入或切换高下文窗口更长的模子。
算力资本压力让 Coding Plan 没方针果真终了不管 Token 糜费的计费模式,因而在估计肯求次数时,会对超长高下文的任务适用处分倍数。淌若说面对小米的 Token Plan 时,大无数用户还莫得养成估算任务 Token 糜费量的直观,那么 Coding Plan 也仅仅用模子调用次数"预估值"的表述空洞了争议地带。
Token 的价钱,一直齐写在账单里。
03
Token 计费的生态逻辑
从 2026 岁首的加价潮,到小米率先径直凭据糜费量计费,Token 的订价逻辑正在悄然滚动。
此前更常见的是订阅制,一次性收费将按量计费的团结博弈过程变成单次博弈,用户以为我方不是常常刻刻在费钱,预算也不会逾额,但算力资本让这种有缠绵的现款流有时能够打正。
神经估计引擎创业者梅一凡暗示,在这一视角下,OpenAI、Anthropic 接纳的混系数费有缠绵成为了一种卓越贤惠的聘用,即订阅制基础上,超量部分按 Token 计费,前者驳斥用户心智资本,后者保险单元经济回正。
皇冠app(中国)官网入口小米的 Token Plan 自己更像一个带有封顶机制的 API Plan,但主流模子厂商相似不错照搬,核心问题仍然是模子强度和资本。
但小米策略的不同之处在于,小米生态和用户数据组成了自然的护城河,这是 MiMo 模子的浩瀚诈骗空间。因此在政策上,小米 Token Plan 背后更归拢的计费面孔,大略是一个里面"东说念主车家全生态"准备进一步发力的信号。
也许在小米联想的改日中,通盘接入自家生态的 AI 功能,齐会际遇归拢的计费有缠绵。那么 Xiaomi MiMo Token Plan 的果真酷爱酷爱,即是迈向这个改日的第一步。
雷峰网著作世界杯官方认证平台