文档
产品定价
模型推理

模型推理价格说明

计费基本概念

计费单元

Token:代表常见的字符序列,每个汉字使用的 Token 数目可能是不同的。例如,单个汉字"夔"可能会被分解为若干 Token 的组合,而像"中国"这样短且常见的短语则可能会使用单个 Token。

大致来说,对于一段通常的中文文本,1 个 Token 大约相当于 1.5-2 个汉字。具体每次调用实际产生的 Tokens 数量可以通过调用计算 Token API 来获得。

计费逻辑

我们对 Input 和 Output 均实行按量计费。如果您上传并抽取文档内容,并将抽取的文档内容作为 Input 传输给模型,那么文档内容也将按量计费。

但如果您只上传并抽取文档,这个API本身不会产生费用。

产品定价

文本生成模型 Moonshot-v1

模型计费单位价格
moonshot-v1-8k1M tokens¥12.00
moonshot-v1-32k1M tokens¥24.00
moonshot-v1-128k1M tokens¥60.00

此处 1M = 1,000,000,表格中的价格代表每消耗 1M tokens 的价格。

以上模型的区别在于它们的最大上下文长度,这个长度包括了输入消息和生成的输出,在效果上并没有什么区别。

收费接口说明

  • Chat Completion 接口收费:按照实际输入输出 tokens 的消耗计费
  • 文件相关接口(文件内容抽取/文件存储)接口限时免费