Kimi K2 快速开始
Kimi K2 概览
Kimi K2 是月之暗面推出的新一代具备自主行动 (agentic) 能力的旗舰模型。采用 1T 总参数量、32B 激活参数的 MoE 架构设计。该模型在代码编程 (AI coding) 和智能体 (Agent) 搭建两大领域表现卓越。技术报告 (opens in a new tab)

顶尖的代码编程能力
- 国内领先:Kimi K2 是目前国内表现最优秀的 Coding 模型之一
- 全栈支持:从前端到后端,从代码生成到开发运维、调试优化,全方位覆盖真实编程场景
- 效率倍增:官方提供联网搜索等十余款开箱即用工具,配合精准的 tool call 调用能力,显著提升编程效率
强大的智能体搭建能力
- 复杂任务分解:能够自动将需求拆解为一系列可执行的工具调用结构 用 Kimi K2 模型搭建 Agent
- Enforcer & Json Mode:特有功能确保工具调用格式的稳定性和可控性
- 多工具协同:内置联网搜索等十余款工具,支持复杂的多步骤智能体工作流 了解更多
- 准确的工具调用:官方 API 版本工具调用准确率接近 100%,是智能体可靠运行的基础(注:第三方平台部署的开源版本工具调用能力可能会有所下降,具体测试结果请见 K2 Vendor Verifier 项目 (opens in a new tab))
超长上下文支持
- kimi-k2-0905-Preview,kimi-k2-turbo-preview,kimi-k2-thinking,kimi-k2-thinking-turbo 模型均提供 256K 上下文窗口
长思考能力
- kimi-k2-thinking,kimi-k2-thinking-turbo 模型是最新推出的思考模型,支持多步工具调用和推理,擅长解决复杂问题
官方推荐的 API 版本说明
| K2 模型版本 | 特点 |
|---|---|
| kimi-k2-0905-preview | kimi k2 最新版本,支持 256K 上下文窗口 |
| kimi-k2-turbo-preview | kimi k2 高速版本,速度高达 60-100 Tokens/s,适合企业级和高响应智能体应用 |
| kimi-k2-thinking | kimi k2 的长思考模型,支持 256k 上下文,支持多步工具调用与思考,擅长解决更复杂的问题 |
| kimi-k2-thinking-turbo | kimi k2 的长思考模型的高速版本 |
- 注:kimi k2 模型的更多说明请见 模型列表
立即开始
- 立即体验:在开发工作台,快速通过交互式操作测试模型在业务场景上的效果
- 申请 API Key:立即通过 API 调用测试
调用示例
以下是完整的调用示例,帮助您快速上手 Kimi K2 模型。
安装 OpenAI SDK
Kimi API 完全兼容 OpenAI 的 API 格式,你可以通过如下方式来安装 OpenAI SDK:
pip install --upgrade 'openai>=1.0'验证安装结果
python -c 'import openai; print("version =",openai.__version__)'
# 输出可能是 version = 1.10.0,表示 OpenAI SDK 已经安装成功,当前 python 实际使用了 openai 的 v1.10.0 的库
代码示例
from openai import OpenAI
client = OpenAI(
api_key = "$MOONSHOT_API_KEY",
base_url = "https://api.moonshot.cn/v1",
)
completion = client.chat.completions.create(
model = "kimi-k2-turbo-preview",
messages = [
{"role": "system", "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手,你更擅长中文和英文的对话。你会为用户提供安全,有帮助,准确的回答。同时,你会拒绝一切涉及恐怖主义,种族歧视,黄色暴力等问题的回答。Moonshot AI 为专有名词,不可翻译成其他语言。"},
{"role": "user", "content": "你好,我叫李雷,1+1等于多少?"}
],
temperature = 0.6, #控制输出的随机性
# max_tokens=32000, #最大输出 tokens
)
print(completion.choices[0].message.content)如果您成功运行上述代码,且没有任何报错,那么您将看到类似如下的内容输出:
你好,李雷!1+1 等于 2。这是一个基本的数学加法问题。如果你有其他问题或需要帮助,请随时告诉我。流式调用
from openai import OpenAI
client = OpenAI(
api_key = "MOONSHOT_API_KEY", # 替换为你自己的API Key
base_url = "https://api.moonshot.cn/v1",
)
stream = client.chat.completions.create(
model = "kimi-k2-turbo-preview",
messages = [
{"role": "system", "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手,你更擅长中文和英文的对话。你会为用户提供安全,有帮助,准确的回答。同时,你会拒绝一切涉及恐怖主义,种族歧视,黄色暴力等问题的回答。Moonshot AI 为专有名词,不可翻译成其他语言。"},
{"role": "user", "content": "你好,我叫李雷,1+1等于多少?"}
],
temperature=0.6, #控制输出的随机性
max_tokens=32000, #最大输出tokens
stream=True, # 启用流式输出
)
for chunk in stream:
delta = chunk.choices[0].delta #流式片段
if delta.content:
print(delta.content, end="")
补充说明
- Kimi K2 为纯文本模型。如需处理图片等多种文件格式,推荐使用 [Kimi K2.5](/docs/guide /kimi-k2-5-quickstart.mdx) 模型。
- 在这里查看在 Claude Code, Roo Code, Cline中使用Kimi K2的方法
- 在这里查看如何使用Kimi K2 长思考模型
- 联网搜索是Kimi API官方提供的强大工具之一,在这里查看如何使用联网搜索,以及其他官方工具
- 在这里查看全部模型价格,充值与限速说明,联网搜索价格说明