🎉 最新发布 kimi k2.5 模型,支持多模态理解与处理,擅长解决更复杂的问题。
文档
入门指南
Kimi K2

Kimi K2 快速开始

Kimi K2 概览

Kimi K2 是月之暗面推出的新一代具备自主行动 (agentic) 能力的旗舰模型。采用 1T 总参数量、32B 激活参数的 MoE 架构设计。该模型在代码编程 (AI coding) 和智能体 (Agent) 搭建两大领域表现卓越。技术报告 (opens in a new tab)

kimi-k2

顶尖的代码编程能力

  • 国内领先:Kimi K2 是目前国内表现最优秀的 Coding 模型之一
  • 全栈支持:从前端到后端,从代码生成到开发运维、调试优化,全方位覆盖真实编程场景
  • 效率倍增:官方提供联网搜索等十余款开箱即用工具,配合精准的 tool call 调用能力,显著提升编程效率

强大的智能体搭建能力

  • 复杂任务分解:能够自动将需求拆解为一系列可执行的工具调用结构 用 Kimi K2 模型搭建 Agent
  • Enforcer & Json Mode:特有功能确保工具调用格式的稳定性和可控性
  • 多工具协同:内置联网搜索等十余款工具,支持复杂的多步骤智能体工作流 了解更多
  • 准确的工具调用:官方 API 版本工具调用准确率接近 100%,是智能体可靠运行的基础(注:第三方平台部署的开源版本工具调用能力可能会有所下降,具体测试结果请见 K2 Vendor Verifier 项目 (opens in a new tab))

超长上下文支持

  • kimi-k2-0905-Preview,kimi-k2-turbo-preview,kimi-k2-thinking,kimi-k2-thinking-turbo 模型均提供 256K 上下文窗口

长思考能力

  • kimi-k2-thinking,kimi-k2-thinking-turbo 模型是最新推出的思考模型,支持多步工具调用和推理,擅长解决复杂问题

官方推荐的 API 版本说明

K2 模型版本特点
kimi-k2-0905-previewkimi k2 最新版本,支持 256K 上下文窗口
kimi-k2-turbo-previewkimi k2 高速版本,速度高达 60-100 Tokens/s,适合企业级和高响应智能体应用
kimi-k2-thinkingkimi k2 的长思考模型,支持 256k 上下文,支持多步工具调用与思考,擅长解决更复杂的问题
kimi-k2-thinking-turbokimi k2 的长思考模型的高速版本

立即开始

  • 立即体验:在开发工作台,快速通过交互式操作测试模型在业务场景上的效果
  • 申请 API Key:立即通过 API 调用测试

调用示例

以下是完整的调用示例,帮助您快速上手 Kimi K2 模型。

安装 OpenAI SDK

Kimi API 完全兼容 OpenAI 的 API 格式,你可以通过如下方式来安装 OpenAI SDK:

pip install --upgrade 'openai>=1.0'

验证安装结果

python -c 'import openai; print("version =",openai.__version__)'
 
# 输出可能是 version = 1.10.0,表示 OpenAI SDK 已经安装成功,当前 python 实际使用了 openai 的 v1.10.0 的库
 

代码示例

from openai import OpenAI
 
client = OpenAI(
    api_key = "$MOONSHOT_API_KEY",
    base_url = "https://api.moonshot.cn/v1",
)
 
completion = client.chat.completions.create(
    model = "kimi-k2-turbo-preview",
    messages = [
        {"role": "system", "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手,你更擅长中文和英文的对话。你会为用户提供安全,有帮助,准确的回答。同时,你会拒绝一切涉及恐怖主义,种族歧视,黄色暴力等问题的回答。Moonshot AI 为专有名词,不可翻译成其他语言。"},
        {"role": "user", "content": "你好,我叫李雷,1+1等于多少?"}
    ],
    temperature = 0.6, #控制输出的随机性
    # max_tokens=32000, #最大输出 tokens
)
 
print(completion.choices[0].message.content)

如果您成功运行上述代码,且没有任何报错,那么您将看到类似如下的内容输出:

你好,李雷!1+1 等于 2。这是一个基本的数学加法问题。如果你有其他问题或需要帮助,请随时告诉我。

流式调用

from openai import OpenAI
 
client = OpenAI(
    api_key = "MOONSHOT_API_KEY", # 替换为你自己的API Key
    base_url = "https://api.moonshot.cn/v1",
)
 
stream = client.chat.completions.create(
    model = "kimi-k2-turbo-preview",
    messages = [
        {"role": "system", "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手,你更擅长中文和英文的对话。你会为用户提供安全,有帮助,准确的回答。同时,你会拒绝一切涉及恐怖主义,种族歧视,黄色暴力等问题的回答。Moonshot AI 为专有名词,不可翻译成其他语言。"},
        {"role": "user", "content": "你好,我叫李雷,1+1等于多少?"}
    ],
    temperature=0.6, #控制输出的随机性
    max_tokens=32000, #最大输出tokens 
    stream=True, # 启用流式输出
)
 
for chunk in stream:
        delta = chunk.choices[0].delta #流式片段
        if delta.content:
                print(delta.content, end="")
 

补充说明