跳转至

MiniMax M2.5 文本生成

MiniMax 当前旗舰文本模型,面向复杂编程、Agent 工作流和复杂任务场景,支持 204,800 tokens 上下文窗口,官方标注输出速度约 100 tps。

模型信息

属性
模型ID MiniMax-M2.5
任务类型 对话(Chat)/ 文本生成 / Agent
输入 文本 / 工具调用结果
输出 文本 / 推理内容
上下文窗口 204,800 tokens
输出速度 约 100 tps
多模态输入 暂不支持图片 / 文档

支持的能力

能力 支持
深度思考
流式输出
工具调用
Anthropic 兼容 是(官方推荐)
OpenAI 兼容
图片 / 文档输入

API 调用

推荐方式

官方推荐通过 Anthropic 兼容接口调用,也支持 OpenAI 兼容接口。若需要直接发送 HTTP 请求,官方仍提供 POST /v1/text/chatcompletion_v2,但该接口已标记为 deprecated。

端点

接口 端点 说明
Anthropic 兼容 https://api.minimax.io/anthropic 官方推荐的兼容基址
OpenAI 兼容 https://api.minimax.io/v1 OpenAI SDK 兼容基址
标准 HTTP POST https://api.minimax.io/v1/text/chatcompletion_v2 官方 API 参考提供,已标记 deprecated

请求头

参数 类型 必填 说明
Authorization string Bearer $MINIMAX_API_KEY
Content-Type string 固定为 application/json

请求参数

参数 类型 必填 默认值 说明
model string - 模型 ID,MiniMax-M2.5
messages object[] - 对话消息列表;兼容接口支持文本与工具调用结果,不支持图片 / 文档输入
stream boolean false 是否启用流式输出
max_tokens integer - 已 deprecated,建议改用 max_completion_tokens
max_completion_tokens integer - 生成输出的最大 token 数,范围 x >= 1
temperature number 推荐 1.0 随机度控制,范围 (0, 1]
top_p number 0.95 核采样参数,范围 (0, 1]
tool_choice string auto 工具调用策略,支持 none / auto
tools object[] - 工具定义列表
stream_options object - 流式输出选项
mask_sensitive_info boolean false 是否对输出中的敏感信息打码

response_format 在官方文档中标注仅 MiniMax-Text-01 支持,因此不适用于 MiniMax-M2.5

请求示例

curl -X POST 'https://api.minimax.io/v1/text/chatcompletion_v2' \
  -H "Authorization: Bearer $MINIMAX_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "MiniMax-M2.5",
    "messages": [
      {
        "role": "user",
        "name": "user",
        "content": "请写一个 Python 函数,返回斐波那契数列前 10 项。"
      }
    ],
    "max_completion_tokens": 1000,
    "temperature": 1,
    "top_p": 0.95
  }'

响应示例

{
  "id": "04ecb5d9b1921ae0fb0e8da9017a5474",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "role": "assistant",
        "name": "MiniMax AI",
        "content": "下面是一个返回前 10 项斐波那契数列的 Python 函数。",
        "reasoning_content": "...omitted"
      }
    }
  ],
  "created": 1755153113,
  "model": "MiniMax-M2.5",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 249,
    "prompt_tokens": 26,
    "completion_tokens": 223,
    "completion_tokens_details": {
      "reasoning_tokens": 214
    }
  },
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

多轮与工具调用注意事项

  • 在多轮函数调用对话中,必须把模型完整响应追加回对话历史,避免推理链中断。
  • 使用 OpenAI 兼容接口时,可以通过 reasoning_split=true 将思考内容拆分到 reasoning_details 字段。
  • 使用 Anthropic 兼容接口时,应保留完整 response.content 列表,其中可能包含 thinkingtexttool_usetool_result 内容块。

计费

按 token 计费,单位为美元 / 百万 tokens。

项目 价格
输入 $0.3 / M tokens
输出 $1.2 / M tokens
Prompt Cache 读取 $0.03 / M tokens
Prompt Cache 写入 $0.375 / M tokens

计费说明:

  • 计费项为输入与输出 token 数。
  • 官方估算约 1000 tokens 对应 1600 个中文字符,实际消耗以真实请求为准。

速率限制

指标 限制
RPM 500
TPM 20,000,000

数据来源

  • 文本生成指南:https://platform.minimax.io/docs/guides/text-generation
  • Compatible Anthropic API:https://platform.minimax.io/docs/api-reference/text-anthropic-api
  • Compatible OpenAI API:https://platform.minimax.io/docs/api-reference/text-openai-api
  • Text Generation(deprecated HTTP 接口):https://platform.minimax.io/docs/api-reference/text-post
  • Pay as You Go:https://platform.minimax.io/docs/guides/pricing-paygo
  • Rate Limits:https://platform.minimax.io/docs/guides/rate-limits