MiniMax M2.5 文本生成

MiniMax 当前旗舰文本模型，面向复杂编程、Agent 工作流和复杂任务场景，支持 204,800 tokens 上下文窗口，官方标注输出速度约 100 tps。

模型信息

属性	值
模型ID	`MiniMax-M2.5`
任务类型	对话（Chat）/ 文本生成 / Agent
输入	文本 / 工具调用结果
输出	文本 / 推理内容
上下文窗口	204,800 tokens
输出速度	约 100 tps
多模态输入	暂不支持图片 / 文档

支持的能力

能力	支持
深度思考	是
流式输出	是
工具调用	是
Anthropic 兼容	是（官方推荐）
OpenAI 兼容	是
图片 / 文档输入	否

API 调用

端点

接口	端点	说明
Anthropic 兼容	`https://api.minimax.io/anthropic`	官方推荐的兼容基址
OpenAI 兼容	`https://api.minimax.io/v1`	OpenAI SDK 兼容基址
标准 HTTP	`POST https://api.minimax.io/v1/text/chatcompletion_v2`	官方 API 参考提供，已标记 deprecated

请求头

参数	类型	必填	说明
Authorization	string	是	`Bearer $MINIMAX_API_KEY`
Content-Type	string	是	固定为 `application/json`

请求参数

参数	类型	必填	默认值	说明
model	string	是	-	模型 ID，`MiniMax-M2.5`
messages	object[]	是	-	对话消息列表；兼容接口支持文本与工具调用结果，不支持图片 / 文档输入
stream	boolean	否	false	是否启用流式输出
max_tokens	integer	否	-	已 deprecated，建议改用 `max_completion_tokens`
max_completion_tokens	integer	否	-	生成输出的最大 token 数，范围 `x >= 1`
temperature	number	否	推荐 1.0	随机度控制，范围 `(0, 1]`
top_p	number	否	0.95	核采样参数，范围 `(0, 1]`
tool_choice	string	否	auto	工具调用策略，支持 `none` / `auto`
tools	object[]	否	-	工具定义列表
stream_options	object	否	-	流式输出选项
mask_sensitive_info	boolean	否	false	是否对输出中的敏感信息打码

response_format 在官方文档中标注仅 MiniMax-Text-01 支持，因此不适用于 MiniMax-M2.5。

请求示例

curl -X POST 'https://api.minimax.io/v1/text/chatcompletion_v2' \
  -H "Authorization: Bearer $MINIMAX_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "MiniMax-M2.5",
    "messages": [
      {
        "role": "user",
        "name": "user",
        "content": "请写一个 Python 函数，返回斐波那契数列前 10 项。"
      }
    ],
    "max_completion_tokens": 1000,
    "temperature": 1,
    "top_p": 0.95
  }'

响应示例

{
  "id": "04ecb5d9b1921ae0fb0e8da9017a5474",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "role": "assistant",
        "name": "MiniMax AI",
        "content": "下面是一个返回前 10 项斐波那契数列的 Python 函数。",
        "reasoning_content": "...omitted"
      }
    }
  ],
  "created": 1755153113,
  "model": "MiniMax-M2.5",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 249,
    "prompt_tokens": 26,
    "completion_tokens": 223,
    "completion_tokens_details": {
      "reasoning_tokens": 214
    }
  },
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

多轮与工具调用注意事项

在多轮函数调用对话中，必须把模型完整响应追加回对话历史，避免推理链中断。
使用 OpenAI 兼容接口时，可以通过 reasoning_split=true 将思考内容拆分到 reasoning_details 字段。
使用 Anthropic 兼容接口时，应保留完整 response.content 列表，其中可能包含 thinking、text、tool_use 和 tool_result 内容块。

计费

按 token 计费，单位为美元 / 百万 tokens。

项目	价格
输入	$0.3 / M tokens
输出	$1.2 / M tokens
Prompt Cache 读取	$0.03 / M tokens
Prompt Cache 写入	$0.375 / M tokens

计费说明：

计费项为输入与输出 token 数。
官方估算约 1000 tokens 对应 1600 个中文字符，实际消耗以真实请求为准。

速率限制

指标	限制
RPM	500
TPM	20,000,000

数据来源

文本生成指南：https://platform.minimax.io/docs/guides/text-generation
Compatible Anthropic API：https://platform.minimax.io/docs/api-reference/text-anthropic-api
Compatible OpenAI API：https://platform.minimax.io/docs/api-reference/text-openai-api
Text Generation（deprecated HTTP 接口）：https://platform.minimax.io/docs/api-reference/text-post
Pay as You Go：https://platform.minimax.io/docs/guides/pricing-paygo
Rate Limits：https://platform.minimax.io/docs/guides/rate-limits

MiniMax M2.5 文本生成

模型信息

支持的能力

API 调用

推荐方式

端点

请求头

请求参数

请求示例

响应示例

多轮与工具调用注意事项

计费

速率限制

数据来源