doubao-seed-2.0-mini 对话模型

豆包轻量高效模型，低时延高并发，支持四档思考深度，适合轻量任务和高并发场景。

模型信息

属性	值
模型ID	`doubao-seed-2-0-mini-260215`
任务类型	对话（Chat）
输入	文本 / 图片 / 视频
输出	文本
上下文窗口	256k tokens
最大输入	256k tokens
最大回答	128k tokens（默认 4k）
最大思维链	128k tokens

支持的能力

能力	支持
深度思考	是
文本生成	是
多模态理解（图片/视频）	是
工具调用（Function Calling）	是
上下文缓存	是

API 调用

端点

POST https://ark.cn-beijing.volces.com/api/v3/chat/completions

请求头

参数	类型	必填	说明
Content-Type	string	是	`application/json`
Authorization	string	是	`Bearer $ARK_API_KEY`

请求参数

参数	类型	必填	默认值	说明
model	string	是	—	`doubao-seed-2-0-mini-260215`
messages	object[]	是	—	消息列表（system/user/assistant/tool）
thinking	object	否	`{"type":"enabled"}`	深度思考模式：`enabled`/`disabled`/`auto`
stream	boolean	否	false	是否流式返回
stream_options	object	否	null	流式选项，`include_usage` 等
max_tokens	integer	否	4096	模型回答最大长度（token）
max_completion_tokens	integer	否	—	最大输出长度（含思维链），范围 [0, 65536]
reasoning_effort	string	否	medium	思考深度：`minimal`/`low`/`medium`/`high`
temperature	float	否	1	采样温度
top_p	float	否	0.7	核采样概率阈值
stop	string/string[]	否	null	停止序列，最多 4 个
frequency_penalty	float	否	0	频率惩罚系数，范围 [-2.0, 2.0]
presence_penalty	float	否	0	存在惩罚系数，范围 [-2.0, 2.0]
tools	object[]	否	null	工具列表（Function Calling）
tool_choice	string/object	否	auto	工具选择：`none`/`auto`/`required`/指定函数
parallel_tool_calls	boolean	否	true	是否允许并行工具调用
logprobs	boolean	否	false	是否返回对数概率（深度思考模式不支持）
top_logprobs	integer	否	0	每个位置返回的最可能 token 数
service_tier	string	否	auto	TPM 保障包：`auto`/`default`

请求示例

curl -X POST 'https://ark.cn-beijing.volces.com/api/v3/chat/completions' \
  -H "Authorization: Bearer $ARK_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "doubao-seed-2-0-mini-260215",
    "messages": [
      {"role": "system", "content": "你是一个有用的助手。"},
      {"role": "user", "content": "你好，请介绍一下你自己。"}
    ]
  }'

响应示例

{
  "id": "chatcmpl-xxx",
  "model": "doubao-seed-2-0-mini-260215",
  "object": "chat.completion",
  "created": 1700000000,
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "message": {
        "role": "assistant",
        "content": "你好！我是豆包..."
      }
    }
  ],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 50,
    "total_tokens": 70,
    "prompt_tokens_details": {"cached_tokens": 0},
    "completion_tokens_details": {"reasoning_tokens": 0}
  }
}

计费

按 token 用量计费，单位：元/百万 token。价格根据输入长度分层：

输入长度（千 token）	输入单价	缓存存储（/小时）	缓存输入	输出单价
[0, 32]	0.2	0.017	0.04	2.0
(32, 128]	0.4	0.017	0.08	4.0
(128, 256]	0.8	0.017	0.16	8.0

速率限制

指标	限制
RPM	30,000
TPM	5,000,000

数据来源

模型列表：https://www.volcengine.com/docs/82379/1330310
模型价格：https://www.volcengine.com/docs/82379/1544106
Chat API 参考：https://www.volcengine.com/docs/82379/1494384