思考级别控制代理推理过程的深度和详细程度,通过 /think 指令进行调整。
概述
思考级别系统允许你控制代理的推理深度,从快速响应到深度分析,适应不同的任务需求。
思考级别
| 级别 | 说明 | 适用场景 |
|---|---|---|
off |
无思考过程,直接响应 | 简单查询、事实性问答 |
minimal |
最小化思考 | 快速任务、简单操作 |
low |
低度思考 | 常规任务、标准操作 |
medium |
中等思考(默认) | 大多数任务、平衡性能和质量 |
high |
深度思考 | 复杂问题、需要详细分析 |
xhigh |
极深度思考 | 极复杂问题、研究性任务 |
使用方法
内联指令
在消息中使用,仅影响当前消息:
/think high 分析这个复杂的技术问题
/t low 简单查询一下
/thinking medium 这是一个标准任务
会话设置
单独发送命令,设置整个会话的默认级别:
/think high
/t medium
/thinking off
查看当前级别
/think
/think:
/t
详细输出控制
Verbose模式
# 启用详细输出
/v on
/verbose on
# 完全详细模式
/v full
/verbose full
# 禁用详细输出
/v off
/verbose off
推理流式输出
# 启用推理输出
/reasoning on
# 流式推理输出
/reasoning stream
# 禁用推理输出
/reasoning off
配置默认级别
{
"agents": {
"defaults": {
"thinkingLevel": "medium",
"verbose": false,
"reasoning": "off"
},
"list": [
{
"id": "research",
"thinkingLevel": "high",
"verbose": true
},
{
"id": "quick",
"thinkingLevel": "low"
}
]
}
}
思考级别对比
off vs minimal
- off: 完全跳过思考步骤,最快响应
- minimal: 保留基本推理,略慢但更可靠
medium vs high
- medium: 平衡性能和质量,适合大多数任务
- high: 更深入的分析,消耗更多tokens但质量更高
high vs xhigh
- high: 详细分析,适合复杂任务
- xhigh: 极度详细,适合研究和极复杂问题
性能影响
| 级别 | 响应时间 | Token消耗 | 输出质量 |
|---|---|---|---|
| off | 极快 | 最低 | 基础 |
| minimal | 很快 | 低 | 良好 |
| low | 快 | 较低 | 良好 |
| medium | 中等 | 中等 | 优秀 |
| high | 较慢 | 较高 | 优秀 |
| xhigh | 慢 | 高 | 极优 |
使用建议
按任务类型选择
- 简单查询: off 或 minimal
- 代码审查: medium 或 high
- 架构设计: high 或 xhigh
- 快速脚本: low 或 medium
- 研究分析: high 或 xhigh
成本优化
- 开发阶段使用较低级别
- 关键任务使用较高级别
- 批量任务使用较低级别
- 复杂决策使用较高级别
组合使用
# 详细模式 + 高思考级别
/think high /verbose on
# 快速模式 + 推理输出
/think low /reasoning stream
# 深度分析 + 完全详细
/think xhigh /verbose full /reasoning on
调试技巧
- 遇到问题时提高思考级别
- 使用verbose查看详细过程
- 启用reasoning了解推理逻辑
- 对比不同级别的输出质量
提示
思考级别是平衡性能和质量的关键工具。根据任务复杂度动态调整思考级别,可以在保证质量的同时优化成本和响应时间。