11.16 思考级别

思考级别控制代理推理过程的深度和详细程度,通过 /think 指令进行调整。

概述

思考级别系统允许你控制代理的推理深度,从快速响应到深度分析,适应不同的任务需求。

思考级别

级别 说明 适用场景
off 无思考过程,直接响应 简单查询、事实性问答
minimal 最小化思考 快速任务、简单操作
low 低度思考 常规任务、标准操作
medium 中等思考(默认) 大多数任务、平衡性能和质量
high 深度思考 复杂问题、需要详细分析
xhigh 极深度思考 极复杂问题、研究性任务

使用方法

内联指令

在消息中使用,仅影响当前消息:

/think high 分析这个复杂的技术问题
/t low 简单查询一下
/thinking medium 这是一个标准任务

会话设置

单独发送命令,设置整个会话的默认级别:

/think high
/t medium
/thinking off

查看当前级别

/think
/think:
/t

详细输出控制

Verbose模式

# 启用详细输出
/v on
/verbose on

# 完全详细模式
/v full
/verbose full

# 禁用详细输出
/v off
/verbose off

推理流式输出

# 启用推理输出
/reasoning on

# 流式推理输出
/reasoning stream

# 禁用推理输出
/reasoning off

配置默认级别

{
  "agents": {
    "defaults": {
      "thinkingLevel": "medium",
      "verbose": false,
      "reasoning": "off"
    },
    "list": [
      {
        "id": "research",
        "thinkingLevel": "high",
        "verbose": true
      },
      {
        "id": "quick",
        "thinkingLevel": "low"
      }
    ]
  }
}

思考级别对比

off vs minimal

  • off: 完全跳过思考步骤,最快响应
  • minimal: 保留基本推理,略慢但更可靠

medium vs high

  • medium: 平衡性能和质量,适合大多数任务
  • high: 更深入的分析,消耗更多tokens但质量更高

high vs xhigh

  • high: 详细分析,适合复杂任务
  • xhigh: 极度详细,适合研究和极复杂问题

性能影响

级别 响应时间 Token消耗 输出质量
off 极快 最低 基础
minimal 很快 良好
low 较低 良好
medium 中等 中等 优秀
high 较慢 较高 优秀
xhigh 极优

使用建议

按任务类型选择

  • 简单查询: off 或 minimal
  • 代码审查: medium 或 high
  • 架构设计: high 或 xhigh
  • 快速脚本: low 或 medium
  • 研究分析: high 或 xhigh

成本优化

  • 开发阶段使用较低级别
  • 关键任务使用较高级别
  • 批量任务使用较低级别
  • 复杂决策使用较高级别

组合使用

# 详细模式 + 高思考级别
/think high /verbose on

# 快速模式 + 推理输出
/think low /reasoning stream

# 深度分析 + 完全详细
/think xhigh /verbose full /reasoning on

调试技巧

  • 遇到问题时提高思考级别
  • 使用verbose查看详细过程
  • 启用reasoning了解推理逻辑
  • 对比不同级别的输出质量
提示
思考级别是平衡性能和质量的关键工具。根据任务复杂度动态调整思考级别,可以在保证质量的同时优化成本和响应时间。