由于微信限制了第三方应用的跳转,请使用以下方法。
1. 点击右上角的
2. 选择在浏览器中打开
文章转载来源: xiyu
作者:xiyu
想用 Claude Opus 4.6 但不想月底账单爆炸?这篇帮你砍掉 60-85% 成本。
你以为 token 只是"你说的话 + AI 回的话"?实际远不止。
每次对话的隐藏成本:
System Prompt(~3000-5000 tokens):OpenClaw 核心指令,改不了
上下文文件注入(~3000-14000 tokens):AGENTS.md、SOUL.md、MEMORY.md 等,每次对话都带上——这是最大的隐形开销
历史消息:越聊越长
你的输入 + AI 输出:这才是你以为的"全部"
一个简单的"今天天气怎么样",实际消耗 8000-15000 input tokens。用 Opus 算,光上下文就花 $0.12-0.22。
Cron 更狠:每次触发 = 全新对话 = 重新注入全部上下文。一个每 15 分钟跑的 cron,一天 96 次,Opus 下一天 $10-20。
Heartbeat 同理:本质也是对话调用,间隔越短越烧钱。
省钱第一大招,效果最猛。 Sonnet 定价约 Opus 的 1/5,80% 日常任务完全够用。
markdown
提示词:
请帮我把 OpenClaw 的默认模型改为 Claude Sonnet,
只在需要深度分析或创作时使用 Opus。
具体需要:
1) 默认模型设为 Sonnet
2) cron 任务默认用 Sonnet
3) 只有写作、深度分析类任务指定 Opus
Opus 场景:长文写作、复杂代码、多步推理、创意任务
Sonnet 场景:日常闲聊、简单问答、cron 检查、heartbeat、文件操作、翻译
实测:切换后月成本降 65%,体验几乎没差。
每次调用的"底噪"可能 3000-14000 tokens。精简注入文件是性价比最高的优化。
markdown
提示词:
帮我精简 OpenClaw 的上下文文件以节约 token。
具体包括:1) AGENTS.md 删掉不需要的部分(群聊规则、TTS、不用的功能),压缩到 800 tokens 以内
2) SOUL.md 精简为简洁要点,300-500 tokens
3) MEMORY.md 清理过期信息,控制在 2000 tokens 以内
4) 检查 workspaceFiles 配置,移除不必要的注入文件
经验法则:每减少 1000 tokens 注入,按每天 100 次调用 Opus 算,月省约 $45。
markdown
提示词:帮我优化 OpenClaw 的 cron 任务以节约 token。
请:
1) 列出所有 cron 任务及其频率和模型
2) 把所有非创作类任务降级为 Sonnet
3) 合并同时间段的任务(比如多个检查合为一个)
4) 降低不必要的高频率(系统检查从 10 分钟改为 30 分钟,版本检查从 3 次/天改为 1 次/天)
5) 配置 delivery 为按需通知,正常时不发消息
核心原则:不是越频繁越好,大多数"实时"需求是假需求。合并 5 个独立检查为 1 次调用,省 75% 上下文注入成本。
markdown
提示词:帮我优化 OpenClaw heartbeat 配置:
1) 工作时间间隔设为 45-60 分钟
2) 深夜 23:00-08:00 设为静默期
3) 精简 HEARTBEAT.md 到最少行数
4) 把分散的检查任务合并到 heartbeat 批量执行
agent 查资料时默认"读全文"——一个 500 行文件 3000-5000 tokens,但它只需要其中 10 行。90% 的 input token 被浪费了。
qmd 是本地语义检索工具,建立全文 + 向量索引,让 agent 精准定位段落而非读取整个文件。全部本地计算,零 API 成本。
配合 mq(Mini Query)使用:预览目录结构、精准段落提取、关键词搜索——每次只读需要的 10-30 行。
markdown
提示词:
帮我配置 qmd 知识库检索以节约 token。
Github地址:https://github.com/tobi/qmd
需要:
1) 安装 qmd
2) 为工作目录建立索引
3) 在 AGENTS.md 中添加检索规则,强制 agent 优先用 qmd/mq 搜索而非直接 read 全文
4) 设置定时更新索引
实测效果:每次查资料从 15000 tokens 降到 1500 tokens,减少 90%。
与 memorySearch 的区别:memorySearch 管"回忆"(MEMORY.md),qmd 管"查资料"(自定义知识库),互不影响。
markdown
提示词:帮我配置 OpenClaw 的 memorySearch。
如果我的记忆文件不多(几十个 md),
推荐用本地嵌入还是 Voyage AI?
请说明各自的成本和检索质量差异。
简单结论:记忆文件少用本地嵌入(零成本),多语言需求高或文件多用 Voyage AI(每账号 2 亿 token 免费)。
markdown
提示词:
请帮我一次性优化 OpenClaw 配置以最大限度节约 token,按以下清单执行:
默认模型改为 Sonnet,只保留创作/分析任务用 Opus
精简 AGENTS.md / SOUL.md / MEMORY.md
所有 cron 任务降级 Sonnet + 合并 + 降频
Heartbeat 间隔 45 分钟 + 深夜静默
配置 qmd 精准检索替代全文读取
workspaceFiles 只保留必要文件
记忆文件定期精简,MEMORY.md 控制 2000 tokens 以内
1. 模型分层 — Sonnet 日常,Opus 关键,省 60-80%
2. 上下文瘦身 — 精简文件 + qmd 精准检索,省 30-90% input token
3. 减少调用 — 合并 cron、拉长 heartbeat、开启静默期
Sonnet 4 已经很强了,日常用感觉不到差别。真正需要 Opus 的时候切过去就行。
基于 多 agent 系统实战经验,数据为脱敏估算值。
来源:xiyu
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com