OpenClawToken节约终极指南：用最强模型，花最少的钱/内含提示词

文章转载来源： xiyu

作者：xiyu

想用 Claude Opus 4.6 但不想月底账单爆炸？这篇帮你砍掉 60-85% 成本。

一、token花在哪？

你以为 token 只是"你说的话 + AI 回的话"？实际远不止。

每次对话的隐藏成本：

System Prompt（~3000-5000 tokens）：OpenClaw 核心指令，改不了
上下文文件注入（~3000-14000 tokens）：AGENTS.md、SOUL.md、MEMORY.md 等，每次对话都带上——这是最大的隐形开销
历史消息：越聊越长
你的输入 + AI 输出：这才是你以为的"全部"

一个简单的"今天天气怎么样"，实际消耗 8000-15000 input tokens。用 Opus 算，光上下文就花 $0.12-0.22。

Cron 更狠：每次触发 = 全新对话 = 重新注入全部上下文。一个每 15 分钟跑的 cron，一天 96 次，Opus 下一天 $10-20。

Heartbeat 同理：本质也是对话调用，间隔越短越烧钱。

二、模型分层：日常 Sonnet，关键 Opus

省钱第一大招，效果最猛。 Sonnet 定价约 Opus 的 1/5，80% 日常任务完全够用。

markdown

提示词：

请帮我把 OpenClaw 的默认模型改为 Claude Sonnet，

只在需要深度分析或创作时使用 Opus。

具体需要：

1) 默认模型设为 Sonnet

2) cron 任务默认用 Sonnet

3) 只有写作、深度分析类任务指定 Opus

Opus 场景：长文写作、复杂代码、多步推理、创意任务

Sonnet 场景：日常闲聊、简单问答、cron 检查、heartbeat、文件操作、翻译

实测：切换后月成本降 65%，体验几乎没差。

三、上下文瘦身：砍掉隐形 Token 大户

每次调用的"底噪"可能 3000-14000 tokens。精简注入文件是性价比最高的优化。

markdown

提示词：

帮我精简 OpenClaw 的上下文文件以节约 token。

具体包括：1) AGENTS.md 删掉不需要的部分（群聊规则、TTS、不用的功能），压缩到 800 tokens 以内

2) SOUL.md 精简为简洁要点，300-500 tokens

3) MEMORY.md 清理过期信息，控制在 2000 tokens 以内

4) 检查 workspaceFiles 配置，移除不必要的注入文件

经验法则：每减少 1000 tokens 注入，按每天 100 次调用 Opus 算，月省约 $45。

四、Cron 优化：最隐蔽的成本杀手

markdown

提示词：帮我优化 OpenClaw 的 cron 任务以节约 token。

请：

1) 列出所有 cron 任务及其频率和模型

2) 把所有非创作类任务降级为 Sonnet

3) 合并同时间段的任务（比如多个检查合为一个）

4) 降低不必要的高频率（系统检查从 10 分钟改为 30 分钟，版本检查从 3 次/天改为 1 次/天）

5) 配置 delivery 为按需通知，正常时不发消息

核心原则：不是越频繁越好，大多数"实时"需求是假需求。合并 5 个独立检查为 1 次调用，省 75% 上下文注入成本。

五、Heartbeat 优化

markdown

提示词：帮我优化 OpenClaw heartbeat 配置：

1) 工作时间间隔设为 45-60 分钟

2) 深夜 23:00-08:00 设为静默期

3) 精简 HEARTBEAT.md 到最少行数

4) 把分散的检查任务合并到 heartbeat 批量执行

六、精准检索：用 qmd 省 90% Input Token

agent 查资料时默认"读全文"——一个 500 行文件 3000-5000 tokens，但它只需要其中 10 行。90% 的 input token 被浪费了。

qmd 是本地语义检索工具，建立全文 + 向量索引，让 agent 精准定位段落而非读取整个文件。全部本地计算，零 API 成本。

配合 mq（Mini Query）使用：预览目录结构、精准段落提取、关键词搜索——每次只读需要的 10-30 行。

markdown

提示词：

帮我配置 qmd 知识库检索以节约 token。

Github地址：https://github.com/tobi/qmd

需要：

1) 安装 qmd

2) 为工作目录建立索引

3) 在 AGENTS.md 中添加检索规则，强制 agent 优先用 qmd/mq 搜索而非直接 read 全文

4) 设置定时更新索引

实测效果：每次查资料从 15000 tokens 降到 1500 tokens，减少 90%。

与 memorySearch 的区别：memorySearch 管"回忆"（MEMORY.md），qmd 管"查资料"（自定义知识库），互不影响。

七、Memory Search 选择

markdown

提示词：帮我配置 OpenClaw 的 memorySearch。

如果我的记忆文件不多（几十个 md），

推荐用本地嵌入还是 Voyage AI？

请说明各自的成本和检索质量差异。

简单结论：记忆文件少用本地嵌入（零成本），多语言需求高或文件多用 Voyage AI（每账号 2 亿 token 免费）。

八、终极配置清单

markdown

提示词：

请帮我一次性优化 OpenClaw 配置以最大限度节约 token，按以下清单执行：

默认模型改为 Sonnet，只保留创作/分析任务用 Opus

精简 AGENTS.md / SOUL.md / MEMORY.md

所有 cron 任务降级 Sonnet + 合并 + 降频

Heartbeat 间隔 45 分钟 + 深夜静默

配置 qmd 精准检索替代全文读取

workspaceFiles 只保留必要文件

记忆文件定期精简，MEMORY.md 控制 2000 tokens 以内

配置一次，长期受益：

1. 模型分层 — Sonnet 日常，Opus 关键，省 60-80%

2. 上下文瘦身 — 精简文件 + qmd 精准检索，省 30-90% input token

3. 减少调用 — 合并 cron、拉长 heartbeat、开启静默期

Sonnet 4 已经很强了，日常用感觉不到差别。真正需要 Opus 的时候切过去就行。

基于多 agent 系统实战经验，数据为脱敏估算值。

下载APP，阅读全文得现金

关键词：

来源：xiyu

发布人：暖色

声明：该文观点仅代表作者本人，不代表火讯财经立场。火讯财经系信息发布平台，仅提供信息存储空间服务。

如文章涉及侵权，请及时致函告之，本站将第⼀时间删除⽂章。邮箱：840034348@qq.com

上一篇：把流动性全交给用户：Backpack在加密西部的IPO豪赌

下一篇：李国飞：繁荣越令人沉醉，危机往往埋得越深|《1929》推荐序

OpenClawToken节约终极指南：用最强模型，花最少的钱/内含提示词

一、token花在哪？

二、模型分层：日常 Sonnet，关键 Opus

三、上下文瘦身：砍掉隐形 Token 大户

四、Cron 优化：最隐蔽的成本杀手

五、Heartbeat 优化

六、精准检索：用 qmd 省 90% Input Token

七、Memory Search 选择

八、终极配置清单

配置一次，长期受益：

新闻排行

RWA研究院携手Conflux，共探2026香港Web3嘉年华新范式

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

数字人民币2.0全景：从16.7万亿交易额之后的制度化跃迁

催生万亿新资产：AI代理如何拥有、赚取和交易

250亿美元RWA市场背后的政策红线：42号文的“境内严禁”到底划在哪？

GPT-5.4与百万token时代：上市公司的AI转型窗口还剩多久

美国资本重注拉美：赌的不是增长，是金融体系的"关键节点"

对话美财长ScottBessent，解构2026宏观迷雾下的“世界想象力”