ShrimpChat省钱经验：避免token浪费

OpenClaw 用起来费 token 确实是个问题，如何省钱是大家很关心的一个话题。这个坑很大，需要分几期来讲。我完全是个人经验，大家如果有不同意见，欢迎在群里交流。

我感觉最大的坑是：你给 agent 一个任务，它执行有困难或出错时，就跑偏了，开始检测、尝试绕过等。你还在那里等它回复，token 却已经耗费在排查错误上了。

如果 token 都用在正常的任务上，我觉得该省省该花花。但如果都用来跑那些不是你本来要执行的任务，那不是浪费吗？

最重要的一点是，你想省钱就要少用 token，得做到心中有数，知道 token 都用在了什么地方。

经验一：关注 agent 在做什么。

我跟它说一句话，比如“抓取 Google 新闻”，你可以在

http://127.0.0.1:18789/ 这里看到它在做什么。如果机器人长时间没回复你，就去看看它在干什么，点这个地方。

比如，你看这个：我让机器人给我发一个文件，正常一条命令就能完成，但它执行命令出错，一直在测试，这就是浪费。这时你怎么做？在对话框里输入命令 /stop 结束它的思考。如果 /stop 没反应，就重启网关，执行命令 bash openclaw gateway restart。

有时候机器不说话，一直在后台重试。这个日志/步骤列表可能有几十步，全是没用的，完全是浪费 token。有时机器“神经错乱”了，一直在后台重试，你的费用一直在花，但一点实际作用也没有。

如果你能做到 token 都花在正经事上，那其实不费钱，这才是真正的省钱。如果 token 用在了莫名其妙的任务上，那就是浪费。

经验二：优化 md 文件。

USER.md：存储用户的个人信息、偏好设置、常用指令等，用于让 AI 更好地适应用户的习惯。TOOLS.md：定义 AI 可以调用的外部工具（如搜索引擎、代码执行器、API 接口等），包括工具的调用方式和参数说明。SOUL.md：保存 AI 的长期记忆和核心知识，相当于 AI 的“灵魂”，记录重要的上下文、用户关系和历史关键信息。IDENTITY.md：设定 AI 的身份、角色、性格特征、回答风格等，让 AI 在交互中保持一致的个性和定位。HEARTBEAT.md：用于监控 AI 的运行状态，可能包含健康检查、定时任务或心跳信号的配置，确保系统持续正常运作。BOOTSTRAP.md：启动引导文件，包含系统初始化设置、加载顺序、基础配置等，在 AI 启动时执行，确保环境准备就绪。AGENTS.md：定义多个专用代理（Agents）的配置，每个代理可能负责不同的领域或任务（如编程助手、翻译助手等），实现分工协作。

这些文件默认很长，最少要 2000 token，有些不需要那么长，删除冗余，只写几句有用的就行。建议用英文编写；如果你用中文模型，用中文也行，但如果你用中文写，调用别的英文模型时可能会出现很多意想不到的问题。

$ ./inspector.shAgent: workspace-Emailadmin | Token: 2042 | Status: NormalAgent: workspace-coder1 | Token: 1889 | Status: NormalAgent: workspace-duxiaozhong | Token: 5113 | Status: NormalAgent: workspace-hu-anzhuang | Token: 5555 | Status: NormalAgent: workspace-li-fourth | Token: 2628 | Status: NormalAgent: workspace-li-three | Token: 2321 | Status: NormalAgent: workspace-li-two | Token: 4285 | Status: NormalAgent: workspace-ssHuser | Token: 1985 | Status: NormalAgent: workspace-videobot | Token: 3782 | Status: NormalAgent: workspace-watchdog | Token: 756 | Status: NormalAgent: workspace-weixinbot | Token: 3782 | Status: NormalAgent: workspace-writer1 | Token: 441 | Status: NormalAgent: workspace-writer2 | Token: 456 | Status: NormalAgent: workspace-writer3 | Token: 443 | Status: NormalAgent: workspace-yibiancheng | Token: 2194 | Status: Normal

你看我自己做了一个报警，优化完了一个监控的agnet 只有700个token就足够了。

你看，我自己做了一个报警，优化完一个监控 agent 后，它只有 700 个 token，这就足够了。你可以参考一下，你的默认 token 太高，这就是需要优化的地方。这个 Python 程序公众号没有地方提供下载，需要的话在群里说一下，我发群里。

关于 md 文件的优化，各有各的方法，我只分享一点自己的经验。

我的 md 通用规则，另外还有别的规则，比如除了主 agent，别的 agent 只能回复其他 agent 发来的消息，不能主动发起。

# AGENTS.md -## 通用规则（Boss Commands）1. **会话长度提醒** — 与 Boss 对话超过 50 句，提醒开新会话2. **语言切换** — 与 Agent 对话用英文，与主人（Boss）对话用中文3. **简洁回复** — 工作时回 Boss 话，说重点，尽量简短

第 3 条，常常 agent 给我发很长一段，又浪费又没用，所以这需要优化。如果详细讲怎么优化，至少需要 5000 字，你可以自己查查 DeepSeek，它会教你的。

优化之后，你直接跟机器人说“你帮我监控一下 token 使用量”，它也可以做到。我写一个程序，让 agent 执行，把结果返回给我，你可以对比一下：监控设置为每五分钟一次，一天下来，对比一下费用，你就知道有什么不同了。

最后，省钱的办法就是：如果你是新手，可以先调用一些免费的模型进行调试。我自己用过这些，都是免费的：

Model                                      Input      Ctx      Local Auth  Tagsnvidia/moonshotai/kimi-k2.5                text       195k     no    yes   fallback#1,configuredzai/GLM-4.7-Flash                          text       125k     no    yes   fallback#1,configuredqwen-portal/coder-model                    text       125k     no    yes   configured,alias:qwenqwen-portal/vision-model                   text+image 125k     no    yes   configuredopenrouter/qwen/qwen3-vl-30b-a3b-thinking  text+image 128k     no    yes   configuredopenrouter/openrouter/free                 text       125k     no    yes   configured、google/gemini-2.5-flash                    text+image 1024k    no    yes   fallback#3,configuredgoogle/gemini-2.5-flash-lite               text+image 1024k    no    yes   fallback#4,configuredgoogle/gemini-1.5-flash                    text+image 977k     no    yes   fallback#5,configured