
OpenClaw 用起来费 token 确实是个问题,如何省钱是大家很关心的一个话题。这个坑很大,需要分几期来讲。我完全是个人经验,大家如果有不同意见,欢迎在群里交流。
我感觉最大的坑是:你给 agent 一个任务,它执行有困难或出错时,就跑偏了,开始检测、尝试绕过等。你还在那里等它回复,token 却已经耗费在排查错误上了。
如果 token 都用在正常的任务上,我觉得该省省该花花。但如果都用来跑那些不是你本来要执行的任务,那不是浪费吗?
最重要的一点是,你想省钱就要少用 token,得做到心中有数,知道 token 都用在了什么地方。
经验一:关注 agent 在做什么。

/stop 结束它的思考。如果 /stop 没反应,就重启网关,执行命令 bash openclaw gateway restart。
有时候机器不说话,一直在后台重试。这个日志/步骤列表可能有几十步,全是没用的,完全是浪费 token。有时机器“神经错乱”了,一直在后台重试,你的费用一直在花,但一点实际作用也没有。
如果你能做到 token 都花在正经事上,那其实不费钱,这才是真正的省钱。如果 token 用在了莫名其妙的任务上,那就是浪费。
经验二:优化 md 文件。

USER.md:存储用户的个人信息、偏好设置、常用指令等,用于让 AI 更好地适应用户的习惯。TOOLS.md:定义 AI 可以调用的外部工具(如搜索引擎、代码执行器、API 接口等),包括工具的调用方式和参数说明。SOUL.md:保存 AI 的长期记忆和核心知识,相当于 AI 的“灵魂”,记录重要的上下文、用户关系和历史关键信息。IDENTITY.md:设定 AI 的身份、角色、性格特征、回答风格等,让 AI 在交互中保持一致的个性和定位。HEARTBEAT.md:用于监控 AI 的运行状态,可能包含健康检查、定时任务或心跳信号的配置,确保系统持续正常运作。BOOTSTRAP.md:启动引导文件,包含系统初始化设置、加载顺序、基础配置等,在 AI 启动时执行,确保环境准备就绪。AGENTS.md:定义多个专用代理(Agents)的配置,每个代理可能负责不同的领域或任务(如编程助手、翻译助手等),实现分工协作。
$ ./inspector.shAgent: workspace-Emailadmin | Token: 2042 | Status: NormalAgent: workspace-coder1 | Token: 1889 | Status: NormalAgent: workspace-duxiaozhong | Token: 5113 | Status: NormalAgent: workspace-hu-anzhuang | Token: 5555 | Status: NormalAgent: workspace-li-fourth | Token: 2628 | Status: NormalAgent: workspace-li-three | Token: 2321 | Status: NormalAgent: workspace-li-two | Token: 4285 | Status: NormalAgent: workspace-ssHuser | Token: 1985 | Status: NormalAgent: workspace-videobot | Token: 3782 | Status: NormalAgent: workspace-watchdog | Token: 756 | Status: NormalAgent: workspace-weixinbot | Token: 3782 | Status: NormalAgent: workspace-writer1 | Token: 441 | Status: NormalAgent: workspace-writer2 | Token: 456 | Status: NormalAgent: workspace-writer3 | Token: 443 | Status: NormalAgent: workspace-yibiancheng | Token: 2194 | Status: Normal
你看我自己做了一个报警,优化完了一个监控的agnet 只有700个token就足够了。

你看,我自己做了一个报警,优化完一个监控 agent 后,它只有 700 个 token,这就足够了。你可以参考一下,你的默认 token 太高,这就是需要优化的地方。这个 Python 程序公众号没有地方提供下载,需要的话在群里说一下,我发群里。
关于 md 文件的优化,各有各的方法,我只分享一点自己的经验。
我的 md 通用规则,另外还有别的规则,比如除了主 agent,别的 agent 只能回复其他 agent 发来的消息,不能主动发起。
# AGENTS.md -## 通用规则(Boss Commands)1. **会话长度提醒** — 与 Boss 对话超过 50 句,提醒开新会话2. **语言切换** — 与 Agent 对话用英文,与主人(Boss)对话用中文3. **简洁回复** — 工作时回 Boss 话,说重点,尽量简短
第 3 条,常常 agent 给我发很长一段,又浪费又没用,所以这需要优化。如果详细讲怎么优化,至少需要 5000 字,你可以自己查查 DeepSeek,它会教你的。
优化之后,你直接跟机器人说“你帮我监控一下 token 使用量”,它也可以做到。我写一个程序,让 agent 执行,把结果返回给我,你可以对比一下:监控设置为每五分钟一次,一天下来,对比一下费用,你就知道有什么不同了。
最后,省钱的办法就是:如果你是新手,可以先调用一些免费的模型进行调试。我自己用过这些,都是免费的:
Model Input Ctx Local Auth Tagsnvidia/moonshotai/kimi-k2.5 text 195k no yes fallback#1,configuredzai/GLM-4.7-Flash text 125k no yes fallback#1,configuredqwen-portal/coder-model text 125k no yes configured,alias:qwenqwen-portal/vision-model text+image 125k no yes configuredopenrouter/qwen/qwen3-vl-30b-a3b-thinking text+image 128k no yes configuredopenrouter/openrouter/free text 125k no yes configured、google/gemini-2.5-flash text+image 1024k no yes fallback#3,configuredgoogle/gemini-2.5-flash-lite text+image 1024k no yes fallback#4,configuredgoogle/gemini-1.5-flash text+image 977k no yes fallback#5,configured
国内的模型限速很厉害,我就不说哪家了,免得又有人找我麻烦。你自己可以去申请。
以上总结的几点,你要能做到,能省一半的费用。还有一些高级点的更省钱的办法。下次找机器会再说。














暂无评论内容