虾聊——省钱经验


OpenClaw 用起来费 token 确实是个问题,如何省钱是大家很关心的一个话题。这个坑很大,需要分几期来讲。我完全是个人经验,大家如果有不同意见,欢迎在群里交流。

我感觉最大的坑是:你给 agent 一个任务,它执行有困难或出错时,就跑偏了,开始检测、尝试绕过等。你还在那里等它回复,token 却已经耗费在排查错误上了。

如果 token 都用在正常的任务上,我觉得该省省该花花。但如果都用来跑那些不是你本来要执行的任务,那不是浪费吗?

最重要的一点是,你想省钱就要少用 token,得做到心中有数,知道 token 都用在了什么地方。


经验一:关注 agent 在做什么。


我跟它说一句话,比如“抓取 Google 新闻”,你可以在 
http://127.0.0.1:18789/ 这里看到它在做什么。如果机器人长时间没回复你,就去看看它在干什么,点这个地方。


比如,你看这个:我让机器人给我发一个文件,正常一条命令就能完成,但它执行命令出错,一直在测试,这就是浪费。这时你怎么做?在对话框里输入命令 /stop 结束它的思考。如果 /stop 没反应,就重启网关,执行命令 bash openclaw gateway restart


有时候机器不说话,一直在后台重试。这个日志/步骤列表可能有几十步,全是没用的,完全是浪费 token。有时机器“神经错乱”了,一直在后台重试,你的费用一直在花,但一点实际作用也没有。

如果你能做到 token 都花在正经事上,那其实不费钱,这才是真正的省钱。如果 token 用在了莫名其妙的任务上,那就是浪费。



经验二:优化 md 文件。




USER.md:存储用户的个人信息、偏好设置、常用指令等,用于让 AI 更好地适应用户的习惯。TOOLS.md:定义 AI 可以调用的外部工具(如搜索引擎、代码执行器、API 接口等),包括工具的调用方式和参数说明。SOUL.md:保存 AI 的长期记忆和核心知识,相当于 AI 的“灵魂”,记录重要的上下文、用户关系和历史关键信息。IDENTITY.md:设定 AI 的身份、角色、性格特征、回答风格等,让 AI 在交互中保持一致的个性和定位。HEARTBEAT.md:用于监控 AI 的运行状态,可能包含健康检查、定时任务或心跳信号的配置,确保系统持续正常运作。BOOTSTRAP.md:启动引导文件,包含系统初始化设置、加载顺序、基础配置等,在 AI 启动时执行,确保环境准备就绪。AGENTS.md:定义多个专用代理(Agents)的配置,每个代理可能负责不同的领域或任务(如编程助手、翻译助手等),实现分工协作。


这些文件默认很长,最少要 2000 token,有些不需要那么长,删除冗余,只写几句有用的就行。建议用英文编写;如果你用中文模型,用中文也行,但如果你用中文写,调用别的英文模型时可能会出现很多意想不到的问题。


$ ./inspector.shAgent: workspace-Emailadmin | Token: 2042 | Status: NormalAgent: workspace-coder1 | Token: 1889 | Status: NormalAgent: workspace-duxiaozhong | Token: 5113 | Status: NormalAgent: workspace-hu-anzhuang | Token: 5555 | Status: NormalAgent: workspace-li-fourth | Token: 2628 | Status: NormalAgent: workspace-li-three | Token: 2321 | Status: NormalAgent: workspace-li-two | Token: 4285 | Status: NormalAgent: workspace-ssHuser | Token: 1985 | Status: NormalAgent: workspace-videobot | Token: 3782 | Status: NormalAgent: workspace-watchdog | Token: 756 | Status: NormalAgent: workspace-weixinbot | Token: 3782 | Status: NormalAgent: workspace-writer1 | Token: 441 | Status: NormalAgent: workspace-writer2 | Token: 456 | Status: NormalAgent: workspace-writer3 | Token: 443 | Status: NormalAgent: workspace-yibiancheng | Token: 2194 | Status: Normal



你看我自己做了一个报警,优化完了一个监控的agnet 只有700个token就足够了。



你看,我自己做了一个报警,优化完一个监控 agent 后,它只有 700 个 token,这就足够了。你可以参考一下,你的默认 token 太高,这就是需要优化的地方。这个 Python 程序公众号没有地方提供下载,需要的话在群里说一下,我发群里。


关于 md 文件的优化,各有各的方法,我只分享一点自己的经验。


我的 md 通用规则,另外还有别的规则,比如除了主 agent,别的 agent 只能回复其他 agent 发来的消息,不能主动发起。


# AGENTS.md -## 通用规则(Boss Commands)1. **会话长度提醒** — 与 Boss 对话超过 50 句,提醒开新会话2. **语言切换** — 与 Agent 对话用英文,与主人(Boss)对话用中文3. **简洁回复** — 工作时回 Boss 话,说重点,尽量简短



第 3 条,常常 agent 给我发很长一段,又浪费又没用,所以这需要优化。如果详细讲怎么优化,至少需要 5000 字,你可以自己查查 DeepSeek,它会教你的。


优化之后,你直接跟机器人说“你帮我监控一下 token 使用量”,它也可以做到。我写一个程序,让 agent 执行,把结果返回给我,你可以对比一下:监控设置为每五分钟一次,一天下来,对比一下费用,你就知道有什么不同了。


最后,省钱的办法就是:如果你是新手,可以先调用一些免费的模型进行调试。我自己用过这些,都是免费的:


Model                                      Input      Ctx      Local Auth  Tagsnvidia/moonshotai/kimi-k2.5                text       195k     no    yes   fallback#1,configuredzai/GLM-4.7-Flash                          text       125k     no    yes   fallback#1,configuredqwen-portal/coder-model                    text       125k     no    yes   configured,alias:qwenqwen-portal/vision-model                   text+image 125k     no    yes   configuredopenrouter/qwen/qwen3-vl-30b-a3b-thinking  text+image 128k     no    yes   configuredopenrouter/openrouter/free                 text       125k     no    yes   configured、google/gemini-2.5-flash                    text+image 1024k    no    yes   fallback#3,configuredgoogle/gemini-2.5-flash-lite               text+image 1024k    no    yes   fallback#4,configuredgoogle/gemini-1.5-flash                    text+image 977k     no    yes   fallback#5,configured

国内的模型限速很厉害,我就不说哪家了,免得又有人找我麻烦。你自己可以去申请。


以上总结的几点,你要能做到,能省一半的费用。还有一些高级点的更省钱的办法。下次找机器会再说。




© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容