拾海笔记 · 06 · 我为什么放弃 1.4GB 的龙虾,做了个 67MB 的棱镜
快两周没写了。
这段时间我几乎没怎么离开电脑。帮几个朋友远程部署、自己一轮轮试用、修问题、改结构,也在 X 上和一些海外开发者来回交流 QQ 桥接、本地运行、CLI 调度这些细节。很多东西,写出来只要几行字,真落到自己电脑上,就会变成无数个凌晨里的反复确认。也正是在这段时间里,我越来越清楚一件事:我真正想做的,不是再多讲一点 AI 的概念,而是把一个自己真的会每天用、也能递给身边朋友直接跑起来的东西,磨到足够顺手。
于是,Prism 出来了。
如果说除夕夜我第一次把 OpenClaw 跑起来时,那种感觉像是在"中文屋"门口看了一场代码烟花,那么这两个月真正把它用深以后,我感受到的就是另一种更现实的东西:震撼归震撼,真要天天靠它干活,问题一个都躲不过去。
三个躲不开的问题
第一个问题是 token 消耗。OpenClaw 的上下文管理更接近一种"全量注入"的思路。系统信息、记忆、技能、通道配置,很多内容会在对话中持续被带进去。这样做的好处,是 AI 对全局状态掌握得很完整;坏处也很直接——烧 token。几轮稍微深入一点的对话下来,成本就会迅速往上走。对用付费 API 的人来说,这是真金白银;对用免费模型或额度模型的人来说,聊着聊着突然见顶,是一种很影响体验的挫败感。它不是偶发故障,而是架构选择本身带来的代价。
第二个问题,是它会自己把自己修崩。OpenClaw 的自动修复和自更新设计,初衷当然是好的,站在开源生态里看也完全合理。但在我实际使用里,确实遇到过几次后台自己动完手之后,服务直接掉掉去,需要重新排查和恢复。任何系统都会有 bug,这没什么可抱怨的。真正让人不舒服的是那种不确定性:你不知道它什么时候会动、动了哪一层、会不会影响当前正在跑的能力。对于一个只是想在 QQ 里稳定地和电脑"对话"的人来说,这种不可预期,比单纯报一个错更烦。
第三个问题,是它太大,也太完整了。安装完成之后,node_modules 就有 1.4GB。本地推理相关依赖、各种平台 SDK、层层配置项,都是它作为一个成熟开源生态合理的一部分。问题不在"它为什么这么设计",而在于我的真实场景根本不需要那么多。我不是想搭一个全球化、多平台、全武器库的 Agent 中心。我只是想让电脑在我不坐在它面前的时候,还能替我干一些事。功能更强,不等于更能用。很多时候,真正能每天留下来的东西,恰恰是那个被你做过大量减法的版本。
所以后来我没有继续在 OpenClaw 上往外套壳,也没有试图把它改成另一个样子。我索性自己写了一个。
Prism 的四个决策
Prism 现在很小,首包 67MB。从 1.4GB 到 67MB,不是压缩出来的,是砍出来的。它不是一个"更大"的系统,只是我基于自己和身边朋友的真实使用场景,做出来的一个轻量实验品。到今天为止,我觉得它真正值得讲的,只有四点。
一、部署简单,步骤清晰
这点是最先被我反复确认的。因为我已经受够了"明明功能很强,但安装像闯关"这件事。Prism 的安装流程我尽量压到最直白:
- 解压安装包
- 双击
install.bat - 等待自动配置完成
- QQ 扫码登录
- 双击
start.bat启动服务
就这五步。
我不想把"能跑起来"建立在别人必须会命令行、会折腾环境变量、会解决依赖冲突的前提上。至少到目前为止,我发出去的几个版本,朋友们基本都能自己走完流程。对我来说,这才算真的跨过了一个坎:不是我电脑上能用,而是离开我以后,它还能被别人装起来。
二、记忆多级管理,不再全量注入
这是我做 Prism 最核心的原因之一。它不把所有东西一股脑塞进每一轮上下文里,而是把记忆做了分层:
- 当前对话需要的短期记忆
- 最近交流沉淀出来的中期摘要
- 更长期的画像和偏好
分别处理、按需调度。这样做最大的意义,不是为了说一个听起来高级的技术词,而是为了两件很实际的事:第一,对话能更深;第二,成本能更稳。
过去很多 AI 工具之所以最后沦为"偶尔玩一下",不是因为它们不聪明,而是因为它们太不经济。你一边用,一边总觉得表在狂转。那种感觉会把人从沉浸状态里拽出来。Prism 想解决的,就是这种"每聊几轮就心里发虚"的问题。
三、纯国内环境,不怕掉线
这一点对我很重要。因为它本来就是为"不在电脑前"的场景而生的。如果一个工具的前提是你每次都得守在电脑旁边,那它存在的意义就会迅速缩水。Prism 的 Kimi 版本走的是纯国内链路,从消息到推理,尽量不依赖代理,不把系统稳定性建立在一个随时可能波动的外部前提上。
QQ 本身就是我和很多朋友最自然的入口。我不需要再额外教育一遍"去哪个新平台发消息",也不需要每次切换到海外通讯工具里找它。对于一个每天都要用的东西来说,稳定在线比功能炫技重要得多。很多产品最后不是死在能力不够,而是死在"关键时刻不在"。
四、记忆可编辑,token 可计数
这两个功能听起来没什么戏剧性,但我自己反而很看重。AI 最大的问题之一,就是黑箱。它记住了什么,记偏了什么,一轮到底花了多少,你很多时候其实不确定,只能凭感觉。Prism 里我把这层东西尽量掀开一点:你可以看它记了什么,能改,也能删;每轮 token 消耗尽量透明显示。
我越来越觉得,AI 工具真正珍贵的,不只是聪明,而是可控。人一旦缺失可控感,再强的能力都会让人不安。尤其当你开始把它放进自己的日常工作流里时,这种感觉会更明显。
当然,Prism 现在还很早。它远远谈不上成熟,更谈不上"成品"。我自己在用的版本,其实还跑着一些更深的东西:更复杂的上下文调度、更贴近个人工作流的自动化能力、一些我还在反复验证的细节功能。这里面有些方向,等我确认足够稳了,会继续慢慢同步到 Prism 里。包括下一个我很可能继续折腾的方向,也会更靠近我的本职行业——空间、设计、决策、项目启动这些过去十五年我一直泡在里面的东西。只是那条线比纯数字工具慢得多,因为真实行业的问题,从来都不是写几句 prompt 就能穿透的。它牵扯物理约束、造价刚性、沟通链条、多方博弈,那是另一种密度。
但也正因为这样,这段时间我反而越来越能感受到一件让我很珍惜的事:价值感在回来。
过去的老领导、一起共事过的同事、老朋友、老客户,这段时间里有不少人主动来找我,不是寒暄,而是真的想让我帮他们看看 AI 到底能不能落进自己的业务里。有人想提升内容效率,有人想把信息流转理顺,有人只是很坦白地说一句:我有点跟不上了,你帮我看看。这些对话让我很有感触。因为我发现,自己真正被需要的地方,不是"会不会用某个新工具",而是能不能把混乱的信息、焦虑的预期和真实的问题重新整理成一条路。这个感觉,和我前几篇写"启动判断力"时其实是一脉相承的。只不过这次,它暂时长成了一个 67MB 的小东西。
谢谢
所以写到这里,我其实更想认真说一句谢谢。
谢谢这些愿意让我动手试、愿意把自己真实问题拿出来的人。谢谢过去那些一起打过仗的人,让我现在做很多判断时,脑子里不是抽象概念,而是一个个具体项目、一场场具体翻车和一次次具体救火。也谢谢 X & GitHub 上那些我从没见过面的开发者朋友,和整个 AI 领域里走在前面的先行者。如果没有 OpenClaw、NapCat、各种 CLI 工具、各种开源项目把路先蹚出来,我今天不可能这么快走到这里。Prism 不是在和 OpenClaw 对着干,它们甚至不在一个量级上。前者是我从自己场景里抠出来的一把小刀,后者是一整套完整而庞大的开源武器库。没有那只龙虾,我也不会想到要去做这个棱镜。
从半年多前的迷茫,到 3 个月前的毅然决然,再到今天把一个真正能跑起来的小实验摆到台面上,我越来越确定,自己现在更适合扮演的,不是一个评论者,也不是一个布道者,而是一个实践者。先做,先跑,先把自己扔进去,再回来把路上的感受写下来。
Prism 不是答案。它只是我这段时间交出来的一个阶段性回答。