AgentLimb 的架构重点不是“让插件能点网页”,而是让 AI 工具、本地服务、Chrome 扩展和用户会话之间有清楚的边界。
本地 bridge 负责接收工具调用、转发浏览器动作、返回可理解的页面状态。这样会话留在本机,AI 工具只拿到完成任务所需的结构化信息。
开发细节补充:这篇记录放在 AgentLimb 的产品日记里,不是为了把一个功能包装成故事,而是把“02 · 架构:本地 bridge 如何连接 AI 工具和浏览器”放回真实项目推进中看。它要同时回答三件事:用户为什么需要这个点,开发时哪些边界必须先定住,以及这个选择会怎样影响上架、推广和后续课程复盘。平台口径是 Chrome / MCP / 本地桥接,当前公开状态是 开源 / 本地优先 / AI 编程,所以文案不能脱离真实发布进度。
对应的 docs 线索主要来自 浏览器控制底座记录、本地 bridge 设计、MCP 接入说明、多账号运营流程复盘。公开页面不会照搬内部工作记录,而是把可公开、可学习、不会泄露私密路径和账号信息的事实整理出来。AgentLimb 的开发记录围绕真实 Chrome、用户已有账号会话、本地桥接和 muscle memory 展开,目标是让 AI 进入真实网页工作流。 它的关键不是点击按钮,而是把浏览器状态、DOM 探索、任务路径和二次复用做成可解释、可调度的本地能力。 多 profile、多窗口、多账号这些记录说明产品面向真实运营场景,而不是只在无登录沙盒里演示自动化。 安全边界始终围绕本地 127.0.0.1、用户确认和会话不上传展开,这决定了它不能做成粗暴云端代理。
从产品功能看,AgentLimb 关联的能力包括:一段提示词完成接入、复用 DOM 探索结果、真实 Chrome 会话、多账号并行控制。写这类日记时,不能只说“做了什么”,还要说明为什么先做这些、为什么暂时不做另一些。比如一个按钮、一个导入流程、一个本地模型开关或一段截图文案,放在代码里只是小改动,放在产品里却会影响用户理解、审核员复现和后续推广素材。
从工程推进看,这篇日记对应的检查点是:AI 自动化课程的技术锚点;可解释 MCP、本地 bridge、浏览器 session 和任务记忆。真实开发最容易失真的是中间过程,因为最后页面看起来只有一个结果,但实际会经历方案取舍、权限确认、素材准备、测试设备、审核备注和发布节奏。把这些过程写下来,后面做同类产品时才不会重新踩同一个坑。
从隐私和合规看,当前约束是:Bridge 运行在本地 127.0.0.1,浏览器会话和 muscle 文件保留在用户自己的机器上。这类信息必须前置到开发日记里,因为独立产品的可信度不是靠口号建立的,而是靠数据在哪里处理、用户能不能退出、功能是否离线可用、商店页怎么承诺、隐私政策是否与实现一致这些小事实积累出来的。
从课程和复用看,这篇内容可以沉淀到 浏览器自动化、MCP 工具链、多账号运营、AI 操作真实网页。它的价值不只是给访问者看一个产品,而是展示一个独立开发者怎样把想法转成可验证的产品:先收窄场景,再选技术路径,再做体验最小闭环,最后把审核、推广、运营数据和失败教训都纳入下一次迭代。
浏览器自动化产品要沉淀路径记忆和验收机制,而不是只追求单次任务跑通。 这也是为什么每篇产品日记都要写到足够长:不是为了凑字数,而是为了把“证据、决策、实现、边界、复盘”都放在同一页,让读者看到一个判断是怎样被逐步验证出来的。最难的是让 AI 足够会操作网页,同时又不越过账号、权限和敏感动作的边界。
所以这篇日记的结论不是“功能已经写完”,而是把一个阶段的判断公开化:哪些证据足够支撑继续推进,哪些资料还需要回到源码、商店材料、公开文案或运营观察里补齐。这样的记录会比单纯的发布公告更慢,但也更真实,能让产品页、发布记录和课程内容保持同一条事实线。
验收时我会把它拆成四个层次:第一层是用户路径能不能走通,第二层是异常状态有没有被诚实处理,第三层是页面上的按钮、状态、截图和文案是否对应真实发布渠道,第四层是公开证据能否支撑这个判断。只要其中一层对不上,产品看起来再完整,也不能算真正进入下一个阶段。
交接时也要保留边界:源码、构建、测试、商店元数据、公开文案、平台反馈和运营观察分别保存原始资料。产品日记只把这些事实翻译成读者能理解的过程,不替任何私有记录保存原始材料。
把这些内容公开出来,还有一个很现实的原因:AI 教程如果只展示成功结果,很容易让人误以为产品是一次生成出来的。真实情况恰好相反,真正可学习的是一次次收窄、验证、失败、补证据和重新提交。日记越具体,后续读者越能看到判断的脉络,而不是只看到一个漂亮的截图。
为什么用本地服务做中间层
浏览器扩展天然在浏览器权限体系里,AI 编程工具天然在终端和项目里。中间层能把两边的协议解耦,让前端控制、任务状态和错误处理更容易维护。
MCP 让工具能力可注册
通过 MCP 暴露浏览器能力,可以让不同 AI 工具用同一种方式调用页面导航、元素读取、点击、输入和截图。它把一次性脚本变成可复用工具。
安全来自少暴露和可关闭
本地 bridge 应该默认只在本机工作,明确端口、明确授权、明确关闭方式。用户需要知道什么时候浏览器正在被 AI 使用,也能随时中断。