Claude Code 联网增强 Skill — 三层通道调度 + CDP 浏览器自动化 + 站点经验积累
SKILL.md 提供策略哲学 → AI 自主推理选通道 → CDP Proxy 通过 WebSocket 直连 Chrome
根据任务场景自动选择最优联网方式:
直连用户日常 Chrome,天然携带所有登录态。通过 HTTP API 提供:
多目标任务自动分发子 Agent 并行执行:
按域名存储操作经验,跨 session 复用:
从 DOM 直取图片/视频 URL,或对视频进行定点截帧分析:
追溯一手来源而非二手报道:
Proxy 监听 localhost:3456,通过 WebSocket 直连 Chrome DevTools Protocol,所有操作通过 curl 调用。
| 端点 | 方法 | 功能 |
|---|---|---|
/health | GET | 健康检查,返回连接状态 |
/targets | GET | 列出所有已打开的页面 Tab |
/new?url= | GET | 创建新后台 Tab(自动等待加载完成) |
/close?target= | GET | 关闭指定 Tab |
/navigate?target=&url= | GET | 在已有 Tab 中导航(自动等待加载) |
/back?target= | GET | 后退一页 |
/info?target= | GET | 获取页面 title / URL / readyState |
/eval?target= | POST | 执行任意 JS 表达式,支持 async |
/click?target= | POST | JS 层面点击(el.click()) |
/clickAt?target= | POST | CDP 真实鼠标事件(绕过反自动化) |
/setFiles?target= | POST | 文件上传(绕过文件对话框) |
/scroll?target=&y= | GET | 滚动页面(触发懒加载,等待 800ms) |
/screenshot?target=&file= | GET | 截图保存到文件或返回二进制 |
"Skill = 哲学 + 技术事实,不是操作手册。" 讲清 tradeoff 让 AI 自己选,不替它推理。
明确用户要做什么,定义成功标准:什么算完成?需要获取什么信息、达到什么结果?这是后续所有判断的锚点。
根据任务性质、平台特征,选最可能直达的方式作为第一步去验证。需要登录态/动态页面 → 直接 CDP。
每一步结果都是证据。对照成功标准更新判断。方向错了立即调整,不在同一方式上反复重试。
对照成功标准确认完成后才停止。不为了"完整"而浪费代价,也不因为"差不多"而提前放弃。
整个 CDP Proxy 仅使用 Node.js 原生模块:http、url、fs、net、os。
Node 22+ 的原生 WebSocket 替代了 ws 模块,做到真正零 npm install。
不需要用户手动指定端口。自动读取 DevToolsActivePort 文件获取端口和 WebSocket 路径,
支持 macOS / Linux / Windows 三平台。回退扫描 9222、9229、9333 常用端口。
启动时先用 TCP 探测端口是否被占用。若已有实例运行且健康(/health 返回 ok),静默退出。
避免多个 Proxy 实例冲突。
match-site.sh 读取用户输入,遍历 site-patterns/*.md 文件,
用域名 + aliases 做模式匹配,自动输出相关站点经验。跨会话积累,越用越聪明。
核心价值:一句话总结 — web-access 的不可替代优势是直连用户 Chrome 登录态。 其余能力(搜索、抓取、浏览器操作)在现有工具链中已有覆盖,web-access 做的是更聪明的调度 + 更省心的体验。