init repo

2026-04-25 19:25:22 +08:00
commit c7533eada2
50 changed files with 3732 additions and 0 deletions
--- a/BRIEF.md
+++ b/BRIEF.md
@@ -0,0 +1,123 @@
+# 咨询报告 AI 生成系统 — 项目简报
+
+> 新窗口打开时，让 Claude 先读这个文件
+
+## 项目定位
+
+为咨询公司构建 **安全、可控** 的行业报告自动生成系统。
+- 输入：客户需求 + 行业数据 + 报告模板
+- 输出：Word/PPT/Excel/PDF 格式的专业咨询报告
+- 安全铁律：**客户数据绝不经过第三方**
+
+## 架构灵感（来自 Open SWE）
+
+借鉴 Open SWE 的多 Agent 流水线，但从"写代码"改为"写报告"：
+
+```
+用户输入（报告需求 + 数据）
+    │
+    ├── Researcher Agent  → 分析需求、检索资料、梳理框架
+    │
+    ├── Writer Agent      → 按模板撰写报告正文
+    │
+    ├── Data Agent        → 处理数据、生成图表、制作附录
+    │
+    ├── Reviewer Agent    → 检查质量、一致性、合规性
+    │
+    └── Formatter Agent   → 排版输出 docx/pptx/xlsx/pdf
+```
+
+## 可用 Skills（已有）
+
+| Skill | 路径 | 能力 |
+|-------|------|------|
+| docx | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/docx/` | Word 文档生成/编辑/批注 |
+| pptx | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/pptx/` | PPT 演示文稿生成 |
+| xlsx | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/xlsx/` | Excel 数据分析/图表/财务模型 |
+| pdf  | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/pdf/`  | PDF 生成/合并 |
+
+## Open SWE 安全审查结论（避坑清单）
+
+从 Open SWE 代码审查中得出的教训，本项目必须避免：
+
+| Open SWE 的问题 | 本项目的对策 |
+|-----------------|-------------|
+| 所有内容发送给第三方 LLM (Poe/OpenRouter) | 必须用有 DPA 的 API 或自建模型 |
+| LangSmith 遥测发送完整执行数据 | 不用 LangSmith，自建 tracing 或不 trace |
+| fetch_url 无 SSRF 防护 | Agent 工具严格限制外网访问 |
+| 本地沙箱 inherit_env 暴露密钥 | 隔离执行环境，最小化环境变量 |
+| 无多租户隔离 | 每个客户项目独立隔离 |
+
+## 需要用户提供的材料
+
+### 必须提供（不然搭不了）
+1. **报告模板** — 你们现在用的 Word/PPT 模板文件（至少 2-3 个不同类型）
+2. **样例报告** — 之前交付过的成品报告（脱敏后的）2-3 份
+3. **LLM 选择** — 用哪个模型？选项：
+   - Poe API（现有，但数据经过 Poe → 有泄露风险）
+   - 本地部署 LLM（192.168.2.221 Linux 服务器，需要 GPU）
+   - 有 DPA 的 API（如 Azure OpenAI / AWS Bedrock）
+
+### 最好提供（能做更好）
+4. **行业数据源** — 你们通常从哪里获取行业数据？（数据库/网站/内部资料库）
+5. **报告类型清单** — 你们做哪几种报告？（市场分析/竞品分析/尽职调查/投资备忘录...）
+6. **品牌规范** — 公司 logo、配色、字体规范（用于排版）
+7. **审批流程** — 报告生成后谁审核？需要什么审批机制？
+
+### 可选
+8. **客户列表结构** — 多租户需要支持多少客户？权限怎么分？
+9. **部署偏好** — 部署在 VPS (76.13.31.179) 还是本地服务器 (192.168.2.221)？
+
+## 技术方案初步思路
+
+```
+┌─────────────────────────────────────────────┐
+│               Web UI（后续做）                │
+│         用户输入需求 / 上传数据 / 下载报告     │
+└──────────────────┬──────────────────────────┘
+                   │
+┌──────────────────▼──────────────────────────┐
+│            调度引擎 (Python/FastAPI)          │
+│   接收任务 → 编排 Agent → 输出报告           │
+│   - 多租户隔离                               │
+│   - 任务队列                                 │
+│   - 模板管理                                 │
+└──────────────────┬──────────────────────────┘
+                   │
+     ┌─────────────┼─────────────┐
+     ▼             ▼             ▼
+┌─────────┐ ┌──────────┐ ┌──────────┐
+│Researcher│ │  Writer  │ │  Data    │
+│  Agent   │ │  Agent   │ │  Agent   │
+│ 检索分析 │ │ 撰写正文 │ │ 图表数据 │
+└────┬─────┘ └────┬─────┘ └────┬─────┘
+     └─────────────┼─────────────┘
+                   ▼
+          ┌─────────────────┐
+          │  Reviewer Agent │
+          │   质量审查       │
+          └────────┬────────┘
+                   ▼
+          ┌─────────────────┐
+          │ Formatter Agent │
+          │ docx/pptx/pdf   │
+          │ (用现有 Skills)  │
+          └─────────────────┘
+```
+
+## 相关项目参考
+
+- Open SWE 源码：`~/Projects/research/20260327-open-swe/source/`
+- Open SWE 安全审查：在本项目创建对话中完成
+- Skills 合集：`~/Projects/code/20260119-skills合集/`
+- GPT Researcher MCP：已配置在 `~/.claude.json`（可用于资料检索）
+
+## 状态
+
+- [x] 需求明确：咨询公司内部效率工具 + 客户增值服务
+- [x] 安全需求明确：客户数据不得外泄
+- [x] 可用 Skills 盘点完成
+- [ ] **等待用户提供：报告模板 + 样例报告 + LLM 选择**
+- [ ] 架构设计
+- [ ] 开发
+- [ ] 部署