init repo

This commit is contained in:
2026-04-25 19:25:22 +08:00
commit c7533eada2
50 changed files with 3732 additions and 0 deletions

123
BRIEF.md Normal file
View File

@@ -0,0 +1,123 @@
# 咨询报告 AI 生成系统 — 项目简报
> 新窗口打开时,让 Claude 先读这个文件
## 项目定位
为咨询公司构建 **安全、可控** 的行业报告自动生成系统。
- 输入:客户需求 + 行业数据 + 报告模板
- 输出Word/PPT/Excel/PDF 格式的专业咨询报告
- 安全铁律:**客户数据绝不经过第三方**
## 架构灵感(来自 Open SWE
借鉴 Open SWE 的多 Agent 流水线,但从"写代码"改为"写报告"
```
用户输入(报告需求 + 数据)
├── Researcher Agent → 分析需求、检索资料、梳理框架
├── Writer Agent → 按模板撰写报告正文
├── Data Agent → 处理数据、生成图表、制作附录
├── Reviewer Agent → 检查质量、一致性、合规性
└── Formatter Agent → 排版输出 docx/pptx/xlsx/pdf
```
## 可用 Skills已有
| Skill | 路径 | 能力 |
|-------|------|------|
| docx | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/docx/` | Word 文档生成/编辑/批注 |
| pptx | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/pptx/` | PPT 演示文稿生成 |
| xlsx | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/xlsx/` | Excel 数据分析/图表/财务模型 |
| pdf | `~/Projects/code/20260119-skills合集/anthropics_skills/skills/pdf/` | PDF 生成/合并 |
## Open SWE 安全审查结论(避坑清单)
从 Open SWE 代码审查中得出的教训,本项目必须避免:
| Open SWE 的问题 | 本项目的对策 |
|-----------------|-------------|
| 所有内容发送给第三方 LLM (Poe/OpenRouter) | 必须用有 DPA 的 API 或自建模型 |
| LangSmith 遥测发送完整执行数据 | 不用 LangSmith自建 tracing 或不 trace |
| fetch_url 无 SSRF 防护 | Agent 工具严格限制外网访问 |
| 本地沙箱 inherit_env 暴露密钥 | 隔离执行环境,最小化环境变量 |
| 无多租户隔离 | 每个客户项目独立隔离 |
## 需要用户提供的材料
### 必须提供(不然搭不了)
1. **报告模板** — 你们现在用的 Word/PPT 模板文件(至少 2-3 个不同类型)
2. **样例报告** — 之前交付过的成品报告脱敏后的2-3 份
3. **LLM 选择** — 用哪个模型?选项:
- Poe API现有但数据经过 Poe → 有泄露风险)
- 本地部署 LLM192.168.2.221 Linux 服务器,需要 GPU
- 有 DPA 的 API如 Azure OpenAI / AWS Bedrock
### 最好提供(能做更好)
4. **行业数据源** — 你们通常从哪里获取行业数据?(数据库/网站/内部资料库)
5. **报告类型清单** — 你们做哪几种报告?(市场分析/竞品分析/尽职调查/投资备忘录...
6. **品牌规范** — 公司 logo、配色、字体规范用于排版
7. **审批流程** — 报告生成后谁审核?需要什么审批机制?
### 可选
8. **客户列表结构** — 多租户需要支持多少客户?权限怎么分?
9. **部署偏好** — 部署在 VPS (76.13.31.179) 还是本地服务器 (192.168.2.221)
## 技术方案初步思路
```
┌─────────────────────────────────────────────┐
│ Web UI后续做
│ 用户输入需求 / 上传数据 / 下载报告 │
└──────────────────┬──────────────────────────┘
┌──────────────────▼──────────────────────────┐
│ 调度引擎 (Python/FastAPI) │
│ 接收任务 → 编排 Agent → 输出报告 │
│ - 多租户隔离 │
│ - 任务队列 │
│ - 模板管理 │
└──────────────────┬──────────────────────────┘
┌─────────────┼─────────────┐
▼ ▼ ▼
┌─────────┐ ┌──────────┐ ┌──────────┐
│Researcher│ │ Writer │ │ Data │
│ Agent │ │ Agent │ │ Agent │
│ 检索分析 │ │ 撰写正文 │ │ 图表数据 │
└────┬─────┘ └────┬─────┘ └────┬─────┘
└─────────────┼─────────────┘
┌─────────────────┐
│ Reviewer Agent │
│ 质量审查 │
└────────┬────────┘
┌─────────────────┐
│ Formatter Agent │
│ docx/pptx/pdf │
│ (用现有 Skills) │
└─────────────────┘
```
## 相关项目参考
- Open SWE 源码:`~/Projects/research/20260327-open-swe/source/`
- Open SWE 安全审查:在本项目创建对话中完成
- Skills 合集:`~/Projects/code/20260119-skills合集/`
- GPT Researcher MCP已配置在 `~/.claude.json`(可用于资料检索)
## 状态
- [x] 需求明确:咨询公司内部效率工具 + 客户增值服务
- [x] 安全需求明确:客户数据不得外泄
- [x] 可用 Skills 盘点完成
- [ ] **等待用户提供:报告模板 + 样例报告 + LLM 选择**
- [ ] 架构设计
- [ ] 开发
- [ ] 部署