init repo

This commit is contained in:
2026-04-25 19:25:22 +08:00
commit c7533eada2
50 changed files with 3732 additions and 0 deletions

456
data-sources-research.md Normal file
View File

@@ -0,0 +1,456 @@
# 咨询报告生成系统 - 数据源调研报告
> 调研日期: 2026-03-27
> 目的: 为咨询报告自动生成系统选择可用的行业数据 API 和来源
---
## 一、免费/开放政府数据 API
### 1.1 国家统计局 (data.stats.gov.cn)
| 项目 | 详情 |
|------|------|
| **费用** | 完全免费 |
| **API 可用性** | 有非官方但稳定的 HTTP API |
| **API 地址** | `https://data.stats.gov.cn/easyquery.htm` |
| **请求方式** | POST / GET |
| **数据格式** | JSON |
| **数据覆盖** | 年度/季度/月度宏观经济数据,覆盖 GDP、CPI、PPI、工业产值、固定资产投资、社会消费品零售、进出口、人口、就业等全品类 |
| **更新频率** | 月度/季度/年度同步发布 |
**API 关键参数:**
```
m=getTree / QueryData
dbcode=hgnd(年度) / hgyd(月度) / hgjd(季度)
rowcode=zb (指标)
colcode=sj (时间) / reg (地区)
wds=[] (查询条件 JSON)
dfwds=[{"wdcode":"zb","valuecode":"A0101"}] (数据字段)
```
**咨询报告实用度: ★★★★★**
宏观经济数据的首选来源,权威且免费。缺点是没有正式 API 文档,接口可能变动。可通过 AKShare 库间接调用。
---
### 1.2 商务部公共服务资源平台
| 项目 | 详情 |
|------|------|
| **费用** | 免费 |
| **网址** | `http://opendata.mofcom.gov.cn/front/data` |
| **数据覆盖** | 对外贸易、外商投资、国内贸易、商务预报、国别报告 |
| **API 可用性** | 有开放数据接口,注册后可调用 |
**咨询报告实用度: ★★★★**
外贸和商业分析类报告必备数据源。
---
### 1.3 中经数据 (国家信息中心)
| 项目 | 详情 |
|------|------|
| **费用** | 数据流量付费模式(按调用量计费),价格未公开 |
| **网址** | `https://ceidata.cei.cn/` |
| **API 可用性** | 有正式 REST API支持 Java / .NET / Python |
| **数据覆盖** | 全国 + 31省 + 330+城市 + 2800+县 + 200+国家/地区的宏观经济时序数据 |
| **更新频率** | 年/季/月/周/日多频率 |
| **数据来源** | 国家部委、地方政府、国际组织的权威统计数据 |
**咨询报告实用度: ★★★★★**
数据粒度和权威性极高,从国家到县级全覆盖。适合需要区域经济分析的咨询报告。价格需联系获取。
---
### 1.4 地方政府开放数据平台
| 平台 | 网址 | 数据规模 |
|------|------|----------|
| **上海市** | `https://data.sh.gov.cn/` | 45个部门、2101个数据集、646个数据接口 |
| **深圳市** | `https://opendata.sz.gov.cn` | 114家单位、11,150个数据集、10,971个接口、59.86亿条数据 |
| **北京市** | `https://data.beijing.gov.cn/` | 多部门、多品类 |
| **全国 50+ 地市** | 各自平台 | 各有 API 接口,注册即可免费调用 |
**咨询报告实用度: ★★★**
做区域性、城市级咨询报告时有用,但各平台接口标准不统一,集成成本较高。
---
### 1.5 海关总署统计数据查询平台
| 项目 | 详情 |
|------|------|
| **费用** | 免费查询(有限制) |
| **网址** | `http://stats.customs.gov.cn/` |
| **数据覆盖** | 按 HS 编码、进出口收发货人、贸易伙伴、贸易方式等多维组合的进出口统计 |
| **API 可用性** | 官方无正式 API可通过网页接口解析获取 |
**第三方商业 API:** 腾道 (tendata.cn) 等提供海关数据 API支持按产品/HS编码/国家/时间过滤。
**咨询报告实用度: ★★★★**
进出口贸易分析类报告必用。官方免费版数据维度有限,深度分析需采购第三方。
---
## 二、国内商业金融/行业数据 API
### 2.1 Wind 万得
| 项目 | 详情 |
|------|------|
| **费用** | **金融终端:** 39,800元/年/席位(单买),批量采购可降至 24,540元/年 |
| | **经济数据库:** 34,600元/年/席位 |
| | **机构数据接口:** 5-20万/年(单用户),批量可降至 2-8万/年 |
| **API 格式** | Client API (C++/C#/Java/Python),需安装 Wind 终端 |
| **数据覆盖** | 全市场金融数据、宏观经济、行业数据、公司财务、ESG、资讯舆情、专题特色数据 |
| **数据权威性** | 中国金融数据的"黄金标准",覆盖最全 |
**咨询报告实用度: ★★★★★**
如果预算允许这是最全面的中国金融和行业数据源。但价格昂贵适合机构级使用。API 必须绑定 Wind 终端,无法纯云端调用。
---
### 2.2 同花顺 iFinD
| 项目 | 详情 |
|------|------|
| **费用** | 8,800 - 28,000元/年/席位(远低于 Wind |
| **API 格式** | Python/Java/C++ 等语言 SDK |
| **数据覆盖** | 股票、债券、外汇、期货、基金、REITs、宏观经济、企业数据库、研究报告 |
| **适用对象** | 机构投资者和专业用户,需企业级账号 |
**咨询报告实用度: ★★★★**
Wind 的性价比替代品。数据覆盖广泛,价格约为 Wind 的 1/3 到 1/2。
---
### 2.3 东方财富 Choice
| 项目 | 详情 |
|------|------|
| **费用** | 官方定价 38,000元/年,**推广价 5,800元/年** |
| **API 格式** | 函数调用方式,支持 Matlab/C++/C#/R/Python (Win/Linux/Mac) |
| **数据覆盖** | 基本面、财务数据、行情数据、宏观经济 |
| **API 文档** | `https://quantapi.eastmoney.com/Manual` |
**咨询报告实用度: ★★★★**
推广价 5,800元/年是三大金融终端中最便宜的,跨平台支持好。适合中小团队。
---
### 2.4 天眼查 开放平台
| 项目 | 详情 |
|------|------|
| **费用** | 按次调用 + 套餐两种模式,具体价格需登录平台查看(典型范围: 0.1-2元/次,视接口而定) |
| **API 地址** | `https://open.tianyancha.com/` |
| **数据覆盖** | 企业基本信息、股东/股权、财务报表、法律诉讼、知识产权、经营异常、招投标等 |
| **认证方式** | Token + RESTful API |
| **免费额度** | 注册后有少量免费试用额度 |
**咨询报告实用度: ★★★★★**
企业尽职调查、竞争格局分析类报告的核心数据源。覆盖全国企业工商信息。
---
### 2.5 企查查 开放平台
| 项目 | 详情 |
|------|------|
| **费用** | 按次计费(价格未公开,需联系销售),新用户有 20次免费测试 |
| **API 地址** | `https://openapi.qcc.com/` |
| **数据覆盖** | 企业高级搜索、工商详情、专利查询、商标查询、经营风险 |
| **计费方式** | 固定企业列表+按年计费(每企业每周期只收一次)或按次 |
**咨询报告实用度: ★★★★**
与天眼查功能类似,二选一即可。企查查在某些企业关联数据上更全。
---
### 2.6 巨潮资讯 (cninfo.com.cn)
| 项目 | 详情 |
|------|------|
| **费用** | 注册后 1000次免费调用深证信平台有更多接口 |
| **API 地址** | `http://webapi.cninfo.com.cn/` |
| **公告查询** | `http://www.cninfo.com.cn/new/hisAnnouncement/query` |
| **数据覆盖** | 上市公司公告全文、财务数据、基金、债券 |
| **数据格式** | JSON |
**咨询报告实用度: ★★★★**
上市公司分析的权威一手来源。公告全文可用于 LLM 提取和分析。1000次免费额度足够初期使用。
---
## 三、免费开源 Python 数据库
### 3.1 AKShare (强烈推荐)
| 项目 | 详情 |
|------|------|
| **费用** | **完全免费开源** |
| **安装** | `pip install akshare` |
| **GitHub** | `https://github.com/akfamily/akshare` |
| **文档** | `https://akshare.akfamily.xyz/` |
| **数据覆盖** | **30+ 类金融产品**: A股/港股/美股行情、期货、期权、基金、债券、外汇、加密货币、**宏观经济指标**、**行业数据**、新闻舆情 |
| **数据格式** | Pandas DataFrame |
| **更新频率** | 持续更新(当前版本 1.18.47 |
**核心宏观经济数据接口示例:**
```python
import akshare as ak
# GDP 数据
gdp = ak.macro_china_gdp()
# CPI 数据
cpi = ak.macro_china_cpi_monthly()
# PMI 数据
pmi = ak.macro_china_pmi()
# 行业利润数据
profit = ak.macro_china_industrial_profit()
# 中国海关进出口
trade = ak.macro_china_trade_balance()
```
**咨询报告实用度: ★★★★★**
**咨询报告系统的首选数据获取层。** 免费、覆盖广、接口统一、返回 DataFrame 直接可分析。作为国家统计局等公开数据的统一封装层,可替代大部分付费数据源的基础数据需求。
---
### 3.2 Tushare Pro
| 项目 | 详情 |
|------|------|
| **费用** | 基础免费(积分制),高级接口需积分(约 500元一次性购买可获足够积分 |
| **数据覆盖** | A 股行情、财务数据、基金、期货、宏观经济 |
| **注意** | 2025年9月后部分接口调整积分获取难度增加 |
**咨询报告实用度: ★★★**
AKShare 的替代方案,但积分制有限制。推荐优先使用 AKShare。
---
### 3.3 Baostock
| 项目 | 详情 |
|------|------|
| **费用** | 完全免费 |
| **数据覆盖** | A 股历史行情、财务数据(较基础) |
**咨询报告实用度: ★★**
数据覆盖面较窄,仅 A 股基础数据。不推荐作为主力数据源。
---
## 四、国际数据源 API
### 4.1 World Bank Open Data API
| 项目 | 详情 |
|------|------|
| **费用** | **完全免费** |
| **API 地址** | `https://api.worldbank.org/v2/` |
| **数据格式** | JSON / XML |
| **数据覆盖** | 1,600+ 指标、217 个经济体、60+ 年历史数据 |
| **中国数据** | GDP、人口、通胀、贸易、教育、卫生、环境等全方位 |
| **更新频率** | 定期更新(最新至 2024年 |
**已验证可用的示例调用:**
```
GET https://api.worldbank.org/v2/country/CHN/indicator/NY.GDP.MKTP.CD?format=json&per_page=5
```
返回中国 GDP 时序数据2024年: $18.74 万亿)。
**咨询报告实用度: ★★★★★**
国际对比和宏观经济分析的标准数据源。免费、文档完善、数据权威。
---
### 4.2 IMF Data API
| 项目 | 详情 |
|------|------|
| **费用** | **完全免费** |
| **API 地址** | `https://dataservices.imf.org/REST/SDMX_JSON.svc/` |
| **数据覆盖** | International Financial Statistics (IFS)、Balance of Payments、Government Finance、Direction of Trade |
| **WEO 数据库** | 半年更新4月/10月含未来 2年预测 |
**咨询报告实用度: ★★★★**
宏观经济和国际金融分析。与 World Bank 互补。
---
### 4.3 Statista API
| 项目 | 详情 |
|------|------|
| **费用** | 基础免费;**Premium: $199-$1,299/月(年付)**API 接入需企业级合同(价格需议) |
| **API 地址** | `https://www.statista.com/api/v2/doc/` |
| **数据覆盖** | 170+ 行业、150+ 国家、300万+ 统计数据 |
| **数据特点** | 图表友好型统计数据、行业报告、消费者调查 |
**咨询报告实用度: ★★★★**
行业分析图表和统计数据的优质来源。API 价格不透明,需要商务洽谈。免费版可获取有限数据。
---
### 4.4 CB Insights
| 项目 | 详情 |
|------|------|
| **费用** | **$50,000 - $265,000+/年**(无公开定价,需 demo |
| **API 可用性** | **无 API** |
| **数据覆盖** | VC/PE 投融资、科技行业趋势、市场规模预测 |
**咨询报告实用度: ★★★**
内容优质但极其昂贵且无 API。不适合自动化集成只能手动引用报告。
---
### 4.5 PitchBook
| 项目 | 详情 |
|------|------|
| **费用** | $12,000+/年(单用户起步),大型机构 $50,000+/月 |
| **API 可用性** | **有 API**,可提取 VC/PE/M&A 数据 |
| **数据覆盖** | 全球私募市场、并购、风投交易数据 |
**咨询报告实用度: ★★★**
投融资分析类报告有用,但价格高。有 API 这一点优于 CB Insights。
---
## 五、专业/垂直数据源
### 5.1 专利数据库 (知识产权数据)
| 平台 | 费用 | API | 特点 |
|------|------|-----|------|
| **CNIPA (国家知识产权局)** | 免费查询 | 有数据发布页,无正式 REST API | 官方权威,专利公告/统计 |
| **CNIPR (知识产权出版社)** | 注册免费 + 增值付费 | `https://open.cnipr.com/` REST API | 专利检索、查询、统计、分析 |
| **佰腾 (Baiten)** | 按次付费 | `https://open.baiten.cn/` | 法律状态、引用数据 |
| **专利汇 (PatentHub)** | 免费+付费 | `https://www.patenthub.cn/api/` | 基本信息、权利要求、全文、引用、相似专利 |
| **incoPat** | 商业授权 | 有 API | 全球专利数据库,分析功能强 |
| **天眼查专利模块** | 集成在天眼查 API 中 | 同天眼查 | 企业专利关联查询 |
**咨询报告实用度: ★★★★**
技术行业分析、竞争格局分析的重要数据维度。推荐 CNIPR 或 PatentHub。
---
### 5.2 海关/贸易数据
| 平台 | 费用 | 特点 |
|------|------|------|
| **海关总署官方** | 免费 | `stats.customs.gov.cn`,查询维度有限 |
| **商务部数据中心** | 免费 | `data.mofcom.gov.cn`,进出口国别数据 |
| **腾道 (Tendata)** | 商业付费 | 海关数据 API支持按 HS 编码/产品/国家过滤 |
| **UN Comtrade** | 免费 API | `https://comtrade.un.org/data/`,联合国全球贸易数据库 |
**咨询报告实用度: ★★★★**
外贸和产业链分析报告核心数据源。
---
### 5.3 行业协会报告
| 来源 | 特点 | 费用 |
|------|------|------|
| **艾瑞咨询 (iResearch)** | 互联网/科技行业研究报告 | 部分免费,深度报告付费 |
| **易观分析 (Analysys)** | 数字经济行业数据和报告 | 部分免费,会员制 |
| **前瞻产业研究院** | 全行业覆盖的研究报告 | 单报告 ¥2,000-10,000+ |
| **头豹研究院** | 新兴行业深度分析 | 会员制 |
| **智研咨询** | 传统行业研究报告 | 单报告付费 |
| **中国信通院 (CAICT)** | ICT 行业权威白皮书 | 大部分免费 |
**注意:** 这些来源通常无 API需要手动获取 PDF/网页报告,然后由 LLM 提取和结构化。
---
## 六、推荐方案 (成本优先)
### 第一梯队: 免费核心数据层 (零成本)
| 用途 | 推荐工具 | 说明 |
|------|----------|------|
| 宏观经济数据 | **AKShare** (封装国家统计局等) | 一行代码获取 GDP/CPI/PMI/行业利润 |
| 国际对比数据 | **World Bank API** | 免费、文档完善、217经济体 |
| 国际金融数据 | **IMF API** | 免费WEO 预测数据 |
| 上市公司公告 | **巨潮资讯 API** | 1000次免费公告全文 |
| 全球贸易数据 | **UN Comtrade API** | 免费,全球进出口 |
**年成本: 0 元**
可覆盖: 宏观经济分析、行业趋势、国际对比、上市公司基本面
---
### 第二梯队: 低成本增强层
| 用途 | 推荐工具 | 年费 |
|------|----------|------|
| 金融终端数据 | **东方财富 Choice** | ~5,800元/年(推广价) |
| 企业信息 | **天眼查 API** | 按需充值,预估 2,000-10,000元/年 |
| 行业报告 | **Statista 基础版** | ~$199/月 = ~17,000元/年 |
**年成本: ~25,000-33,000 元**
新增覆盖: 深度财务数据、企业尽调、国际行业统计
---
### 第三梯队: 专业级全覆盖
| 用途 | 推荐工具 | 年费 |
|------|----------|------|
| 金融数据终端 | **Wind 万得****iFinD** | 10,000-40,000元/年 |
| 专利分析 | **CNIPR / PatentHub** | 按需 |
| 海关详细数据 | **腾道** | 商业议价 |
**年成本: 50,000+ 元**
适合: 专业咨询公司级别使用
---
## 七、技术集成建议
对于咨询报告自动生成系统,推荐的数据获取架构:
```
┌─────────────────────────────────────────┐
│ 数据获取调度层 │
│ (统一接口,缓存,频率控制,错误重试) │
├─────────────┬───────────┬───────────────┤
│ AKShare │ World Bank│ 巨潮资讯 │ ← 免费层
│ (宏观+行业)│ (国际对比) │ (上市公司) │
├─────────────┼───────────┼───────────────┤
│ Choice API │ 天眼查API │ Statista │ ← 付费层(按需)
│ (金融数据) │ (企业数据) │ (行业统计) │
├─────────────┼───────────┼───────────────┤
│ CNIPR │ 腾道 │ Wind/iFinD │ ← 专业层(高预算)
│ (专利) │ (海关) │ (全数据) │
└─────────────┴───────────┴───────────────┘
┌─────────────────────────────────────────┐
│ 数据标准化 + 缓存层 │
│ (DataFrame → 统一格式 → 本地缓存) │
└─────────────────────────────────────────┘
┌─────────────────────────────────────────┐
│ LLM 报告生成层 │
│ (数据注入 → Prompt → 报告章节生成) │
└─────────────────────────────────────────┘
```
### 关键实现要点:
1. **AKShare 优先**: 凡是 AKShare 能获取的数据,就不调付费接口
2. **本地缓存**: 宏观数据月度更新,不需要每次实时拉取,缓存 30 天
3. **降级策略**: 付费接口不可用时,自动降级到免费数据源
4. **频率控制**: 国家统计局等公开接口需控制请求频率(建议 1-2秒/次)
5. **数据标准化**: 不同来源数据统一为 DataFrame + 元数据(来源、时间、单位)格式