Files
20260327-c863ce53/data-sources-research.md
2026-04-25 19:25:22 +08:00

457 lines
18 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 咨询报告生成系统 - 数据源调研报告
> 调研日期: 2026-03-27
> 目的: 为咨询报告自动生成系统选择可用的行业数据 API 和来源
---
## 一、免费/开放政府数据 API
### 1.1 国家统计局 (data.stats.gov.cn)
| 项目 | 详情 |
|------|------|
| **费用** | 完全免费 |
| **API 可用性** | 有非官方但稳定的 HTTP API |
| **API 地址** | `https://data.stats.gov.cn/easyquery.htm` |
| **请求方式** | POST / GET |
| **数据格式** | JSON |
| **数据覆盖** | 年度/季度/月度宏观经济数据,覆盖 GDP、CPI、PPI、工业产值、固定资产投资、社会消费品零售、进出口、人口、就业等全品类 |
| **更新频率** | 月度/季度/年度同步发布 |
**API 关键参数:**
```
m=getTree / QueryData
dbcode=hgnd(年度) / hgyd(月度) / hgjd(季度)
rowcode=zb (指标)
colcode=sj (时间) / reg (地区)
wds=[] (查询条件 JSON)
dfwds=[{"wdcode":"zb","valuecode":"A0101"}] (数据字段)
```
**咨询报告实用度: ★★★★★**
宏观经济数据的首选来源,权威且免费。缺点是没有正式 API 文档,接口可能变动。可通过 AKShare 库间接调用。
---
### 1.2 商务部公共服务资源平台
| 项目 | 详情 |
|------|------|
| **费用** | 免费 |
| **网址** | `http://opendata.mofcom.gov.cn/front/data` |
| **数据覆盖** | 对外贸易、外商投资、国内贸易、商务预报、国别报告 |
| **API 可用性** | 有开放数据接口,注册后可调用 |
**咨询报告实用度: ★★★★**
外贸和商业分析类报告必备数据源。
---
### 1.3 中经数据 (国家信息中心)
| 项目 | 详情 |
|------|------|
| **费用** | 数据流量付费模式(按调用量计费),价格未公开 |
| **网址** | `https://ceidata.cei.cn/` |
| **API 可用性** | 有正式 REST API支持 Java / .NET / Python |
| **数据覆盖** | 全国 + 31省 + 330+城市 + 2800+县 + 200+国家/地区的宏观经济时序数据 |
| **更新频率** | 年/季/月/周/日多频率 |
| **数据来源** | 国家部委、地方政府、国际组织的权威统计数据 |
**咨询报告实用度: ★★★★★**
数据粒度和权威性极高,从国家到县级全覆盖。适合需要区域经济分析的咨询报告。价格需联系获取。
---
### 1.4 地方政府开放数据平台
| 平台 | 网址 | 数据规模 |
|------|------|----------|
| **上海市** | `https://data.sh.gov.cn/` | 45个部门、2101个数据集、646个数据接口 |
| **深圳市** | `https://opendata.sz.gov.cn` | 114家单位、11,150个数据集、10,971个接口、59.86亿条数据 |
| **北京市** | `https://data.beijing.gov.cn/` | 多部门、多品类 |
| **全国 50+ 地市** | 各自平台 | 各有 API 接口,注册即可免费调用 |
**咨询报告实用度: ★★★**
做区域性、城市级咨询报告时有用,但各平台接口标准不统一,集成成本较高。
---
### 1.5 海关总署统计数据查询平台
| 项目 | 详情 |
|------|------|
| **费用** | 免费查询(有限制) |
| **网址** | `http://stats.customs.gov.cn/` |
| **数据覆盖** | 按 HS 编码、进出口收发货人、贸易伙伴、贸易方式等多维组合的进出口统计 |
| **API 可用性** | 官方无正式 API可通过网页接口解析获取 |
**第三方商业 API:** 腾道 (tendata.cn) 等提供海关数据 API支持按产品/HS编码/国家/时间过滤。
**咨询报告实用度: ★★★★**
进出口贸易分析类报告必用。官方免费版数据维度有限,深度分析需采购第三方。
---
## 二、国内商业金融/行业数据 API
### 2.1 Wind 万得
| 项目 | 详情 |
|------|------|
| **费用** | **金融终端:** 39,800元/年/席位(单买),批量采购可降至 24,540元/年 |
| | **经济数据库:** 34,600元/年/席位 |
| | **机构数据接口:** 5-20万/年(单用户),批量可降至 2-8万/年 |
| **API 格式** | Client API (C++/C#/Java/Python),需安装 Wind 终端 |
| **数据覆盖** | 全市场金融数据、宏观经济、行业数据、公司财务、ESG、资讯舆情、专题特色数据 |
| **数据权威性** | 中国金融数据的"黄金标准",覆盖最全 |
**咨询报告实用度: ★★★★★**
如果预算允许这是最全面的中国金融和行业数据源。但价格昂贵适合机构级使用。API 必须绑定 Wind 终端,无法纯云端调用。
---
### 2.2 同花顺 iFinD
| 项目 | 详情 |
|------|------|
| **费用** | 8,800 - 28,000元/年/席位(远低于 Wind |
| **API 格式** | Python/Java/C++ 等语言 SDK |
| **数据覆盖** | 股票、债券、外汇、期货、基金、REITs、宏观经济、企业数据库、研究报告 |
| **适用对象** | 机构投资者和专业用户,需企业级账号 |
**咨询报告实用度: ★★★★**
Wind 的性价比替代品。数据覆盖广泛,价格约为 Wind 的 1/3 到 1/2。
---
### 2.3 东方财富 Choice
| 项目 | 详情 |
|------|------|
| **费用** | 官方定价 38,000元/年,**推广价 5,800元/年** |
| **API 格式** | 函数调用方式,支持 Matlab/C++/C#/R/Python (Win/Linux/Mac) |
| **数据覆盖** | 基本面、财务数据、行情数据、宏观经济 |
| **API 文档** | `https://quantapi.eastmoney.com/Manual` |
**咨询报告实用度: ★★★★**
推广价 5,800元/年是三大金融终端中最便宜的,跨平台支持好。适合中小团队。
---
### 2.4 天眼查 开放平台
| 项目 | 详情 |
|------|------|
| **费用** | 按次调用 + 套餐两种模式,具体价格需登录平台查看(典型范围: 0.1-2元/次,视接口而定) |
| **API 地址** | `https://open.tianyancha.com/` |
| **数据覆盖** | 企业基本信息、股东/股权、财务报表、法律诉讼、知识产权、经营异常、招投标等 |
| **认证方式** | Token + RESTful API |
| **免费额度** | 注册后有少量免费试用额度 |
**咨询报告实用度: ★★★★★**
企业尽职调查、竞争格局分析类报告的核心数据源。覆盖全国企业工商信息。
---
### 2.5 企查查 开放平台
| 项目 | 详情 |
|------|------|
| **费用** | 按次计费(价格未公开,需联系销售),新用户有 20次免费测试 |
| **API 地址** | `https://openapi.qcc.com/` |
| **数据覆盖** | 企业高级搜索、工商详情、专利查询、商标查询、经营风险 |
| **计费方式** | 固定企业列表+按年计费(每企业每周期只收一次)或按次 |
**咨询报告实用度: ★★★★**
与天眼查功能类似,二选一即可。企查查在某些企业关联数据上更全。
---
### 2.6 巨潮资讯 (cninfo.com.cn)
| 项目 | 详情 |
|------|------|
| **费用** | 注册后 1000次免费调用深证信平台有更多接口 |
| **API 地址** | `http://webapi.cninfo.com.cn/` |
| **公告查询** | `http://www.cninfo.com.cn/new/hisAnnouncement/query` |
| **数据覆盖** | 上市公司公告全文、财务数据、基金、债券 |
| **数据格式** | JSON |
**咨询报告实用度: ★★★★**
上市公司分析的权威一手来源。公告全文可用于 LLM 提取和分析。1000次免费额度足够初期使用。
---
## 三、免费开源 Python 数据库
### 3.1 AKShare (强烈推荐)
| 项目 | 详情 |
|------|------|
| **费用** | **完全免费开源** |
| **安装** | `pip install akshare` |
| **GitHub** | `https://github.com/akfamily/akshare` |
| **文档** | `https://akshare.akfamily.xyz/` |
| **数据覆盖** | **30+ 类金融产品**: A股/港股/美股行情、期货、期权、基金、债券、外汇、加密货币、**宏观经济指标**、**行业数据**、新闻舆情 |
| **数据格式** | Pandas DataFrame |
| **更新频率** | 持续更新(当前版本 1.18.47 |
**核心宏观经济数据接口示例:**
```python
import akshare as ak
# GDP 数据
gdp = ak.macro_china_gdp()
# CPI 数据
cpi = ak.macro_china_cpi_monthly()
# PMI 数据
pmi = ak.macro_china_pmi()
# 行业利润数据
profit = ak.macro_china_industrial_profit()
# 中国海关进出口
trade = ak.macro_china_trade_balance()
```
**咨询报告实用度: ★★★★★**
**咨询报告系统的首选数据获取层。** 免费、覆盖广、接口统一、返回 DataFrame 直接可分析。作为国家统计局等公开数据的统一封装层,可替代大部分付费数据源的基础数据需求。
---
### 3.2 Tushare Pro
| 项目 | 详情 |
|------|------|
| **费用** | 基础免费(积分制),高级接口需积分(约 500元一次性购买可获足够积分 |
| **数据覆盖** | A 股行情、财务数据、基金、期货、宏观经济 |
| **注意** | 2025年9月后部分接口调整积分获取难度增加 |
**咨询报告实用度: ★★★**
AKShare 的替代方案,但积分制有限制。推荐优先使用 AKShare。
---
### 3.3 Baostock
| 项目 | 详情 |
|------|------|
| **费用** | 完全免费 |
| **数据覆盖** | A 股历史行情、财务数据(较基础) |
**咨询报告实用度: ★★**
数据覆盖面较窄,仅 A 股基础数据。不推荐作为主力数据源。
---
## 四、国际数据源 API
### 4.1 World Bank Open Data API
| 项目 | 详情 |
|------|------|
| **费用** | **完全免费** |
| **API 地址** | `https://api.worldbank.org/v2/` |
| **数据格式** | JSON / XML |
| **数据覆盖** | 1,600+ 指标、217 个经济体、60+ 年历史数据 |
| **中国数据** | GDP、人口、通胀、贸易、教育、卫生、环境等全方位 |
| **更新频率** | 定期更新(最新至 2024年 |
**已验证可用的示例调用:**
```
GET https://api.worldbank.org/v2/country/CHN/indicator/NY.GDP.MKTP.CD?format=json&per_page=5
```
返回中国 GDP 时序数据2024年: $18.74 万亿)。
**咨询报告实用度: ★★★★★**
国际对比和宏观经济分析的标准数据源。免费、文档完善、数据权威。
---
### 4.2 IMF Data API
| 项目 | 详情 |
|------|------|
| **费用** | **完全免费** |
| **API 地址** | `https://dataservices.imf.org/REST/SDMX_JSON.svc/` |
| **数据覆盖** | International Financial Statistics (IFS)、Balance of Payments、Government Finance、Direction of Trade |
| **WEO 数据库** | 半年更新4月/10月含未来 2年预测 |
**咨询报告实用度: ★★★★**
宏观经济和国际金融分析。与 World Bank 互补。
---
### 4.3 Statista API
| 项目 | 详情 |
|------|------|
| **费用** | 基础免费;**Premium: $199-$1,299/月(年付)**API 接入需企业级合同(价格需议) |
| **API 地址** | `https://www.statista.com/api/v2/doc/` |
| **数据覆盖** | 170+ 行业、150+ 国家、300万+ 统计数据 |
| **数据特点** | 图表友好型统计数据、行业报告、消费者调查 |
**咨询报告实用度: ★★★★**
行业分析图表和统计数据的优质来源。API 价格不透明,需要商务洽谈。免费版可获取有限数据。
---
### 4.4 CB Insights
| 项目 | 详情 |
|------|------|
| **费用** | **$50,000 - $265,000+/年**(无公开定价,需 demo |
| **API 可用性** | **无 API** |
| **数据覆盖** | VC/PE 投融资、科技行业趋势、市场规模预测 |
**咨询报告实用度: ★★★**
内容优质但极其昂贵且无 API。不适合自动化集成只能手动引用报告。
---
### 4.5 PitchBook
| 项目 | 详情 |
|------|------|
| **费用** | $12,000+/年(单用户起步),大型机构 $50,000+/月 |
| **API 可用性** | **有 API**,可提取 VC/PE/M&A 数据 |
| **数据覆盖** | 全球私募市场、并购、风投交易数据 |
**咨询报告实用度: ★★★**
投融资分析类报告有用,但价格高。有 API 这一点优于 CB Insights。
---
## 五、专业/垂直数据源
### 5.1 专利数据库 (知识产权数据)
| 平台 | 费用 | API | 特点 |
|------|------|-----|------|
| **CNIPA (国家知识产权局)** | 免费查询 | 有数据发布页,无正式 REST API | 官方权威,专利公告/统计 |
| **CNIPR (知识产权出版社)** | 注册免费 + 增值付费 | `https://open.cnipr.com/` REST API | 专利检索、查询、统计、分析 |
| **佰腾 (Baiten)** | 按次付费 | `https://open.baiten.cn/` | 法律状态、引用数据 |
| **专利汇 (PatentHub)** | 免费+付费 | `https://www.patenthub.cn/api/` | 基本信息、权利要求、全文、引用、相似专利 |
| **incoPat** | 商业授权 | 有 API | 全球专利数据库,分析功能强 |
| **天眼查专利模块** | 集成在天眼查 API 中 | 同天眼查 | 企业专利关联查询 |
**咨询报告实用度: ★★★★**
技术行业分析、竞争格局分析的重要数据维度。推荐 CNIPR 或 PatentHub。
---
### 5.2 海关/贸易数据
| 平台 | 费用 | 特点 |
|------|------|------|
| **海关总署官方** | 免费 | `stats.customs.gov.cn`,查询维度有限 |
| **商务部数据中心** | 免费 | `data.mofcom.gov.cn`,进出口国别数据 |
| **腾道 (Tendata)** | 商业付费 | 海关数据 API支持按 HS 编码/产品/国家过滤 |
| **UN Comtrade** | 免费 API | `https://comtrade.un.org/data/`,联合国全球贸易数据库 |
**咨询报告实用度: ★★★★**
外贸和产业链分析报告核心数据源。
---
### 5.3 行业协会报告
| 来源 | 特点 | 费用 |
|------|------|------|
| **艾瑞咨询 (iResearch)** | 互联网/科技行业研究报告 | 部分免费,深度报告付费 |
| **易观分析 (Analysys)** | 数字经济行业数据和报告 | 部分免费,会员制 |
| **前瞻产业研究院** | 全行业覆盖的研究报告 | 单报告 ¥2,000-10,000+ |
| **头豹研究院** | 新兴行业深度分析 | 会员制 |
| **智研咨询** | 传统行业研究报告 | 单报告付费 |
| **中国信通院 (CAICT)** | ICT 行业权威白皮书 | 大部分免费 |
**注意:** 这些来源通常无 API需要手动获取 PDF/网页报告,然后由 LLM 提取和结构化。
---
## 六、推荐方案 (成本优先)
### 第一梯队: 免费核心数据层 (零成本)
| 用途 | 推荐工具 | 说明 |
|------|----------|------|
| 宏观经济数据 | **AKShare** (封装国家统计局等) | 一行代码获取 GDP/CPI/PMI/行业利润 |
| 国际对比数据 | **World Bank API** | 免费、文档完善、217经济体 |
| 国际金融数据 | **IMF API** | 免费WEO 预测数据 |
| 上市公司公告 | **巨潮资讯 API** | 1000次免费公告全文 |
| 全球贸易数据 | **UN Comtrade API** | 免费,全球进出口 |
**年成本: 0 元**
可覆盖: 宏观经济分析、行业趋势、国际对比、上市公司基本面
---
### 第二梯队: 低成本增强层
| 用途 | 推荐工具 | 年费 |
|------|----------|------|
| 金融终端数据 | **东方财富 Choice** | ~5,800元/年(推广价) |
| 企业信息 | **天眼查 API** | 按需充值,预估 2,000-10,000元/年 |
| 行业报告 | **Statista 基础版** | ~$199/月 = ~17,000元/年 |
**年成本: ~25,000-33,000 元**
新增覆盖: 深度财务数据、企业尽调、国际行业统计
---
### 第三梯队: 专业级全覆盖
| 用途 | 推荐工具 | 年费 |
|------|----------|------|
| 金融数据终端 | **Wind 万得****iFinD** | 10,000-40,000元/年 |
| 专利分析 | **CNIPR / PatentHub** | 按需 |
| 海关详细数据 | **腾道** | 商业议价 |
**年成本: 50,000+ 元**
适合: 专业咨询公司级别使用
---
## 七、技术集成建议
对于咨询报告自动生成系统,推荐的数据获取架构:
```
┌─────────────────────────────────────────┐
│ 数据获取调度层 │
│ (统一接口,缓存,频率控制,错误重试) │
├─────────────┬───────────┬───────────────┤
│ AKShare │ World Bank│ 巨潮资讯 │ ← 免费层
│ (宏观+行业)│ (国际对比) │ (上市公司) │
├─────────────┼───────────┼───────────────┤
│ Choice API │ 天眼查API │ Statista │ ← 付费层(按需)
│ (金融数据) │ (企业数据) │ (行业统计) │
├─────────────┼───────────┼───────────────┤
│ CNIPR │ 腾道 │ Wind/iFinD │ ← 专业层(高预算)
│ (专利) │ (海关) │ (全数据) │
└─────────────┴───────────┴───────────────┘
┌─────────────────────────────────────────┐
│ 数据标准化 + 缓存层 │
│ (DataFrame → 统一格式 → 本地缓存) │
└─────────────────────────────────────────┘
┌─────────────────────────────────────────┐
│ LLM 报告生成层 │
│ (数据注入 → Prompt → 报告章节生成) │
└─────────────────────────────────────────┘
```
### 关键实现要点:
1. **AKShare 优先**: 凡是 AKShare 能获取的数据,就不调付费接口
2. **本地缓存**: 宏观数据月度更新,不需要每次实时拉取,缓存 30 天
3. **降级策略**: 付费接口不可用时,自动降级到免费数据源
4. **频率控制**: 国家统计局等公开接口需控制请求频率(建议 1-2秒/次)
5. **数据标准化**: 不同来源数据统一为 DataFrame + 元数据(来源、时间、单位)格式