init repo
This commit is contained in:
456
data-sources-research.md
Normal file
456
data-sources-research.md
Normal file
@@ -0,0 +1,456 @@
|
||||
# 咨询报告生成系统 - 数据源调研报告
|
||||
|
||||
> 调研日期: 2026-03-27
|
||||
> 目的: 为咨询报告自动生成系统选择可用的行业数据 API 和来源
|
||||
|
||||
---
|
||||
|
||||
## 一、免费/开放政府数据 API
|
||||
|
||||
### 1.1 国家统计局 (data.stats.gov.cn)
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 完全免费 |
|
||||
| **API 可用性** | 有非官方但稳定的 HTTP API |
|
||||
| **API 地址** | `https://data.stats.gov.cn/easyquery.htm` |
|
||||
| **请求方式** | POST / GET |
|
||||
| **数据格式** | JSON |
|
||||
| **数据覆盖** | 年度/季度/月度宏观经济数据,覆盖 GDP、CPI、PPI、工业产值、固定资产投资、社会消费品零售、进出口、人口、就业等全品类 |
|
||||
| **更新频率** | 月度/季度/年度同步发布 |
|
||||
|
||||
**API 关键参数:**
|
||||
```
|
||||
m=getTree / QueryData
|
||||
dbcode=hgnd(年度) / hgyd(月度) / hgjd(季度)
|
||||
rowcode=zb (指标)
|
||||
colcode=sj (时间) / reg (地区)
|
||||
wds=[] (查询条件 JSON)
|
||||
dfwds=[{"wdcode":"zb","valuecode":"A0101"}] (数据字段)
|
||||
```
|
||||
|
||||
**咨询报告实用度: ★★★★★**
|
||||
宏观经济数据的首选来源,权威且免费。缺点是没有正式 API 文档,接口可能变动。可通过 AKShare 库间接调用。
|
||||
|
||||
---
|
||||
|
||||
### 1.2 商务部公共服务资源平台
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 免费 |
|
||||
| **网址** | `http://opendata.mofcom.gov.cn/front/data` |
|
||||
| **数据覆盖** | 对外贸易、外商投资、国内贸易、商务预报、国别报告 |
|
||||
| **API 可用性** | 有开放数据接口,注册后可调用 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
外贸和商业分析类报告必备数据源。
|
||||
|
||||
---
|
||||
|
||||
### 1.3 中经数据 (国家信息中心)
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 数据流量付费模式(按调用量计费),价格未公开 |
|
||||
| **网址** | `https://ceidata.cei.cn/` |
|
||||
| **API 可用性** | 有正式 REST API,支持 Java / .NET / Python |
|
||||
| **数据覆盖** | 全国 + 31省 + 330+城市 + 2800+县 + 200+国家/地区的宏观经济时序数据 |
|
||||
| **更新频率** | 年/季/月/周/日多频率 |
|
||||
| **数据来源** | 国家部委、地方政府、国际组织的权威统计数据 |
|
||||
|
||||
**咨询报告实用度: ★★★★★**
|
||||
数据粒度和权威性极高,从国家到县级全覆盖。适合需要区域经济分析的咨询报告。价格需联系获取。
|
||||
|
||||
---
|
||||
|
||||
### 1.4 地方政府开放数据平台
|
||||
|
||||
| 平台 | 网址 | 数据规模 |
|
||||
|------|------|----------|
|
||||
| **上海市** | `https://data.sh.gov.cn/` | 45个部门、2101个数据集、646个数据接口 |
|
||||
| **深圳市** | `https://opendata.sz.gov.cn` | 114家单位、11,150个数据集、10,971个接口、59.86亿条数据 |
|
||||
| **北京市** | `https://data.beijing.gov.cn/` | 多部门、多品类 |
|
||||
| **全国 50+ 地市** | 各自平台 | 各有 API 接口,注册即可免费调用 |
|
||||
|
||||
**咨询报告实用度: ★★★**
|
||||
做区域性、城市级咨询报告时有用,但各平台接口标准不统一,集成成本较高。
|
||||
|
||||
---
|
||||
|
||||
### 1.5 海关总署统计数据查询平台
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 免费查询(有限制) |
|
||||
| **网址** | `http://stats.customs.gov.cn/` |
|
||||
| **数据覆盖** | 按 HS 编码、进出口收发货人、贸易伙伴、贸易方式等多维组合的进出口统计 |
|
||||
| **API 可用性** | 官方无正式 API,可通过网页接口解析获取 |
|
||||
|
||||
**第三方商业 API:** 腾道 (tendata.cn) 等提供海关数据 API,支持按产品/HS编码/国家/时间过滤。
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
进出口贸易分析类报告必用。官方免费版数据维度有限,深度分析需采购第三方。
|
||||
|
||||
---
|
||||
|
||||
## 二、国内商业金融/行业数据 API
|
||||
|
||||
### 2.1 Wind 万得
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | **金融终端:** 39,800元/年/席位(单买),批量采购可降至 24,540元/年 |
|
||||
| | **经济数据库:** 34,600元/年/席位 |
|
||||
| | **机构数据接口:** 5-20万/年(单用户),批量可降至 2-8万/年 |
|
||||
| **API 格式** | Client API (C++/C#/Java/Python),需安装 Wind 终端 |
|
||||
| **数据覆盖** | 全市场金融数据、宏观经济、行业数据、公司财务、ESG、资讯舆情、专题特色数据 |
|
||||
| **数据权威性** | 中国金融数据的"黄金标准",覆盖最全 |
|
||||
|
||||
**咨询报告实用度: ★★★★★**
|
||||
如果预算允许,这是最全面的中国金融和行业数据源。但价格昂贵,适合机构级使用。API 必须绑定 Wind 终端,无法纯云端调用。
|
||||
|
||||
---
|
||||
|
||||
### 2.2 同花顺 iFinD
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 8,800 - 28,000元/年/席位(远低于 Wind) |
|
||||
| **API 格式** | Python/Java/C++ 等语言 SDK |
|
||||
| **数据覆盖** | 股票、债券、外汇、期货、基金、REITs、宏观经济、企业数据库、研究报告 |
|
||||
| **适用对象** | 机构投资者和专业用户,需企业级账号 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
Wind 的性价比替代品。数据覆盖广泛,价格约为 Wind 的 1/3 到 1/2。
|
||||
|
||||
---
|
||||
|
||||
### 2.3 东方财富 Choice
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 官方定价 38,000元/年,**推广价 5,800元/年** |
|
||||
| **API 格式** | 函数调用方式,支持 Matlab/C++/C#/R/Python (Win/Linux/Mac) |
|
||||
| **数据覆盖** | 基本面、财务数据、行情数据、宏观经济 |
|
||||
| **API 文档** | `https://quantapi.eastmoney.com/Manual` |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
推广价 5,800元/年是三大金融终端中最便宜的,跨平台支持好。适合中小团队。
|
||||
|
||||
---
|
||||
|
||||
### 2.4 天眼查 开放平台
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 按次调用 + 套餐两种模式,具体价格需登录平台查看(典型范围: 0.1-2元/次,视接口而定) |
|
||||
| **API 地址** | `https://open.tianyancha.com/` |
|
||||
| **数据覆盖** | 企业基本信息、股东/股权、财务报表、法律诉讼、知识产权、经营异常、招投标等 |
|
||||
| **认证方式** | Token + RESTful API |
|
||||
| **免费额度** | 注册后有少量免费试用额度 |
|
||||
|
||||
**咨询报告实用度: ★★★★★**
|
||||
企业尽职调查、竞争格局分析类报告的核心数据源。覆盖全国企业工商信息。
|
||||
|
||||
---
|
||||
|
||||
### 2.5 企查查 开放平台
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 按次计费(价格未公开,需联系销售),新用户有 20次免费测试 |
|
||||
| **API 地址** | `https://openapi.qcc.com/` |
|
||||
| **数据覆盖** | 企业高级搜索、工商详情、专利查询、商标查询、经营风险 |
|
||||
| **计费方式** | 固定企业列表+按年计费(每企业每周期只收一次)或按次 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
与天眼查功能类似,二选一即可。企查查在某些企业关联数据上更全。
|
||||
|
||||
---
|
||||
|
||||
### 2.6 巨潮资讯 (cninfo.com.cn)
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 注册后 1000次免费调用;深证信平台有更多接口 |
|
||||
| **API 地址** | `http://webapi.cninfo.com.cn/` |
|
||||
| **公告查询** | `http://www.cninfo.com.cn/new/hisAnnouncement/query` |
|
||||
| **数据覆盖** | 上市公司公告全文、财务数据、基金、债券 |
|
||||
| **数据格式** | JSON |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
上市公司分析的权威一手来源。公告全文可用于 LLM 提取和分析。1000次免费额度足够初期使用。
|
||||
|
||||
---
|
||||
|
||||
## 三、免费开源 Python 数据库
|
||||
|
||||
### 3.1 AKShare (强烈推荐)
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | **完全免费开源** |
|
||||
| **安装** | `pip install akshare` |
|
||||
| **GitHub** | `https://github.com/akfamily/akshare` |
|
||||
| **文档** | `https://akshare.akfamily.xyz/` |
|
||||
| **数据覆盖** | **30+ 类金融产品**: A股/港股/美股行情、期货、期权、基金、债券、外汇、加密货币、**宏观经济指标**、**行业数据**、新闻舆情 |
|
||||
| **数据格式** | Pandas DataFrame |
|
||||
| **更新频率** | 持续更新(当前版本 1.18.47) |
|
||||
|
||||
**核心宏观经济数据接口示例:**
|
||||
```python
|
||||
import akshare as ak
|
||||
|
||||
# GDP 数据
|
||||
gdp = ak.macro_china_gdp()
|
||||
|
||||
# CPI 数据
|
||||
cpi = ak.macro_china_cpi_monthly()
|
||||
|
||||
# PMI 数据
|
||||
pmi = ak.macro_china_pmi()
|
||||
|
||||
# 行业利润数据
|
||||
profit = ak.macro_china_industrial_profit()
|
||||
|
||||
# 中国海关进出口
|
||||
trade = ak.macro_china_trade_balance()
|
||||
```
|
||||
|
||||
**咨询报告实用度: ★★★★★**
|
||||
**咨询报告系统的首选数据获取层。** 免费、覆盖广、接口统一、返回 DataFrame 直接可分析。作为国家统计局等公开数据的统一封装层,可替代大部分付费数据源的基础数据需求。
|
||||
|
||||
---
|
||||
|
||||
### 3.2 Tushare Pro
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 基础免费(积分制),高级接口需积分(约 500元一次性购买可获足够积分) |
|
||||
| **数据覆盖** | A 股行情、财务数据、基金、期货、宏观经济 |
|
||||
| **注意** | 2025年9月后部分接口调整,积分获取难度增加 |
|
||||
|
||||
**咨询报告实用度: ★★★**
|
||||
AKShare 的替代方案,但积分制有限制。推荐优先使用 AKShare。
|
||||
|
||||
---
|
||||
|
||||
### 3.3 Baostock
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 完全免费 |
|
||||
| **数据覆盖** | A 股历史行情、财务数据(较基础) |
|
||||
|
||||
**咨询报告实用度: ★★**
|
||||
数据覆盖面较窄,仅 A 股基础数据。不推荐作为主力数据源。
|
||||
|
||||
---
|
||||
|
||||
## 四、国际数据源 API
|
||||
|
||||
### 4.1 World Bank Open Data API
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | **完全免费** |
|
||||
| **API 地址** | `https://api.worldbank.org/v2/` |
|
||||
| **数据格式** | JSON / XML |
|
||||
| **数据覆盖** | 1,600+ 指标、217 个经济体、60+ 年历史数据 |
|
||||
| **中国数据** | GDP、人口、通胀、贸易、教育、卫生、环境等全方位 |
|
||||
| **更新频率** | 定期更新(最新至 2024年) |
|
||||
|
||||
**已验证可用的示例调用:**
|
||||
```
|
||||
GET https://api.worldbank.org/v2/country/CHN/indicator/NY.GDP.MKTP.CD?format=json&per_page=5
|
||||
```
|
||||
返回中国 GDP 时序数据(2024年: $18.74 万亿)。
|
||||
|
||||
**咨询报告实用度: ★★★★★**
|
||||
国际对比和宏观经济分析的标准数据源。免费、文档完善、数据权威。
|
||||
|
||||
---
|
||||
|
||||
### 4.2 IMF Data API
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | **完全免费** |
|
||||
| **API 地址** | `https://dataservices.imf.org/REST/SDMX_JSON.svc/` |
|
||||
| **数据覆盖** | International Financial Statistics (IFS)、Balance of Payments、Government Finance、Direction of Trade |
|
||||
| **WEO 数据库** | 半年更新(4月/10月),含未来 2年预测 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
宏观经济和国际金融分析。与 World Bank 互补。
|
||||
|
||||
---
|
||||
|
||||
### 4.3 Statista API
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | 基础免费;**Premium: $199-$1,299/月(年付)**;API 接入需企业级合同(价格需议) |
|
||||
| **API 地址** | `https://www.statista.com/api/v2/doc/` |
|
||||
| **数据覆盖** | 170+ 行业、150+ 国家、300万+ 统计数据 |
|
||||
| **数据特点** | 图表友好型统计数据、行业报告、消费者调查 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
行业分析图表和统计数据的优质来源。API 价格不透明,需要商务洽谈。免费版可获取有限数据。
|
||||
|
||||
---
|
||||
|
||||
### 4.4 CB Insights
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | **$50,000 - $265,000+/年**(无公开定价,需 demo) |
|
||||
| **API 可用性** | **无 API** |
|
||||
| **数据覆盖** | VC/PE 投融资、科技行业趋势、市场规模预测 |
|
||||
|
||||
**咨询报告实用度: ★★★**
|
||||
内容优质但极其昂贵且无 API。不适合自动化集成,只能手动引用报告。
|
||||
|
||||
---
|
||||
|
||||
### 4.5 PitchBook
|
||||
|
||||
| 项目 | 详情 |
|
||||
|------|------|
|
||||
| **费用** | $12,000+/年(单用户起步),大型机构 $50,000+/月 |
|
||||
| **API 可用性** | **有 API**,可提取 VC/PE/M&A 数据 |
|
||||
| **数据覆盖** | 全球私募市场、并购、风投交易数据 |
|
||||
|
||||
**咨询报告实用度: ★★★**
|
||||
投融资分析类报告有用,但价格高。有 API 这一点优于 CB Insights。
|
||||
|
||||
---
|
||||
|
||||
## 五、专业/垂直数据源
|
||||
|
||||
### 5.1 专利数据库 (知识产权数据)
|
||||
|
||||
| 平台 | 费用 | API | 特点 |
|
||||
|------|------|-----|------|
|
||||
| **CNIPA (国家知识产权局)** | 免费查询 | 有数据发布页,无正式 REST API | 官方权威,专利公告/统计 |
|
||||
| **CNIPR (知识产权出版社)** | 注册免费 + 增值付费 | `https://open.cnipr.com/` REST API | 专利检索、查询、统计、分析 |
|
||||
| **佰腾 (Baiten)** | 按次付费 | `https://open.baiten.cn/` | 法律状态、引用数据 |
|
||||
| **专利汇 (PatentHub)** | 免费+付费 | `https://www.patenthub.cn/api/` | 基本信息、权利要求、全文、引用、相似专利 |
|
||||
| **incoPat** | 商业授权 | 有 API | 全球专利数据库,分析功能强 |
|
||||
| **天眼查专利模块** | 集成在天眼查 API 中 | 同天眼查 | 企业专利关联查询 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
技术行业分析、竞争格局分析的重要数据维度。推荐 CNIPR 或 PatentHub。
|
||||
|
||||
---
|
||||
|
||||
### 5.2 海关/贸易数据
|
||||
|
||||
| 平台 | 费用 | 特点 |
|
||||
|------|------|------|
|
||||
| **海关总署官方** | 免费 | `stats.customs.gov.cn`,查询维度有限 |
|
||||
| **商务部数据中心** | 免费 | `data.mofcom.gov.cn`,进出口国别数据 |
|
||||
| **腾道 (Tendata)** | 商业付费 | 海关数据 API,支持按 HS 编码/产品/国家过滤 |
|
||||
| **UN Comtrade** | 免费 API | `https://comtrade.un.org/data/`,联合国全球贸易数据库 |
|
||||
|
||||
**咨询报告实用度: ★★★★**
|
||||
外贸和产业链分析报告核心数据源。
|
||||
|
||||
---
|
||||
|
||||
### 5.3 行业协会报告
|
||||
|
||||
| 来源 | 特点 | 费用 |
|
||||
|------|------|------|
|
||||
| **艾瑞咨询 (iResearch)** | 互联网/科技行业研究报告 | 部分免费,深度报告付费 |
|
||||
| **易观分析 (Analysys)** | 数字经济行业数据和报告 | 部分免费,会员制 |
|
||||
| **前瞻产业研究院** | 全行业覆盖的研究报告 | 单报告 ¥2,000-10,000+ |
|
||||
| **头豹研究院** | 新兴行业深度分析 | 会员制 |
|
||||
| **智研咨询** | 传统行业研究报告 | 单报告付费 |
|
||||
| **中国信通院 (CAICT)** | ICT 行业权威白皮书 | 大部分免费 |
|
||||
|
||||
**注意:** 这些来源通常无 API,需要手动获取 PDF/网页报告,然后由 LLM 提取和结构化。
|
||||
|
||||
---
|
||||
|
||||
## 六、推荐方案 (成本优先)
|
||||
|
||||
### 第一梯队: 免费核心数据层 (零成本)
|
||||
|
||||
| 用途 | 推荐工具 | 说明 |
|
||||
|------|----------|------|
|
||||
| 宏观经济数据 | **AKShare** (封装国家统计局等) | 一行代码获取 GDP/CPI/PMI/行业利润 |
|
||||
| 国际对比数据 | **World Bank API** | 免费、文档完善、217经济体 |
|
||||
| 国际金融数据 | **IMF API** | 免费,WEO 预测数据 |
|
||||
| 上市公司公告 | **巨潮资讯 API** | 1000次免费,公告全文 |
|
||||
| 全球贸易数据 | **UN Comtrade API** | 免费,全球进出口 |
|
||||
|
||||
**年成本: 0 元**
|
||||
可覆盖: 宏观经济分析、行业趋势、国际对比、上市公司基本面
|
||||
|
||||
---
|
||||
|
||||
### 第二梯队: 低成本增强层
|
||||
|
||||
| 用途 | 推荐工具 | 年费 |
|
||||
|------|----------|------|
|
||||
| 金融终端数据 | **东方财富 Choice** | ~5,800元/年(推广价) |
|
||||
| 企业信息 | **天眼查 API** | 按需充值,预估 2,000-10,000元/年 |
|
||||
| 行业报告 | **Statista 基础版** | ~$199/月 = ~17,000元/年 |
|
||||
|
||||
**年成本: ~25,000-33,000 元**
|
||||
新增覆盖: 深度财务数据、企业尽调、国际行业统计
|
||||
|
||||
---
|
||||
|
||||
### 第三梯队: 专业级全覆盖
|
||||
|
||||
| 用途 | 推荐工具 | 年费 |
|
||||
|------|----------|------|
|
||||
| 金融数据终端 | **Wind 万得** 或 **iFinD** | 10,000-40,000元/年 |
|
||||
| 专利分析 | **CNIPR / PatentHub** | 按需 |
|
||||
| 海关详细数据 | **腾道** | 商业议价 |
|
||||
|
||||
**年成本: 50,000+ 元**
|
||||
适合: 专业咨询公司级别使用
|
||||
|
||||
---
|
||||
|
||||
## 七、技术集成建议
|
||||
|
||||
对于咨询报告自动生成系统,推荐的数据获取架构:
|
||||
|
||||
```
|
||||
┌─────────────────────────────────────────┐
|
||||
│ 数据获取调度层 │
|
||||
│ (统一接口,缓存,频率控制,错误重试) │
|
||||
├─────────────┬───────────┬───────────────┤
|
||||
│ AKShare │ World Bank│ 巨潮资讯 │ ← 免费层
|
||||
│ (宏观+行业)│ (国际对比) │ (上市公司) │
|
||||
├─────────────┼───────────┼───────────────┤
|
||||
│ Choice API │ 天眼查API │ Statista │ ← 付费层(按需)
|
||||
│ (金融数据) │ (企业数据) │ (行业统计) │
|
||||
├─────────────┼───────────┼───────────────┤
|
||||
│ CNIPR │ 腾道 │ Wind/iFinD │ ← 专业层(高预算)
|
||||
│ (专利) │ (海关) │ (全数据) │
|
||||
└─────────────┴───────────┴───────────────┘
|
||||
│
|
||||
▼
|
||||
┌─────────────────────────────────────────┐
|
||||
│ 数据标准化 + 缓存层 │
|
||||
│ (DataFrame → 统一格式 → 本地缓存) │
|
||||
└─────────────────────────────────────────┘
|
||||
│
|
||||
▼
|
||||
┌─────────────────────────────────────────┐
|
||||
│ LLM 报告生成层 │
|
||||
│ (数据注入 → Prompt → 报告章节生成) │
|
||||
└─────────────────────────────────────────┘
|
||||
```
|
||||
|
||||
### 关键实现要点:
|
||||
1. **AKShare 优先**: 凡是 AKShare 能获取的数据,就不调付费接口
|
||||
2. **本地缓存**: 宏观数据月度更新,不需要每次实时拉取,缓存 30 天
|
||||
3. **降级策略**: 付费接口不可用时,自动降级到免费数据源
|
||||
4. **频率控制**: 国家统计局等公开接口需控制请求频率(建议 1-2秒/次)
|
||||
5. **数据标准化**: 不同来源数据统一为 DataFrame + 元数据(来源、时间、单位)格式
|
||||
Reference in New Issue
Block a user