# 搜索总规则 - 智能行业判定系统 ## 1. 核心原则 - **语言优先级**:默认使用英文搜索,除非用户明确指定中国新闻 - **信息源优先级**:官方权威机构 > 头部媒体/自媒体 > 专业媒体 > 其他来源 - **行业自动识别**:通过关键词自动判定行业并调用相应搜索规则 ## 2. 行业判定关键词 ### 2.1 直接行业关键词 - **金融行业**:finance, banking, securities, investment, fintech, cryptocurrency, trading, markets - **制造业**:manufacturing, industry 4.0, automation, supply chain, production, factory, IoT - **AI与软件**:AI, machine learning, software, programming, algorithm, tech, startup, coding - **医疗制药**:healthcare, pharma, medicine, clinical trial, FDA, biotech, medical device - **快消品**:consumer goods, FMCG, brand, retail, marketing, packaging, CPG - **零售电商**:e-commerce, retail, online shopping, logistics, marketplace, digital commerce - **能源化工**:energy, oil, gas, renewable, chemical, petroleum, utilities, sustainability - **房地产建筑**:real estate, construction, property, housing, urban planning, architecture ### 2.2 特殊标识 - **中国特定**:当用户明确提及"中国"、"国内"、"A股"等,启用中文搜索 - **地区特定**:当提及特定国家/地区时,优先搜索该地区权威源 ## 3. 全球权威信息源库 ### 3.1 官方权威机构(各行业通用) - **美国政府**:gov, sec.gov, federalreserve.gov, fda.gov, treasury.gov - **国际组织**:imf.org, worldbank.org, who.int, bis.org, oecd.org - **监管机构**:按行业调用相应监管机构网站 ### 3.2 头部国际媒体 - **综合新闻**:reuters.com, bloomberg.com, ap.org, bbc.com, cnn.com - **财经媒体**:ft.com, wsj.com, economist.com, cnbc.com, marketwatch.com - **科技媒体**:techcrunch.com, wired.com, arstechnica.com, verge.com ### 3.3 头部自媒体/意见领袖(按行业分类) - **金融**:零对冲(zerohedge.com)、知名金融博主Twitter账号 - **科技**:Hacker News、知名技术博主、GitHub trending - **其他行业**:按各行业规则中的KOL列表 ## 4. 搜索执行流程 ### 4.1 简化搜索流程 ``` 用户输入 → 关键词提取 → 行业判定 → 语言判定(默认英文) → 调用行业规则 → 执行搜索 → 归档 ``` ### 4.2 文件命名标准 - **格式**:`YYYYMMDD_[行业]_[模块]_主题.docx` - **语言标注**:英文搜索无需特殊标注,中文搜索添加"_CN"后缀 ## 5. 行业规则调用 - **金融行业** → `金融行业/金融搜索规则.md` - **制造业** → `制造业/制造业搜索规则.md` - **AI与软件** → `AI与软件/AI软件搜索规则.md` - **医疗制药** → `医疗制药/医疗制药搜索规则.md` - **快消品** → `快消品/快消品搜索规则.md` - **零售电商** → `零售电商/零售电商搜索规则.md` - **能源化工** → `能源化工/能源化工搜索规则.md` - **房地产建筑** → `房地产建筑/房地产建筑搜索规则.md` ## 6. 质量控制 - **信息源验证**:优先使用权威官方源 - **时效性**:确保信息新鲜度 - **多源交叉验证**:重要信息需多源确认