A股市场数据抓取技能

在用户要求 抓取 A股市场数据、核对行情/财务/公告、为研究或回测准备数据、解释不同数据源为何不一致，或者 尽量全面且准确地整理某只股票、某个板块或某个时间段的数据 时，使用此技能。

本技能的核心目标不是随便抓到一些数字，而是使用 分层数据源策略、明确字段口径和多源校验规则，产出可用于研究、复盘、回测和半自动交易辅助的数据结果。

核心原则

始终把准确性优先级放在抓取速度之前。对 A股数据，必须区分 官方口径、商业专业口径、开源聚合口径 与 网页抓取口径，不要把它们混为一谈。[1] [2] [3] [4]

默认采用如下优先级：

优先级	数据源层级	适用场景	使用原则
P1	交易所官方 / 官方授权链路	Level-2、逐笔、订单簿、交易制度、权威市场口径	只要用户追求“最准确”且涉及高等级实时数据，先说明官方或持牌链路的必要性
P2	专业商业数据接口	高稳定性、机构级序列数据、基本面深度字段	当用户需要专业级质量且可接受付费时优先考虑
P3	AKShare	历史行情、部分财务报表、交易日历、市场统计、板块题材、公告补充、回测研究	作为免费结构化与聚合数据主源
P4	巨潮资讯 / 交易所公开页面	定期报告、公告、交易制度、市场统计与权威披露	作为免费权威补源
P5	其他网页公开页面	无正式接口但需补全信息时	只能作为补救方案，必须标注口径与抓取时间

数据源定位

1. AKShare

优先将 AKShare 用于 股票基础资料、交易日历、日线、分钟线、复权相关行情、市场统计、板块题材、资金流、龙虎榜、公告补充 等免费可得的结构化与聚合数据。[1] [2]

当任务涉及下列目标时，优先想到 AKShare：

任务	默认主源
历史回测数据准备	AKShare
财报分析底稿	AKShare + 巨潮资讯
股票清单、上市公司信息、交易日历	AKShare
复权价格与交易状态补充	AKShare + 交易所公开披露

不要把 AKShare 当作最高权威口径。它更适合承担 免费主抓取层 与 广覆盖聚合层。

2. 巨潮资讯 / 交易所公开页面

优先将 巨潮资讯 用于 公告、定期报告、上市公司披露文件 的免费权威补充；将 上交所/深交所公开页面 用于 交易制度、市场统计、市场概览与权威披露 的交叉核验。[3] [4] [5]

当用户要求“尽量准确”且任务涉及财报、公告、交易制度或市场统计时，应主动用巨潮资讯或交易所公开页面做第二来源校验。

3. Choice / EMQuant

当用户追求更高稳定性、更多专业字段、机构化使用体验，且接受商业数据接口时，将 Choice 视为升级选项。官方手册明确说明其可通过函数调用提供 基本面、财务、序列数据，并支持多种语言环境。[6]

4. 交易所官方 / 官方授权链路

当用户要求 Level-2、逐笔、订单簿、盘口深度、最准确实时市场数据 时，先明确说明：上交所官方市场数据产品包括 Level-1 与 Level-2，Level-2 包含逐笔、委托、撤单、订单档位等更丰富信息，并通过授权分发链路提供。[5]

遇到这类需求时，不要假装免费公开源等价于官方链路。应明确指出授权、权限、费用和分发限制。

触发决策

按下面顺序判断任务类型：

如果用户要 某只股票的基础资料、历史行情、财务三表、停复牌、复权，走“结构化主数据工作流”。
如果用户要 板块、题材、资金流、龙虎榜、公告、新闻或情绪信息，走“市场扩展信息工作流”。
如果用户要 分钟级、逐笔、Level-2、盘口、订单簿，先走“高精度实时数据说明工作流”，优先解释权限边界，再决定能否继续抓取。
如果用户要 为回测、选股、研究报告准备一组可复用字段，走“研究数据集工作流”。
如果用户明确说“要最准确”，必须主动补充 数据源优先级、字段口径、抓取时间和交叉校验。

工作流总览

按以下顺序执行，不要跳步：

识别数据对象与范围。
明确时间范围、频率和复权口径。
为每类字段选择主源与补源。
先抓结构化核心数据，再抓扩展信息。
对关键字段做交叉校验。
输出时强制声明来源、时间和口径。
若存在冲突或缺失，显式标注“待校验”或“数据不可得”。

第一步：识别对象与范围

先把任务拆成下面四个维度，并在内部明确：

维度	需要确认的内容
标的范围	单只股票、股票列表、板块、指数、全市场
时间范围	最新、当日、近 5 日、近 1 年、指定区间
数据频率	静态资料、日频、分钟频、Tick、Level-2
数据类型	行情、财务、公告、资金流、题材、交易状态、市场统计

如果用户没有说清楚，优先用当前任务上下文推断；实在无法推断时再询问最小必要问题。

第二步：确定字段口径

对行情类请求，必须先在内部确定以下口径：

字段	必须明确的口径
价格	前复权 / 后复权 / 不复权
时间粒度	日线 / 1 分钟 / 5 分钟 / Tick
成交量	股数、手数或接口默认单位
成交额	元、万元、亿元或接口默认单位
涨跌幅	相对昨收还是相对复权基准
财报期间	单季度、累计值、TTM、年报、半年报

如果用户没有指定复权方式，默认优先提供 不复权 + 说明可切换复权口径；若任务用于回测，可额外提供前复权版本。

第三步：选择数据源

遵循下表，不要随意切换主源：

ashare-market-data-fetcher

Install via CLI (Recommended)