ashare-market-data-fetcher
抓取并整理 A股市场数据。Use for: 获取 A股股票基础资料、交易日历、日线/分钟线/复权行情、停复牌、财务三表、财务指标、板块题材、资金流、公告与专业市场数据说明;当用户要求尽可能全面、详细、准确地获取 A股市场数据时使用。
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/alanwu2024/ashare-market-data-fetcherA股市场数据抓取技能
在用户要求 抓取 A股市场数据、核对行情/财务/公告、为研究或回测准备数据、解释不同数据源为何不一致,或者 尽量全面且准确地整理某只股票、某个板块或某个时间段的数据 时,使用此技能。
本技能的核心目标不是随便抓到一些数字,而是使用 分层数据源策略、明确字段口径和多源校验规则,产出可用于研究、复盘、回测和半自动交易辅助的数据结果。
核心原则
始终把准确性优先级放在抓取速度之前。对 A股数据,必须区分 官方口径、商业专业口径、开源聚合口径 与 网页抓取口径,不要把它们混为一谈。[1] [2] [3] [4]
默认采用如下优先级:
| 优先级 | 数据源层级 | 适用场景 | 使用原则 |
|---|---|---|---|
| P1 | 交易所官方 / 官方授权链路 | Level-2、逐笔、订单簿、交易制度、权威市场口径 | 只要用户追求“最准确”且涉及高等级实时数据,先说明官方或持牌链路的必要性 |
| P2 | 专业商业数据接口 | 高稳定性、机构级序列数据、基本面深度字段 | 当用户需要专业级质量且可接受付费时优先考虑 |
| P3 | AKShare | 历史行情、部分财务报表、交易日历、市场统计、板块题材、公告补充、回测研究 | 作为免费结构化与聚合数据主源 |
| P4 | 巨潮资讯 / 交易所公开页面 | 定期报告、公告、交易制度、市场统计与权威披露 | 作为免费权威补源 |
| P5 | 其他网页公开页面 | 无正式接口但需补全信息时 | 只能作为补救方案,必须标注口径与抓取时间 |
数据源定位
1. AKShare
优先将 AKShare 用于 股票基础资料、交易日历、日线、分钟线、复权相关行情、市场统计、板块题材、资金流、龙虎榜、公告补充 等免费可得的结构化与聚合数据。[1] [2]
当任务涉及下列目标时,优先想到 AKShare:
| 任务 | 默认主源 |
|---|---|
| 历史回测数据准备 | AKShare |
| 财报分析底稿 | AKShare + 巨潮资讯 |
| 股票清单、上市公司信息、交易日历 | AKShare |
| 复权价格与交易状态补充 | AKShare + 交易所公开披露 |
不要把 AKShare 当作最高权威口径。它更适合承担 免费主抓取层 与 广覆盖聚合层。
2. 巨潮资讯 / 交易所公开页面
优先将 巨潮资讯 用于 公告、定期报告、上市公司披露文件 的免费权威补充;将 上交所/深交所公开页面 用于 交易制度、市场统计、市场概览与权威披露 的交叉核验。[3] [4] [5]
当用户要求“尽量准确”且任务涉及财报、公告、交易制度或市场统计时,应主动用巨潮资讯或交易所公开页面做第二来源校验。
3. Choice / EMQuant
当用户追求更高稳定性、更多专业字段、机构化使用体验,且接受商业数据接口时,将 Choice 视为升级选项。官方手册明确说明其可通过函数调用提供 基本面、财务、序列数据,并支持多种语言环境。[6]
4. 交易所官方 / 官方授权链路
当用户要求 Level-2、逐笔、订单簿、盘口深度、最准确实时市场数据 时,先明确说明:上交所官方市场数据产品包括 Level-1 与 Level-2,Level-2 包含逐笔、委托、撤单、订单档位等更丰富信息,并通过授权分发链路提供。[5]
遇到这类需求时,不要假装免费公开源等价于官方链路。应明确指出授权、权限、费用和分发限制。
触发决策
按下面顺序判断任务类型:
- 如果用户要 某只股票的基础资料、历史行情、财务三表、停复牌、复权,走“结构化主数据工作流”。
- 如果用户要 板块、题材、资金流、龙虎榜、公告、新闻或情绪信息,走“市场扩展信息工作流”。
- 如果用户要 分钟级、逐笔、Level-2、盘口、订单簿,先走“高精度实时数据说明工作流”,优先解释权限边界,再决定能否继续抓取。
- 如果用户要 为回测、选股、研究报告准备一组可复用字段,走“研究数据集工作流”。
- 如果用户明确说“要最准确”,必须主动补充 数据源优先级、字段口径、抓取时间和交叉校验。
工作流总览
按以下顺序执行,不要跳步:
- 识别数据对象与范围。
- 明确时间范围、频率和复权口径。
- 为每类字段选择主源与补源。
- 先抓结构化核心数据,再抓扩展信息。
- 对关键字段做交叉校验。
- 输出时强制声明来源、时间和口径。
- 若存在冲突或缺失,显式标注“待校验”或“数据不可得”。
第一步:识别对象与范围
先把任务拆成下面四个维度,并在内部明确:
| 维度 | 需要确认的内容 |
|---|---|
| 标的范围 | 单只股票、股票列表、板块、指数、全市场 |
| 时间范围 | 最新、当日、近 5 日、近 1 年、指定区间 |
| 数据频率 | 静态资料、日频、分钟频、Tick、Level-2 |
| 数据类型 | 行情、财务、公告、资金流、题材、交易状态、市场统计 |
如果用户没有说清楚,优先用当前任务上下文推断;实在无法推断时再询问最小必要问题。
第二步:确定字段口径
对行情类请求,必须先在内部确定以下口径:
| 字段 | 必须明确的口径 |
|---|---|
| 价格 | 前复权 / 后复权 / 不复权 |
| 时间粒度 | 日线 / 1 分钟 / 5 分钟 / Tick |
| 成交量 | 股数、手数或接口默认单位 |
| 成交额 | 元、万元、亿元或接口默认单位 |
| 涨跌幅 | 相对昨收还是相对复权基准 |
| 财报期间 | 单季度、累计值、TTM、年报、半年报 |
如果用户没有指定复权方式,默认优先提供 不复权 + 说明可切换复权口径;若任务用于回测,可额外提供前复权版本。
第三步:选择数据源
遵循下表,不要随意切换主源:
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-alanwu2024-ashare-market-data-fetcher": {
"enabled": true,
"auto_update": true
}
}
}