kimi-datasource

name: kimi-datasource description: | Universal data-source assistant. Use this skill when the user wants external structured data such as stocks, financial reports, technical indicators, A-share/HK/US markets, global macroeconomics, Chinese enterprise registry information, arXiv papers, Google Scholar results, or Chinese laws/regulations and judicial cases. This plugin exposes tools via MCP server `plugin-kimi-datasource_data`; call them in the flow `mcp__plugin-kimi-datasource_data__get_data_source_desc` → `mcp__plugin-kimi-datasource_data__call_data_source_tool`.

kimi-datasource — 通用数据源助手

0. 调用方式

本 skill 使用 datasource MCP server 注册的两个工具，不要通过 Bash 手动执行脚本：

mcp__plugin-kimi-datasource_data__get_data_source_desc
mcp__plugin-kimi-datasource_data__call_data_source_tool

这两个工具由 Kimi Code 托管执行，参数直接按 tool schema 传 JSON。

工具会读取当前 Kimi Code 环境对应的本地 OAuth 登录凭据；当设置了 KIMI_CODE_OAUTH_HOST / KIMI_CODE_BASE_URL 时，会使用对应环境的隔离凭据。如果没有登录凭据，让用户先在 Kimi Code 里执行 /login。

1. 这个 skill 提供什么能力

本 plugin 后面挂了 7 个外部数据源。每一行的"数据源名"就是传给 get_data_source_desc 的 name。

能力域	数据源名	典型问题
A股 / 港股 / 美股行情和财务	`stock_finance_data`	"茅台现在多少钱"、"宁德时代 2024 年财报"、"腾讯股东"、"杭州的人工智能股票"
Yahoo Finance 全球金融	`yahoo_finance`	"苹果分析师评级"、"AAPL 期权链"、"标普 500 历年价格"
世界银行宏观经济	`world_bank_open_data`	"中国历年 GDP"、"印度通胀率"、"各国人口增长对比"
中国企业工商信息	`tianyancha`	"字节跳动股东"、"比亚迪司法风险"、"宁德时代专利"
arXiv 论文预印本	`arxiv`	"找 RAG 综述"、"下载 2406.xxxxx"
Google Scholar 学术搜索	`scholar`	"Hinton 最新论文"、"transformer 综述高引文献"
中国法律法规 / 司法案例	`yuandian_law`	"民法典关于居住权的规定"、"帮我查劳动合同解除的相关法条"、"找几个不当得利的判例"

不支持的能力：通用 Web 搜索 / 实时新闻。问到这类问题，告诉用户当前数据源不覆盖。

2. 标准工作流：`get_data_source_desc` → `call_data_source_tool`

后端可用 API 经常会调整，这份 skill 故意不抄具体的 API 名和参数表。每次调用前你都应当现场问数据源："你都有什么接口？"

1. 根据用户问题，从上表挑出一个 data_source_name
2. 执行 get_data_source_desc，读取该数据源的 Markdown 文档
3. 仔细读返回的 Markdown，里面列了：
     - 该数据源整体说明（含 ticker 格式、全局约束）
     - 每个 API 的描述 / 必填参数 / 可选参数 / 默认值 / 取值范围
4. 选最匹配的 API，按文档拼 params
5. 执行 call_data_source_tool
6. 读返回结果，用用户提问时使用的语言回答

例 1：用户问"茅台最近一年走势"

股票走势 → stock_finance_data
调用 mcp__plugin-kimi-datasource_data__get_data_source_desc，参数 {"name":"stock_finance_data"}
从文档里找到"获取历史价格"那个 API，看它要 ticker / start_date / end_date / file_path 等
用 web_search 核对 → 茅台 = 600519.SH
调用 mcp__plugin-kimi-datasource_data__call_data_source_tool，参数形如 {"data_source_name":"stock_finance_data","api_name":"<文档里写的 api>","params":{"ticker":"600519.SH","start_date":"...","end_date":"...","file_path":"/tmp/mao_1y.csv"}}

例 2：用户问"找几篇 retrieval augmented generation 的综述"

论文搜索 → arxiv（或 scholar，arxiv 更适合预印本，scholar 引用更全）
调用 mcp__plugin-kimi-datasource_data__get_data_source_desc，参数 {"name":"arxiv"}
从文档里找到搜索类 API，看它要 query / file_path / max_results 等
执行 call_data_source_tool

例 3：用户问"字节跳动有哪些股东"

企业工商 → tianyancha
调用 mcp__plugin-kimi-datasource_data__get_data_source_desc，参数 {"name":"tianyancha"}
注意：tianyancha 的 API 是动态注册的，文档会指引你先用搜索类接口找到合适的 API 名，再调用
必须使用企业全称（"北京字节跳动科技有限公司"），不要用简称。不知道全称就先用 tianyancha 文档里的"公司搜索"接口查

3. 调用前的几条铁律

3.1 股票代码必须核对，不能凭记忆猜

A 股 .SH/.SZ/.BJ，港股 .HK，美股 .US 等。用户通常只说中文名（"茅台"、"宁德时代"、"腾讯"），不会给代码。

调任何股票相关 API 前，先用 web_search / WebSearch 一类联网工具确认正确代码 + 后缀。

如果当前环境没有任何联网工具，让用户亲口确认代码，不要硬猜。错了的话接口会静默返回错数据或空数据。

3.2 企业相关查询必须用全称

tianyancha 拒收"特斯拉"、"网易"、"腾讯"这种简称，必须给"北京特斯拉销售有限公司"这种全名。不知道全名时，先调它的公司搜索 API。

3.3 多数 API 需要 `file_path`

绝大部分数据源 API 把完整结果以 CSV 形式写到 file_path。漏传会报 Missing required parameters: file_path。不知道传啥时，给一个 /tmp/<场景>_<时间戳>.csv 即可。

3.4 一次调用不要堆太多 ticker

stock_finance_data 的实时接口最多 3 个 ticker，历史接口最多 10 个。超过会被截断或报错。多了就分批调。

4. 怎么读返回结果

call_data_source_tool 的 stdout 一般含两段：

data_preview：CSV 头 + 前几行（通常 1~3 行），方便你直接答简单问题
CSV 数据已写入：/tmp/xxx.csv：完整数据落盘路径

策略：

用户只问"XX 现在多少钱"、"中国 2023 GDP 多少"这种单值 → data_preview 一般够，直接答
用户要画图、对比、算盈亏、列清单 → 用 Read 工具把 CSV 读出来再处理
混合 A+港股查询时服务端会自动把 CSV 拆成 _a.csv / _hk.csv 两份，原 file_path 那个文件不存在

如果接口返回失败，提示文字一般会写明原因（参数不对 / 不支持 / 数据空等）。把人话原因反馈给用户，不要硬走第二次。

5. `watchlist.json` — 用户自选股

${KIMI_SKILL_DIR}/watchlist.json 是用户的自选股列表。用户问"看一下我的自选股"时，读这个文件，再走标准 get_data_source_desc("stock_finance_data") → call_data_source_tool 流程查实时行情；文档里的实时接口最多 3 个 ticker 一批，多了分批调。

格式：

[
  {"code": "600519.SH", "name": "贵州茅台"},
  {"code": "0700.HK", "name": "腾讯控股", "hold_cost": 350.5, "hold_quantity": 100}
]

code 和 name 必填；hold_cost 和 hold_quantity 可选
两者都有时顺便算盈亏：(当前价 - hold_cost) * hold_quantity
用户说"帮我加 XX 到自选股"时：先 web_search 核对代码，再追加到 JSON 数组

6. 注意事项

回答用户时，使用用户提问时使用的语言。如果用户用中文问，就用中文答；如果用户用英文问，就用英文答；用其他语言问，就用其他语言答。
不要凭记忆猜股票代码 / 企业全称。错代码会让接口静默返回错数据，用户察觉不到
不要在没读 desc 的情况下硬传 api_name。后端会报 API_NOT_FOUND。除非这次会话里你已经读过该数据源的 desc 并记得参数
不要给投资建议。给完数据加一句"AI 生成，不构成投资建议"即可
如果某个数据源接口返回的报错明显是后端 bug（参数 schema 自相矛盾、内部 Python 报错等），汇报错误给用户，不要硬试——这种 bug 我们这边修不了，要后端服务侧改