name: kimi-datasource
description: |
Universal data-source assistant. Use this skill when the user wants external structured data such as stocks, financial reports, technical indicators, A-share/HK/US markets, global macroeconomics, Chinese enterprise registry information, arXiv papers, Google Scholar results, or Chinese laws/regulations and judicial cases.
This plugin exposes tools via MCP server plugin-kimi-datasource_data; call them in the flow mcp__plugin-kimi-datasource_data__get_data_source_desc → mcp__plugin-kimi-datasource_data__call_data_source_tool.
kimi-datasource — 通用数据源助手
0. 调用方式
本 skill 使用 datasource MCP server 注册的两个工具,不要通过 Bash 手动执行脚本:
mcp__plugin-kimi-datasource_data__get_data_source_descmcp__plugin-kimi-datasource_data__call_data_source_tool
这两个工具由 Kimi Code 托管执行,参数直接按 tool schema 传 JSON。
工具会读取当前 Kimi Code 环境对应的本地 OAuth 登录凭据;当设置了 KIMI_CODE_OAUTH_HOST / KIMI_CODE_BASE_URL 时,会使用对应环境的隔离凭据。如果没有登录凭据,让用户先在 Kimi Code 里执行 /login。
1. 这个 skill 提供什么能力
本 plugin 后面挂了 7 个外部数据源。每一行的"数据源名"就是传给 get_data_source_desc 的 name。
| 能力域 | 数据源名 | 典型问题 |
|---|---|---|
| A股 / 港股 / 美股 行情和财务 | stock_finance_data |
"茅台现在多少钱"、"宁德时代 2024 年财报"、"腾讯股东"、"杭州的人工智能股票" |
| Yahoo Finance 全球金融 | yahoo_finance |
"苹果分析师评级"、"AAPL 期权链"、"标普 500 历年价格" |
| 世界银行宏观经济 | world_bank_open_data |
"中国历年 GDP"、"印度通胀率"、"各国人口增长对比" |
| 中国企业工商信息 | tianyancha |
"字节跳动股东"、"比亚迪司法风险"、"宁德时代专利" |
| arXiv 论文预印本 | arxiv |
"找 RAG 综述"、"下载 2406.xxxxx" |
| Google Scholar 学术搜索 | scholar |
"Hinton 最新论文"、"transformer 综述高引文献" |
| 中国法律法规 / 司法案例 | yuandian_law |
"民法典关于居住权的规定"、"帮我查劳动合同解除的相关法条"、"找几个不当得利的判例" |
不支持的能力:通用 Web 搜索 / 实时新闻。问到这类问题,告诉用户当前数据源不覆盖。
2. 标准工作流:get_data_source_desc → call_data_source_tool
后端可用 API 经常会调整,这份 skill 故意不抄具体的 API 名和参数表。每次调用前你都应当现场问数据源:"你都有什么接口?"
1. 根据用户问题,从上表挑出一个 data_source_name
2. 执行 get_data_source_desc,读取该数据源的 Markdown 文档
3. 仔细读返回的 Markdown,里面列了:
- 该数据源整体说明(含 ticker 格式、全局约束)
- 每个 API 的描述 / 必填参数 / 可选参数 / 默认值 / 取值范围
4. 选最匹配的 API,按文档拼 params
5. 执行 call_data_source_tool
6. 读返回结果,用用户提问时使用的语言回答
例 1:用户问"茅台最近一年走势"
股票走势 →
stock_finance_data调用
mcp__plugin-kimi-datasource_data__get_data_source_desc,参数{"name":"stock_finance_data"}从文档里找到"获取历史价格"那个 API,看它要
ticker / start_date / end_date / file_path等用 web_search 核对 → 茅台 =
600519.SH调用
mcp__plugin-kimi-datasource_data__call_data_source_tool,参数形如{"data_source_name":"stock_finance_data","api_name":"<文档里写的 api>","params":{"ticker":"600519.SH","start_date":"...","end_date":"...","file_path":"/tmp/mao_1y.csv"}}
例 2:用户问"找几篇 retrieval augmented generation 的综述"
论文搜索 →
arxiv(或scholar,arxiv 更适合预印本,scholar 引用更全)调用
mcp__plugin-kimi-datasource_data__get_data_source_desc,参数{"name":"arxiv"}从文档里找到搜索类 API,看它要
query / file_path / max_results等执行
call_data_source_tool
例 3:用户问"字节跳动有哪些股东"
企业工商 →
tianyancha调用
mcp__plugin-kimi-datasource_data__get_data_source_desc,参数{"name":"tianyancha"}注意:tianyancha 的 API 是动态注册的,文档会指引你先用搜索类接口找到合适的 API 名,再调用
必须使用企业全称("北京字节跳动科技有限公司"),不要用简称。不知道全称就先用 tianyancha 文档里的"公司搜索"接口查
3. 调用前的几条铁律
3.1 股票代码必须核对,不能凭记忆猜
A 股 .SH/.SZ/.BJ,港股 .HK,美股 .US 等。用户通常只说中文名("茅台"、"宁德时代"、"腾讯"),不会给代码。
调任何股票相关 API 前,先用 web_search / WebSearch 一类联网工具确认正确代码 + 后缀。
如果当前环境没有任何联网工具,让用户亲口确认代码,不要硬猜。错了的话接口会静默返回错数据或空数据。
3.2 企业相关查询必须用全称
tianyancha 拒收"特斯拉"、"网易"、"腾讯"这种简称,必须给"北京特斯拉销售有限公司"这种全名。不知道全名时,先调它的公司搜索 API。
3.3 多数 API 需要 file_path
绝大部分数据源 API 把完整结果以 CSV 形式写到 file_path。漏传会报 Missing required parameters: file_path。不知道传啥时,给一个 /tmp/<场景>_<时间戳>.csv 即可。
3.4 一次调用不要堆太多 ticker
stock_finance_data 的实时接口最多 3 个 ticker,历史接口最多 10 个。超过会被截断或报错。多了就分批调。
4. 怎么读返回结果
call_data_source_tool 的 stdout 一般含两段:
data_preview:CSV 头 + 前几行(通常 1~3 行),方便你直接答简单问题CSV 数据已写入:/tmp/xxx.csv:完整数据落盘路径
策略:
- 用户只问"XX 现在多少钱"、"中国 2023 GDP 多少"这种单值 →
data_preview一般够,直接答 - 用户要画图、对比、算盈亏、列清单 → 用
Read工具把 CSV 读出来再处理 - 混合 A+港股查询时服务端会自动把 CSV 拆成
_a.csv/_hk.csv两份,原file_path那个文件不存在
如果接口返回失败,提示文字一般会写明原因(参数不对 / 不支持 / 数据空等)。把人话原因反馈给用户,不要硬走第二次。
5. watchlist.json — 用户自选股
${KIMI_SKILL_DIR}/watchlist.json 是用户的自选股列表。用户问"看一下我的自选股"时,读这个文件,再走标准 get_data_source_desc("stock_finance_data") → call_data_source_tool 流程查实时行情;文档里的实时接口最多 3 个 ticker 一批,多了分批调。
格式:
[
{"code": "600519.SH", "name": "贵州茅台"},
{"code": "0700.HK", "name": "腾讯控股", "hold_cost": 350.5, "hold_quantity": 100}
]
code和name必填;hold_cost和hold_quantity可选- 两者都有时顺便算盈亏:
(当前价 - hold_cost) * hold_quantity - 用户说"帮我加 XX 到自选股"时:先 web_search 核对代码,再追加到 JSON 数组
6. 注意事项
- 回答用户时,使用用户提问时使用的语言。如果用户用中文问,就用中文答;如果用户用英文问,就用英文答;用其他语言问,就用其他语言答。
- 不要凭记忆猜股票代码 / 企业全称。错代码会让接口静默返回错数据,用户察觉不到
- 不要在没读 desc 的情况下硬传
api_name。后端会报API_NOT_FOUND。除非这次会话里你已经读过该数据源的 desc 并记得参数 - 不要给投资建议。给完数据加一句"AI 生成,不构成投资建议"即可
- 如果某个数据源接口返回的报错明显是后端 bug(参数 schema 自相矛盾、内部 Python 报错等),汇报错误给用户,不要硬试——这种 bug 我们这边修不了,要后端服务侧改