name: "quantitative-research" description: "量化因子研究、数据清洗与对齐、Alpha 评估(IC/IR)、过拟合与稳健性检验。在用户讨论因子挖掘、截面/时序信号、机器学习特征或量化研报框架时启用。"
量化研究(因子与 Alpha 框架)
面向研究流程与方法论,不替代实盘交易执行与合规审查;涉及具体标的或策略时须提示回测与实盘的差异及监管要求。
何时启用
- 设计或评估 因子 / 特征:价值、动量、质量、低波动、另类数据等
- 数据层:复权、停牌、财报发布日、幸存者偏差、前视偏差(lookahead)
- 评估指标:IC、Rank IC、IR、分层收益、换手率、衰减、行业/市值中性化
- 稳健性:样本外、滚动窗口、参数敏感性、不同市场状态(牛/熊/震荡)
- 将 ML / 深度学习 用于量化时的特征工程、标签泄露、交叉验证设计
研究流程
- 问题定义:预测目标(下期收益、风险、排序)、投资域(股票池、期货品种)、频率(日/周/分钟)。
- 数据与对齐:交易日历、财报时点、公告滞后;训练/验证/测试切分须时间有序。
- 因子处理:去极值(winsorize)、标准化、中性化(行业、市值、风格);说明每一步对分布的影响。
- 评估:截面回归或排序分组;报告多空组合、多头、基准超额;成本与换手为 0 的纸面结果须标注。
- 风险:过拟合、数据挖掘(multiple testing)、因子拥挤、结构突变(regime change)。
- 输出:假设 → 数据与样本 → 方法与参数 → 结果与局限 → 需实盘前验证项。
输出要求
- 明确 预测 horizon 与 再平衡频率,避免标签与特征时间错位。
- 对「显著」结果给出经济含义与统计显著性(多重检验校正思路)。
- 不保证收益;强调 过去表现不代表未来。
- 中国大陆市场可提示:T+1、涨跌停、融券与对冲工具限制对「理想回测」的影响(概念层面)。
质量检查清单
- 已排查前视偏差与幸存者偏差
- 训练/验证/测试无信息泄露
- 因子与收益方向、符号在经济上可解释(或明确为纯数据驱动且高风险)
- 报告包含样本期长度与标的数量级