量化研究能力地图
六大支柱,覆盖从数学基础到工程落地的完整知识体系。每个模块均已在
mlqt/目录下展开为详细学习文档。
六大支柱总览
┌─────────────────────────────────────────────────────────┐
│ 第四层:落地与治理 │
│ 风险管理 │ 执行系统 │ 数据基础设施 │ 绩效归因 │
├─────────────────────────────────────────────────────────┤
│ 第三层:策略生成与验证 │
│ 因子研究 │ ML/深度学习 │ 策略研究 │ 回测验证 │
├─────────────────────────────────────────────────────────┤
│ 第二层:金融对象 │
│ 资产定价 │ 微观结构 │ 衍生品 │ 宏观 │
├─────────────────────────────────────────────────────────┤
│ 第一层:研究语言 │
│ 概率统计 │ 时间序列 │ 线性代数 │ 优化 │ 随机过程 │
└─────────────────────────────────────────────────────────┘
第一支柱:数学基础
你理解策略、模型、风险的语言系统。
| 模块 | 核心知识 | 详细文档 |
|---|---|---|
| 概率论与统计学 | 分布族、贝叶斯、假设检验、多重校正、Bootstrap、蒙特卡洛、EVT | 概率论与统计学 |
| 时间序列分析 | 平稳性、ACF/PACF、ARIMA、GARCH、协整、Granger、Kalman、HMM | 时间序列分析 |
| 线性代数与优化 | 矩阵运算、SVD、PCA、协方差估计、凸优化、QP、正则化视角 | 线性代数与优化 |
进阶参考:随机过程(布朗运动、伊藤引理、SDE)、信息论(熵、KL 散度、互信息)
第二支柱:金融理论
你研究的”世界本身”——市场为什么这样动。
| 模块 | 核心知识 | 详细文档 |
|---|---|---|
| 资产定价与因子模型 | EMH、CAPM、Fama-French、APT、Barra、因子拥挤与衰减 | 资产定价与因子模型 |
| 市场微观结构 | 订单簿、价差、冲击成本、VWAP/TWAP、OBI、流动性度量 | 市场微观结构 |
| 衍生品与波动率 | Black-Scholes、Greeks、隐含波动率、波动率曲面 | 衍生品与波动率 |
进阶参考:固定收益(收益率曲线、久期、信用利差)、宏观因子(利率、通胀、Risk-on/off)
第三支柱:机器学习
alpha 从 0 到 1 的核心引擎。
| 模块 | 核心知识 | 详细文档 |
|---|---|---|
| 机器学习基础 | 过拟合(13种解法)、IC/ICIR、Walk-Forward、早停、标签处理 | 机器学习常见概念 |
| 特征工程 | 时序/横截面特征、技术/财务因子、特征选择/评估、自动化框架 | 特征构造 |
| 树模型实战 | GBDT/XGBoost/LightGBM/CatBoost、时序划分、Optuna 调优、SHAP | 树模型实战 |
| 深度学习模型 | LSTM/GRU/Attention、PyTorch、时序数据处理、训练优化 | 深度学习模型 |
| 策略类型 | 动量、均值回归、多因子、CTA、事件驱动、波动率策略 | 主流策略类型 |
| 统计套利 | 协整、配对交易、配对选择、ML 增强 | 统计套利详解 |
进阶参考:强化学习交易(MDP、DQN、PPO、SAC)、NLP 与另类数据(情绪分析、卫星、链上数据)
第四支柱:策略验证与回测
不做回测就上实盘等于赌博。
| 模块 | 核心知识 | 详细文档 |
|---|---|---|
| 回测理论 | 回测流程、极简回测示例 | 回测理论 |
| 投资组合构建 | 等权、Top-K、IC 加权、均值方差优化 | 投资组合构建 |
| 交易成本 | 佣金、印花税、滑点、冲击成本、T+1 | 交易成本模型 |
| 绩效评估 | Sharpe、IR、Sortino、Calmar、VaR、CVaR、换手率 | 绩效评估指标 |
| 回测陷阱 | 过拟合、前视偏差、幸存者偏差、数据窥探、流动性 | 回测陷阱与防范 |
进阶参考:信号到组合完整流程、CSCV 多重假设检验、Deflated Sharpe Ratio
第五支柱:风险管理
能活下来比赚得多更重要。
| 模块 | 核心知识 | 详细文档 |
|---|---|---|
| 市场风险度量 | VaR(三种方法)、CVaR、EVT、压力测试、因子暴露、Copula | 市场风险度量 |
| 组合风控与资金管理 | Kelly、波动率目标、风险平价、止损、动态杠杆、多策略分配 | 组合风控与资金管理 |
| 绩效归因 | Brinson、因子归因、Alpha 分解、策略衰减、实盘差异 | 绩效归因 |
进阶参考:流动性风险(L-VaR、容量评估)、操作风险(合规、熔断)、尾部对冲
第六支柱:工程与执行
策略能否真正赚钱取决于工程能力。
| 模块 | 核心知识 | 详细文档 |
|---|---|---|
| 数据基础设施 | 存储选型、因子库、数据管道、复权清洗、质量校验、Parquet | 数据基础设施与算法执行 |
| 算法执行 | TWAP、VWAP、Almgren-Chriss、SOR、POV、TCA | 数据基础设施与算法执行 |
进阶参考:低延迟系统(C++/Rust)、MLOps、分布式计算(Ray/Dask)
学习路线图
阶段一(6-12 月):打牢地基
概率统计 → 线性代数 → Python 熟练 → 金融基础(CAPM/期权)→ 时间序列 → 简单回测
阶段目标:能读懂量化论文、能处理价格数据、能写基础策略并回测、理解统计显著性的概念
对应 mlqt 模块:数学基础 → 金融基础 → 回测方法论
阶段二(6-12 月):核心 ML + 因子研究
监督学习 → 因子挖掘(IC/ICIR)→ 多因子回测 → 防过拟合 → 组合优化
阶段目标:能把想法拆成特征-标签-验证-回测、理解截面/时序/规则触发问题的区别
对应 mlqt 模块:机器学习基础 → 特征工程 → 树模型实战 → 策略研究
阶段三(6-12 月):深度学习 + 风险体系
LSTM/Transformer → VaR/CVaR → 执行算法 → 微观结构 → 流动性分析
阶段目标:理解”好信号不一定能交易”、能区分 paper alpha 与 executable alpha
对应 mlqt 模块:深度学习模型 → 风险管理 → 数据工程
阶段四(12 月+):机构级完整体系
强化学习 → 另类数据 → 系统架构 → MLOps → 合规风控 → 多策略管理 → 绩效归因
阶段目标:具备从研究到上线的完整闭环能力
对应 mlqt 模块:强化学习交易 → 另类数据与NLP → 数据工程 → 绩效归因
个人量化优先级
不是所有内容都要同时学。个人/小团队建议分三档:
A 档:必须立即掌握
- 概率统计、线性代数基础、Python/pandas/NumPy
- 时间序列基础、回测与偏差、交易成本建模
- 因子评价(IC/ICIR)、风险指标(Sharpe/MDD/CVaR)、仓位管理
B 档:做出稳定研究能力
- 监督学习、Purged CV/Walk-Forward、组合优化
- 市场微观结构、执行成本、流动性与容量
- 因子中性化/正交化、归因分析
C 档:做机构化平台再投入
- 强化学习、另类数据大规模接入、GNN/多智能体
- MLOps、低延迟系统、合规审计体系
一句话总结
从数学、金融、机器学习、策略、风控、工程六个维度,搭建一个能持续产出、验证、执行、治理 alpha 的完整系统。
特征 > 模型 > 调参。永远用样本外数据做最终评估。对回测结果保持怀疑。