量化研究能力地图

六大支柱,覆盖从数学基础到工程落地的完整知识体系。每个模块均已在 mlqt/ 目录下展开为详细学习文档。


六大支柱总览

┌─────────────────────────────────────────────────────────┐
│                    第四层:落地与治理                      │
│        风险管理 │ 执行系统 │ 数据基础设施 │ 绩效归因        │
├─────────────────────────────────────────────────────────┤
│                第三层:策略生成与验证                      │
│      因子研究 │ ML/深度学习 │ 策略研究 │ 回测验证           │
├─────────────────────────────────────────────────────────┤
│                  第二层:金融对象                         │
│        资产定价 │ 微观结构 │ 衍生品 │ 宏观                 │
├─────────────────────────────────────────────────────────┤
│                 第一层:研究语言                           │
│     概率统计 │ 时间序列 │ 线性代数 │ 优化 │ 随机过程        │
└─────────────────────────────────────────────────────────┘

第一支柱:数学基础

你理解策略、模型、风险的语言系统。

模块核心知识详细文档
概率论与统计学分布族、贝叶斯、假设检验、多重校正、Bootstrap、蒙特卡洛、EVT概率论与统计学
时间序列分析平稳性、ACF/PACF、ARIMA、GARCH、协整、Granger、Kalman、HMM时间序列分析
线性代数与优化矩阵运算、SVD、PCA、协方差估计、凸优化、QP、正则化视角线性代数与优化

进阶参考:随机过程(布朗运动、伊藤引理、SDE)、信息论(熵、KL 散度、互信息)


第二支柱:金融理论

你研究的”世界本身”——市场为什么这样动。

模块核心知识详细文档
资产定价与因子模型EMH、CAPM、Fama-French、APT、Barra、因子拥挤与衰减资产定价与因子模型
市场微观结构订单簿、价差、冲击成本、VWAP/TWAP、OBI、流动性度量市场微观结构
衍生品与波动率Black-Scholes、Greeks、隐含波动率、波动率曲面衍生品与波动率

进阶参考:固定收益(收益率曲线、久期、信用利差)、宏观因子(利率、通胀、Risk-on/off)


第三支柱:机器学习

alpha 从 0 到 1 的核心引擎。

模块核心知识详细文档
机器学习基础过拟合(13种解法)、IC/ICIR、Walk-Forward、早停、标签处理机器学习常见概念
特征工程时序/横截面特征、技术/财务因子、特征选择/评估、自动化框架特征构造
树模型实战GBDT/XGBoost/LightGBM/CatBoost、时序划分、Optuna 调优、SHAP树模型实战
深度学习模型LSTM/GRU/Attention、PyTorch、时序数据处理、训练优化深度学习模型
策略类型动量、均值回归、多因子、CTA、事件驱动、波动率策略主流策略类型
统计套利协整、配对交易、配对选择、ML 增强统计套利详解

进阶参考:强化学习交易(MDP、DQN、PPO、SAC)、NLP 与另类数据(情绪分析、卫星、链上数据)


第四支柱:策略验证与回测

不做回测就上实盘等于赌博。

模块核心知识详细文档
回测理论回测流程、极简回测示例回测理论
投资组合构建等权、Top-K、IC 加权、均值方差优化投资组合构建
交易成本佣金、印花税、滑点、冲击成本、T+1交易成本模型
绩效评估Sharpe、IR、Sortino、Calmar、VaR、CVaR、换手率绩效评估指标
回测陷阱过拟合、前视偏差、幸存者偏差、数据窥探、流动性回测陷阱与防范

进阶参考:信号到组合完整流程、CSCV 多重假设检验、Deflated Sharpe Ratio


第五支柱:风险管理

能活下来比赚得多更重要。

模块核心知识详细文档
市场风险度量VaR(三种方法)、CVaR、EVT、压力测试、因子暴露、Copula市场风险度量
组合风控与资金管理Kelly、波动率目标、风险平价、止损、动态杠杆、多策略分配组合风控与资金管理
绩效归因Brinson、因子归因、Alpha 分解、策略衰减、实盘差异绩效归因

进阶参考:流动性风险(L-VaR、容量评估)、操作风险(合规、熔断)、尾部对冲


第六支柱:工程与执行

策略能否真正赚钱取决于工程能力。

模块核心知识详细文档
数据基础设施存储选型、因子库、数据管道、复权清洗、质量校验、Parquet数据基础设施与算法执行
算法执行TWAP、VWAP、Almgren-Chriss、SOR、POV、TCA数据基础设施与算法执行

进阶参考:低延迟系统(C++/Rust)、MLOps、分布式计算(Ray/Dask)


学习路线图

阶段一(6-12 月):打牢地基

概率统计 → 线性代数 → Python 熟练 → 金融基础(CAPM/期权)→ 时间序列 → 简单回测

阶段目标:能读懂量化论文、能处理价格数据、能写基础策略并回测、理解统计显著性的概念

对应 mlqt 模块:数学基础 → 金融基础 → 回测方法论

阶段二(6-12 月):核心 ML + 因子研究

监督学习 → 因子挖掘(IC/ICIR)→ 多因子回测 → 防过拟合 → 组合优化

阶段目标:能把想法拆成特征-标签-验证-回测、理解截面/时序/规则触发问题的区别

对应 mlqt 模块:机器学习基础 → 特征工程 → 树模型实战 → 策略研究

阶段三(6-12 月):深度学习 + 风险体系

LSTM/Transformer → VaR/CVaR → 执行算法 → 微观结构 → 流动性分析

阶段目标:理解”好信号不一定能交易”、能区分 paper alpha 与 executable alpha

对应 mlqt 模块:深度学习模型 → 风险管理 → 数据工程

阶段四(12 月+):机构级完整体系

强化学习 → 另类数据 → 系统架构 → MLOps → 合规风控 → 多策略管理 → 绩效归因

阶段目标:具备从研究到上线的完整闭环能力

对应 mlqt 模块:强化学习交易 → 另类数据与NLP → 数据工程 → 绩效归因


个人量化优先级

不是所有内容都要同时学。个人/小团队建议分三档:

A 档:必须立即掌握

  • 概率统计、线性代数基础、Python/pandas/NumPy
  • 时间序列基础、回测与偏差、交易成本建模
  • 因子评价(IC/ICIR)、风险指标(Sharpe/MDD/CVaR)、仓位管理

B 档:做出稳定研究能力

  • 监督学习、Purged CV/Walk-Forward、组合优化
  • 市场微观结构、执行成本、流动性与容量
  • 因子中性化/正交化、归因分析

C 档:做机构化平台再投入

  • 强化学习、另类数据大规模接入、GNN/多智能体
  • MLOps、低延迟系统、合规审计体系

一句话总结

从数学、金融、机器学习、策略、风控、工程六个维度,搭建一个能持续产出、验证、执行、治理 alpha 的完整系统。

特征 > 模型 > 调参。永远用样本外数据做最终评估。对回测结果保持怀疑。