因子投资:传统量化的主战场

模块定位:传统量化最核心、最”赚钱”的领域。不是用 ML 挖因子,而是从理论出发理解风险溢价,用统计方法验证有效性,用风险模型落地到组合。

总预计学习时间:10-12 小时


为什么因子投资是传统量化的主战场?

很多刚接触量化的人会觉得:量化就是用机器学习预测股票涨跌。

但事实是,全球资产规模最大的量化基金——AQR、Bridgewater、Two Sigma——它们的核心框架都是因子投资

原因很简单:

  1. 可解释性强:每个因子都有经济学理论支撑,不是”黑箱”
  2. 容量大:因子策略通常涉及几百上千只股票,资金容量远大于高频策略
  3. 可复制性强:因子逻辑清晰,团队成员可以理解和维护
  4. 风险可控:有成熟的风险模型(Barra 等),能管理组合层面的暴露

但因子投资的核心不是”找到一个能预测收益的变量”,而是理解”为什么这个变量能预测收益”——这就是风险溢价来源的问题,也是传统量化与 ML 量化的根本分界线。


因子投资的完整框架

┌─────────────────────────────────────────────────────────────────┐
│                     因子投资研究全景                              │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  理论基础 ──→ 因子构建 ──→ 统计验证 ──→ 风险模型 ──→ 组合实现    │
│                                                                 │
│  为什么有效    怎么算因子   因子真的有效吗   机构怎么管风险  赚钱   │
│                                                                 │
│  02-因子溢价   01-经典因子  03-因子研究     04-Barra风险  组合管理 │
│   来源.md       体系.md     方法论.md        模型.md      (其他)  │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

这个模块覆盖前四个环节——理论基础、因子构建、统计验证、风险模型。组合实现是”组合管理”模块的内容。


模块导航

01 - 经典因子体系(3-4h)

从”什么是因子”讲起,覆盖六大经典因子的理论解释、构造方法和 Python 实现。

章节核心内容
因子的定义能预测截面收益差异的变量
价值因子B/P、E/P、CF/P、S/P:“便宜的股票长期收益更高?“
规模因子市值、自由流通市值:“小盘股效应”
动量因子12-1 月动量、短期反转:“涨的还会涨” vs “涨太多了会跌回来”
质量因子ROE、毛利率、应计项:“好公司” = 高盈利能力
低波动因子Beta 异象、特异波动:“低波动股票收益更稳定”
流动性因子Amihud、换手率:“不好卖的股票补偿你”
盈利因子与投资因子RMW、CMA:Fama-French 五因子扩展
因子构建实战用模拟数据构建 6 个因子、因子相关性矩阵

量化应用场景:股票 Alpha 研究、多因子模型构建、因子组合


02 - 因子溢价来源(2-3h)

从”因子为什么有效”这个根本问题讲起,理解因子的经济学基础。

章节核心内容
风险补偿理论CAPM、多因子模型、APT:“因子有效是因为你承担了风险”
行为金融解释过度反应、信息扩散、覆盖不足:“因子有效是因为大多数人犯了心理偏差”
市场摩擦流动性溢价、卖空限制、搜索成本
数据挖掘 vs 真实 Alpha多重检验问题、样本内外、如何区分
因子拥挤太多人用同一个因子的后果、检测方法
因子轮动经济周期与因子的关系、价值 vs 成长的轮动
跨市场可移植性A 股因子在美股是否有效

量化应用场景:因子选择、因子衰减监控、因子配置


03 - 因子研究方法论(3-4h)

从”怎么验证一个因子是否真的有效”讲起,覆盖量化因子研究的标准方法。

章节核心内容
Fama-MacBeth 回归为什么不能直接做一次横截面回归、两步法、t 统计量
分组分析按因子值分 5 组、多空收益
IC / ICIR 评价因子值与未来收益的相关系数、Rank IC、ICIR、IC 衰减
因子 t 统计量Newey-West 调整
因子正交化施密特正交化、回归残差正交化
因子衰减曲线持仓期 vs IC、最优换仓频率
样本外检验Walk-Forward、多个独立样本外期

量化应用场景:因子有效性验证、因子遴选、因子衰减监控


04 - Barra 风险模型(2-3h)

从”机构怎么管理风险”讲起,理解结构化风险模型的完整框架。

章节核心内容
结构化风险模型框架收益 = 因子收益 + 特异性收益、Barra 架构
因子收益率估计WLS 横截面回归、市值加权
特异性风险估计EWMA 指数加权
协方差矩阵样本协方差的问题、因子模型协方差、收缩估计
组合风险归因因子 vs 特异、风险暴露分析
实际案例用模拟数据构建简化版 Barra 模型

量化应用场景:风险管理、组合优化、绩效归因


学习建议

前置知识

  • 计量经济学基础:OLS 回归、假设检验、HAC 标准误
  • 概率统计:相关系数、t 检验、假设检验
  • Python 基础:numpy、pandas、matplotlib、scipy、statsmodels

学习顺序

01-经典因子体系 → 02-因子溢价来源 → 03-因子研究方法论 → 04-Barra风险模型
      ↑                    ↑                    ↑                    ↑
   知道有什么因子     理解为什么有效        知道怎么验证有效       机构怎么做风险

建议不要跳过 02 直接学 03。理解因子为什么有效,才能正确理解因子的衰减和失效。

核心原则

  1. 先理解直觉,再看公式,最后写代码
  2. 每个因子的关键不是”怎么算”,而是”为什么它有溢价”
  3. 统计显著和经济显著是两回事——t 值大不代表策略能赚钱
  4. 因子拥挤是所有因子的宿命——理解这一点,才能做好因子管理

推荐参考书

书名作者核心价值
Active Portfolio ManagementGrinold & Kahn因子投资的圣经,信息比率、Alpha、风险模型
Expected ReturnsIlmanen因子溢价来源的全面综述
Quantitative Equity Portfolio ManagementChincarini & Kim因子投资实战,Barra 模型详解
The Art of Factor InvestingFactorInvest因子投资的实践指南
Advances in Active Portfolio ManagementGrinold & KahnAPM 的续作,更偏实战

经典论文

论文作者年份重要性
The Cross-Section of Expected Stock ReturnsFama & French1992三因子模型奠基
Common Risk Factors in the Returns on Stocks and BondsFama & French1993FF3 完整版
A Five-Factor Asset Pricing ModelFama & French2015五因子模型
Returns to Buying Winners and Selling LosersJegadeesh & Titman1993动量因子奠基
Betting Against BetaFrazzini & Pedersen2014BAB 因子
Buffett’s AlphaFrazzini, Kabiller & Pedersen2018巴菲特的因子解释

版本信息

  • 创建日期:2026-03-28
  • 最后更新:2026-03-28
  • 许可:CC BY-NC-SA 4.0

此文件夹下有4条笔记。