AI在量化投资中的角色:机器学习策略原理剖析

为什么AI正在改变量化投资

过去十年,机器学习在“特征更丰富、非线性更强、交互更复杂”的资产定价与交易问题上展现优势,研究显示树模型与神经网络在横截面收益预测中往往优于传统线性回归,原因在于能捕捉特征交互与非线性结构。代表性研究对比多种ML方法,发现使用更大维度的预测变量集合并允许非线性,大幅提升了风险溢价度量与投资者收益。

与此同时,金融时序具有自相关、异方差、结构突变等特征,通用的随机K折验证会“穿越时空”导致信息泄漏,因此需要秉持时序友好的验证与标签设计方法,如Purged K-Fold、CPCV、Triple-Barrier与元标签等,才能更真实评估策略泛化能力。

数据到信号:从特征工程到“可交易的标签”

1) 标签构造:Triple-Barrier与元标签

Triple-Barrier方法为每个起点同时设定止盈、止损与到期三道“障碍”,根据最先触达的障碍给样本打标签,避免用固定持有期的单一标签掩盖路径风险;元标签(Meta-Labeling)可在已有“方向”预测上再学习头寸大小或是否执行,提高F1/交易质量。该体系已成为金融机器学习的常用做法。

2) 时序验证:Purged K-Fold与CPCV

为杜绝样本间的标签或信息泄漏,Purged K-Fold在切分时“清洗”和“禁运”相邻样本;CPCV(Combinatorial Purged Cross-Validation)进一步通过组合划分稳健评估模型选择过程,常与“回测过拟合概率(PBO)”与“缩水夏普(DSR)”配套,校正多重检验与非正态收益带来的乐观偏差。

3) 文本与替代数据:从规则到金融域大模型

金融文本的情绪/主题可通过FinBERT等金融域预训练模型提取,相比通用词典或BoW方法,FinBERT在分析师报告、财报电话会等任务上通常具有更好的语义表现力,已在卖方/买方研究中被广泛验证与扩展。

模型族与策略范式:该用什么学什么

1) 监督学习:横截面选股与时序预测
  • 树模型/Boosting(RF、XGBoost、LightGBM):在高维、非线性、强交互场景下表现稳健,且便于用SHAP等方法做可解释性分析。
  • 深度学习(MLP、LSTM/Transformer):适合高维时序与多模态(文本+结构化)输入,但对样本量、正则化与稳定性要求更高。综合研究显示深度网络在横截面与国际市场样本上亦可带来经济上的改进。
  • 可解释性:SHAP基于Shapley值,对黑箱模型的单点与全局重要度给出一致、可加性的解释,已成为金融合规语境下常用的解释工具。
2) 强化学习(RL):执行、做市与资产配置

最新综述表明,RL在最优执行、资产配置与高频决策上的研究快速推进:一方面以交易成本最小化为目标的执行RL(对标Almgren–Chriss基线);另一方面在风险约束下的动态配置与做市均有进展,但对稳健训练与线上泛化的要求很高。

从“纸面收益”到“可实现收益”:组合与执行两端的AI加持

1) 协方差估计:从样本矩阵到收缩估计

投资组合优化对协方差矩阵极为敏感。Ledoit–Wolf线性收缩与后续的非线性收缩在“小样本、低信噪”的金融数据中显著改善条件数与稳健性,常被用作ML信号之上的风险层“底座”。

2) 执行度量与优化:IS与Almgren–Chriss

实施偏差(Implementation Shortfall, IS)度量“理论决策价”到“实际成交价”的落差,是检验研究—实盘转化的行业标准;Almgren–Chriss给出在冲击成本与波动风险权衡下的最优切片路径,为执行算法与RL基线提供了经典框架。

回测可靠性:如何避免“看上去很美”的曲线

  • 回测过拟合概率(PBO):评估模型选择流程是否“挑到噪声”;
  • DSR/PSR:在非正态收益与多重检验下对夏普进行通胀修正;
  • 最少业绩记录长度(MinTRL):判断给定夏普是否具有统计显著性。
    这些工具已在系列论文中系统提出并配套CPCV使用,被广泛用于量化研究流程把关。

合规与治理:把AI纳入“可审计”的风控框架

银行与券商在大规模引入生成式/机器学习系统时,通常以监管指导与行业框架为锚:

  • SR 11-7《模型风险管理》强调“开发—验证—监控—治理”的全生命周期与文档化,适用于包含AI/ML在内的各类模型。
  • NIST《AI风险管理框架》(AI RMF 1.0)提出“可解释、可靠、可追溯”的通用治理实践,2024年又发布了面向生成式AI的配套资料。

研究→实盘:一份可直接套用的落地清单

  1. 明确问题与可交易的标签
    使用Triple-Barrier/元标签定义方向与执行门槛,避免固定持有期标签的路径偏误。
  2. 正确的时序验证
    采用Purged K-Fold或CPCV并设置禁运期;对比PBO与DSR,记录尝试次数与参数搜索范围。
  3. 模型与解释
    以树模型/Boosting作为强基线,必要时叠加深度网络;用SHAP对单笔与组合层面做可解释性分析。
  4. 风险与组合
    在信号之上用Ledoit–Wolf/非线性收缩估计协方差,控制敞口与杠杆。
  5. 执行与评估
    以IS为核心KPI,和VWAP/TWAP/Almgren–Chriss基线对照;在高成本场景尝试以RL微调切片与时机。
  6. 文本与多模态增强
    在财报/研报/新闻上引入FinBERT等金融域NLP特征,与结构化信号做堆叠/融合。
  7. 治理与可审计
    按照SR 11-7和NIST AI RMF建立“模型卡”—“数据卡”—“提示卡”(对GenAI场景),固化审批、留痕与异常处置流程。

常见问答(FAQ)

机器学习是否一定优于传统量化?
不一定。优势来自可捕捉非线性与交互,但前提是正确的标签、严格的时序验证与成本入模。横截面资产定价的大样本研究表明,树模型/神经网络显著提升度量,但并非在所有市场、频率与特征集都占优。

如何避免“数据穿越”?
使用Purged K-Fold或CPCV,设置禁运期;并用PBO与DSR校正模型选择与夏普通胀。

文本情绪真的能帮到策略吗?
在财报电话会与研报等语境中,FinBERT等金融域模型通常优于通用词典与BoW方法,但需要与结构化因子合成并做好时序对齐与因果检验。

实盘为何常与回测偏差显著?
主要因为交易摩擦与执行延迟。用IS量化“纸面—实盘”落差,并以Almgren–Chriss或RL作为执行优化框架。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注