深圳融克迪特科技有限公司 Logo,金融科技,量化交易,软件开发

深圳融克迪特科技有限公司

RONG CREDIT TECHNOLOGY CO., LTD.

入门框架

【量化研究框架 系列 第1讲】量化研究框架入门第1讲:市场周期识别与研究目标锚定的双轨启动法

本讲系统阐释量化研究启动阶段的核心前置动作——市场周期判别与研究目标定义。通过结构化周期维度(趋势强度、波动结构、流动性分位、相关性格局)、目标类型谱系(信号生成型、风险控制型、组合构建型、机制验证型)及二者间的逻辑耦合规则,构建可执行的双轨启动检查表。详解常见误判场景、参数敏感性边界与跨周期目标漂移的预警信号,为后续最小策略拆解与数据检查奠定不可逆的起点共识。

2026-04-22 智铨研究 阅读时长 14 分钟

目录

  1. 为什么第1讲必须先定周期与目标?
  2. 一、市场周期不是单一维度,而是四维可观测状态空间
  3. 二、研究目标不是宽泛命题,而是可验证的四类问题契约
  4. 六种典型匹配关系与反例诊断
  5. 双轨启动检查表的 8 项必填条目与 3 级验证标准
  6. 七类周期-目标认知陷阱及其数学根源
  7. 四维周期指标的临界阈值实验
  8. 从个人学习到团队协作的三级推进路径
  9. 五种不可建模的周期-目标组合
  10. 四维周期引擎的最小可行实现(Python伪代码)
  11. 双轨启动法的本质是建立研究信用体系
  12. 第 1 讲最容易走偏的四种开题方式
  13. 系列衔接
  14. 风险揭示与免责声明

1. 为什么第1讲必须先定周期与目标?

在量化研究实践中,超过68%的初学者失败并非源于模型精度不足或代码实现缺陷,而是源于研究起点的结构性失焦——在未明确‘当前市场处于何种可建模状态’以及‘本次研究究竟要解决哪一类可验证问题’的前提下,即仓促进入因子挖掘、回测或参数优化环节。这种‘无锚点推进’导致三类典型后果:其一,策略在训练窗口表现优异但样本外失效,实为周期错配下的过拟合幻觉;其二,回测指标看似达标却无法映射至真实交易约束(如滑点容忍度、持仓周期、头寸调整频率),暴露目标抽象化缺陷;其三,团队协作中因周期假设与目标定义缺乏书面共识,造成后续各环节(数据清洗、特征工程、风控嵌入)出现隐性逻辑断层。本讲所提出的‘双轨启动法’,正是为规避上述系统性风险而设计的强制性前置校准机制,其本质是将量化研究从‘技术驱动’转向‘问题驱动’的第一道闸门。

2. 一、市场周期不是单一维度,而是四维可观测状态空间

市场周期常被简化为‘牛市/熊市/震荡市’三分法,但该分类对量化研究缺乏操作性。真正可嵌入研究框架的周期定义,必须满足三个条件:可观测(基于公开行情与宏观数据可计算)、可分段(存在统计显著的区间划分依据)、可映射(能对应至不同建模假设与验证标准)。据此,我们构建四维周期状态空间:

  1. 趋势强度维度:采用滚动250日价格回归斜率标准化值(Slope_Z)与滚动60日ADX均值(ADX_60)联合判定。Slope_Z > 1.2 且 ADX_60 > 25 定义为强趋势;Slope_Z ∈ [-0.8, 0.8] 且 ADX_60 < 20 定义为弱趋势/震荡;其余为过渡态。需注意:Slope_Z 对价格序列起止点敏感,建议采用中位数去偏处理,避免极端值扭曲趋势判断。

  2. 波动结构维度:区分‘高波动但聚集’(如VIX脉冲式飙升后快速回落)与‘低波动但持续’(如2017年美股波动率长期低于10)。使用滚动30日HV(历史波动率)与滚动30日HV标准差(HV_SD)构成二维坐标。HV > 20% 且 HV_SD > 8% 为脉冲型高波动;HV < 12% 且 HV_SD < 3% 为持续型低波动。该维度直接影响止损阈值设定与仓位衰减函数形式。

  3. 流动性分位维度:以滚动60日平均换手率(Turnover_MA60)与滚动60日买卖价差中位数(BidAsk_Med)构成流动性健康度指标(LQI = Turnover_MA60 / BidAsk_Med)。将全市场股票按LQI分组后取行业中位数,再对全市场LQI序列做滚动120日分位数归一化(LQI_Q),LQI_Q < 0.3 为流动性收缩期,> 0.7 为流动性宽松期。此维度决定是否启用高频信号、是否允许小市值股票参与、以及冲击成本模型的参数基线。

  4. 相关性格局维度:计算滚动90日行业指数间平均相关系数(IndCorr_MA90)与滚动90日个股与行业指数平均相关系数(StockIndCorr_MA90)之差(ΔCorr)。当 IndCorr_MA90 > 0.45 且 ΔCorr < -0.08 时,定义为‘行业主导型’市场;当 IndCorr_MA90 < 0.25 且 ΔCorr > 0.12 时,定义为‘个股分化型’市场。该维度直接决定因子选股逻辑:行业主导期宜用行业动量+行业内质量因子,个股分化期则需强化特异性风险剥离与非线性交互项。

四维状态不可孤立使用。例如,‘强趋势+脉冲型高波动+流动性收缩+行业主导’组合,通常对应政策驱动型牛市初期,此时趋势跟踪类策略胜率提升但需严控单边敞口;而‘弱趋势+持续型低波动+流动性宽松+个股分化’组合,则利好多因子选股与事件驱动策略,但对因子稳定性要求极高。

3. 二、研究目标不是宽泛命题,而是可验证的四类问题契约

量化研究目标常表述为‘提升收益率’‘降低最大回撤’等模糊诉求,此类目标无法指导具体方法选择与验证设计。本框架将研究目标严格划分为四类可验证契约,每类契约对应特定的数据需求、建模范式与验证标准:

  1. 信号生成型目标:核心是‘在给定周期状态下,能否稳定输出方向性/强度性信号’。例如:‘在行业主导型强趋势周期中,构建能提前5日识别行业动量拐点的信号’。验证标准为:信号发出后5日行业指数涨跌幅的AUC ≥ 0.62,且信号覆盖率(有效信号占总交易日比)≥ 35%。关键约束:信号必须可实时计算(延迟≤ T+1收盘后30分钟),且不依赖未来信息(包括当日未收盘数据)。

  2. 风险控制型目标:聚焦‘在特定周期压力下,能否动态调节暴露以守住预设风险阈值’。例如:‘在脉冲型高波动+流动性收缩周期中,将组合日波动率控制在基准指数1.2倍以内,且调仓频率≤每周1次’。验证标准为:滚动60日组合波动率/基准波动率比值的90分位数 ≤ 1.2,且实际调仓次数与理论触发次数偏差率 < 15%。需注意:该目标隐含对波动率预测模块的刚性需求,不可仅用静态缩放替代。

  3. 组合构建型目标:解决‘如何在多周期共存环境下,分配子策略权重以达成整体目标’。例如:‘在趋势强度与波动结构呈现负相关周期(即趋势越强波动越低)中,使趋势子策略权重不低于60%,反转子策略权重不高于20%’。验证标准为:权重分配结果与周期状态标签的交叉验证准确率 ≥ 85%,且组合夏普率较等权组合提升≥0.3。此处‘周期状态’必须是前述四维空间的离散化结果,而非连续指标插值。

  4. 机制验证型目标:检验‘某类市场现象是否具备统计稳健性与经济逻辑自洽性’。例如:‘验证在流动性收缩期,小市值股票的估值溢价是否随换手率下降呈非线性衰减’。验证标准为:面板回归中换手率二次项系数显著为负(p < 0.01),且经济含义合理(即流动性越紧,小盘股估值折价越深)。该目标不产出交易信号,但为后续策略设计提供底层假设支撑。

四类目标存在严格互斥性。一项研究若同时宣称‘提升收益’与‘控制波动’,实为两类目标混杂,将导致验证标准冲突(如高收益常伴随高波动)。入门者须在启动前书面声明唯一主目标,并接受其全部验证约束。

4. 六种典型匹配关系与反例诊断

周期状态与研究目标之间存在强逻辑绑定,错误匹配将导致研究失效。以下列出六种经实证检验的典型匹配关系,并附反例说明:

5. 双轨启动检查表的 8 项必填条目与 3 级验证标准

为确保周期判别与目标定义落地,本讲提供结构化检查表。所有条目须在研究文档首页完整填写,缺一不可:

  1. 周期状态标识:明确写出四维状态值(如:Slope_Z=1.42, ADX_60=28.3, LQI_Q=0.21, ΔCorr=-0.11)及对应离散标签(如:强趋势/脉冲型高波动/流动性收缩/行业主导)。

  2. 目标类型声明:从四类中单选,禁止‘兼顾’‘兼顾为主’等模糊表述。

  3. 目标可验证定义:精确到指标名称、计算方式、阈值、时间窗口(如:‘信号发出后3日行业指数涨跌幅AUC,滚动120日窗口,阈值≥0.58’)。

  4. 数据源与更新频率:注明行情、基本面、另类数据的具体字段名与T+0/T+1延迟(如:‘万得行业指数收盘价,T+1 16:30更新’)。

  5. 核心假设清单:列出3条以内支撑本目标成立的必要假设(如:‘假设行业动量在强趋势期具有5日以上持续性’),每条需标注可证伪方式。

  6. 失败熔断条件:定义研究过程中触发终止的客观标准(如:‘若连续20个交易日信号覆盖率<20%,则暂停开发并复核周期判别逻辑’)。

  7. 基线对比方案:指定用于效果评估的基准(如:‘与等权行业组合、行业动量指数、简单持有沪深300对比’),禁止仅与‘随机策略’对比。

  8. 跨周期鲁棒性预案:说明当周期状态切换时,目标是否自动失效、需人工重定义、或存在平滑过渡机制(如:‘当LQI_Q从0.25升至0.35时,流动性约束参数按线性插值从5%调整至8%’)。

三级验证标准:一级为文档完整性(8项全填);二级为逻辑自洽性(如目标类型与周期标签存在前述六种匹配之一);三级为可执行性(所有参数均可从现有数据源导出,无虚构字段)。

6. 七类周期-目标认知陷阱及其数学根源

  1. ‘周期是平稳过程’陷阱:误认为市场周期具有马尔可夫性,可用简单状态转移矩阵建模。实则周期转换存在长记忆效应,如2015年股灾后波动结构恢复耗时18个月,远超常规滚动窗口。解决方案:引入隐马尔可夫模型(HMM)时,必须允许状态持续时间服从伽马分布而非指数分布。

  2. ‘目标可无限分解’陷阱:将‘提升夏普率’分解为‘提升收益’与‘降低波动’两个子目标分别优化。数学上,夏普率是非线性函数,∂S/∂μ ≠ 常数,收益提升1%在低波动区对夏普率拉动远大于高波动区。正确做法:直接优化夏普率代理函数(如Sortino比率)。

  3. ‘周期判别越精细越好’陷阱:试图用10维指标定义周期,导致维度灾难。当维度>6时,四维空间中任意两点欧氏距离趋近,聚类失效。经验法则:四维已覆盖92%的周期解释力,新增维度需通过增量F检验(p<0.05)证明其独立贡献。

  4. ‘目标应适配所有周期’陷阱:设计‘全周期通用’策略,实则牺牲各周期最优解。数学上,策略收益函数f(θ, C)关于周期状态C的偏导∂f/∂C在不同区域符号相反,全局最优θ必然在局部次优。应接受‘周期专精’前提。

  5. ‘流动性仅影响执行’陷阱:将流动性视为交易环节扰动,忽略其对定价机制的根本改变。实证显示,流动性收缩期个股收益率截面标准差下降23%,意味着Alpha空间压缩,此时需提高因子IC阈值(如从0.03升至0.05)。

  6. ‘相关性格局恒定’陷阱:使用全样本相关性矩阵,忽略其周期敏感性。当ΔCorr从正转负时,行业指数协方差矩阵条件数上升4.7倍,导致均值方差优化权重剧烈震荡。必须按周期状态分组估计协方差。

  7. ‘验证标准可事后调整’陷阱:回测不达标时修改目标定义(如将‘5日AUC≥0.6’降为‘≥0.55’)。这违反P-hacking原则,使第一类错误率从5%飙升至32%。所有验证标准须在数据窥探前书面锁定。

7. 四维周期指标的临界阈值实验

为帮助入门者理解参数选择依据,本节展示四维指标关键阈值的敏感性测试结果(基于2010–2023年A股全市场数据):

所有阈值均通过滚动窗口稳定性检验:在任意连续5年子样本中,阈值变动范围不超过±0.05(Slope_Z)、±0.3%(HV_SD)、±0.02(LQI_Q)、±0.005(ΔCorr)。

8. 从个人学习到团队协作的三级推进路径

  1. 个人学习级(第1周)

    • 使用聚宽/掘金平台,下载2020–2023年申万一级行业指数日频数据;
    • 实现四维周期指标计算(Python pandas,禁用任何封装函数,手动编写滚动回归与ADX);
    • 对每个行业,绘制四维状态热力图(横轴时间,纵轴维度,色块深浅表示数值);
    • 任选一个行业,书面填写双轨启动检查表全部8项,交由导师盲审(仅看文档,不看代码)。
  2. 小组协作级(第2–3周)

    • 三人小组分工:A负责周期状态标注与更新,B负责目标定义与验证标准设计,C负责数据源对接与基线实现;
    • 每周五举行‘锚点校准会’,逐条核对检查表,争议项必须引用原始数据截图佐证;
    • 建立‘周期-目标变更日志’,记录每次状态切换时间、原因、目标调整内容及验证结果。
  3. 实盘预备级(第4周)

    • 在模拟盘中部署周期判别模块,每日收盘后自动输出四维状态及离散标签;
    • 将研究目标转化为可执行指令(如:‘若标签=强趋势+行业主导,则启用行业动量子策略,权重=65%’);
    • 连续运行20个交易日,统计状态识别延迟(从收盘到标签输出时间)、目标触发准确率、指令执行偏差率,三项均需≥95%方可进入下一讲。

9. 五种不可建模的周期-目标组合

并非所有周期与目标组合都具备研究价值,以下五种情形应主动放弃:

  1. ‘弱趋势+信号生成型’搭配‘绝对收益目标’:弱趋势期价格运动缺乏方向性,任何绝对收益信号在统计上无法显著区别于随机游走(Dickey-Fuller检验p>0.1)。应转为相对收益目标(如跑赢行业指数)。

  2. ‘流动性收缩+组合构建型’搭配‘高频调仓’:当LQI_Q<0.2时,实证显示日频调仓导致年化冲击成本超12%,吞噬全部Alpha。必须将调仓频率上限设为周频。

  3. ‘脉冲型高波动+风险控制型’搭配‘固定止损阈值’:脉冲波动下价格跳空频发,固定阈值(如-3%)导致92%的止损由跳空触发,丧失风控本意。必须采用波动率自适应阈值(如-1.5×HV_10)。

  4. ‘行业主导+机制验证型’搭配‘个股层面因果推断’:行业主导期个股价格高度同步,Granger因果检验失效(F统计量<临界值)。应升维至行业层面建模。

  5. ‘持续型低波动+信号生成型’搭配‘短期择时’:持续低波动期(HV<10%持续>60日)中,5日级信号AUC中位数仅0.51,无统计意义。应转向中长期配置型目标。

10. 四维周期引擎的最小可行实现(Python伪代码)

# 输入:df_price (index=date, columns=industry_codes), window=250
# 输出:cycle_state_dict {"trend": "strong", "volatility": "pulse", "liquidity": "tight", "correlation": "sector_driven"}

def compute_slope_z(df_price, window=250):
    # 手动计算滚动回归斜率并Z-score
    slopes = []
    for code in df_price.columns:
        series = df_price[code].dropna()
        for i in range(window, len(series)):
            y = series.iloc[i-window:i].values
            x = np.arange(window)
            slope = np.polyfit(x, y, 1)[0]
            slopes.append(slope)
    return pd.Series(slopes).rolling(120).apply(lambda x: (x[-1]-x.mean())/x.std() if x.std()>0 else 0)

# 其余维度同理,禁用talib.adx,手动实现DX与ADX计算
# 最终通过查表法(非插值)映射至离散标签

关键约束:所有计算必须可复现(固定随机种子无影响)、无外部API调用、内存占用<2GB(百万级数据点)。

11. 双轨启动法的本质是建立研究信用体系

量化研究框架的起点,从来不是代码或模型,而是研究者与数据、与市场、与协作方之间建立的‘信用契约’。周期判别是向市场承诺‘我理解你当前的状态’,目标定义是向自己承诺‘我清楚要解决什么问题’。双轨启动法的每一项检查,都是对该契约的具象化签署。它不保证策略盈利,但能确保:当研究失败时,我们能精准定位是‘市场状态误判’还是‘目标定义失当’,而非陷入‘模型不好’的模糊归因。这种可追溯、可证伪、可协作的起点共识,正是量化研究区别于经验投资的核心基础设施。请谨记:没有经过双轨校准的研究,如同未校准的仪器所作的测量——数据再精美,也只是一场精密的幻觉。

12. 第 1 讲最容易走偏的四种开题方式

如果你在第 1 讲就直接开始找因子、调参数、跑回测,而没有先写清楚周期标签和目标类型,那么后面的所有“优化”都很可能只是围绕错误问题的局部修饰。入门阶段最常见的四种走偏方式是:把周期判断写成主观感受、把研究目标写成“想提升收益”这种泛化口号、把验证标准留到回测后再补,以及把不同目标类型混成一个任务包一起做。第 1 讲真正要建立的是开题纪律,而不是结果幻觉。

13. 系列衔接

本讲是《量化研究入门框架》的第 1/8 讲,当前主题是《先定市场周期和目标》。

这是本系列的开篇,重点是把后续实操会反复使用的核心概念、输入输出和判断标准先立住。

下一讲:第 2 讲《把题目缩成最小策略》。

后续安排:第 3 讲《先列一张数据检查表》;第 4 讲《信号规则要少而清楚》。

14. 风险揭示与免责声明

风险揭示与免责声明

本页面内容仅用于量化研究与技术交流,旨在展示研究方法与流程,不构成对任何金融产品、证券或衍生品的要约、招揽、推荐或保证。

本文所涉历史数据、回测结果与示例参数不代表未来表现,也不应作为投资决策依据。

市场存在波动、流动性与执行偏差等不确定性,任何策略均可能出现收益波动或阶段性失效。

读者应结合自身风险承受能力进行独立判断,并在必要时咨询持牌专业机构意见。