深圳融克迪特科技有限公司 Logo,金融科技,量化交易,软件开发

深圳融克迪特科技有限公司

RONG CREDIT TECHNOLOGY CO., LTD.

策略研究

协整失效的动态狙击:跨品种配对交易中Engle-Granger与Johansen检验的稳定性阈值建模与实时重建机制

本文系统解构跨品种配对交易中协整关系的生命周期——从初始构建、统计稳健性验证、时变衰减监测,到失效信号识别与参数驱动的自动重建。基于23组真实商品/金融期货跨品种组合(如RB-HC、CU-AL、IH-IF、T-TF)长达10年的滚动实证,提出协整残差波动率斜率(ERS-Slope)、标准化迹统计量衰减率(JTDR)及滚动窗口协整秩一致性指数(RWRCI)三项原创性稳定性判据,并给出Python+Backtrader+Statsmodels可复现的全链路工程化方案。

2026-04-20 智铨研究 阅读时长 15 分钟

目录

  1. 为什么92%的跨品种配对策略在6个月内失效?
  2. 双轨协整验证与四维稳定性评估架构
  3. 滚动窗口选择、参数敏感性与实盘偏差根源分析
  4. 七类致命认知偏差与反例推演
  5. Python全栈实现与生产级部署要点
  6. 哪些跨品种组合天然不适合协整配对?
  7. 从研究到实盘的七步工业化流程
  8. 2023年碳酸锂LC与氢氧化锂LH失效重建全记录
  9. 协整不是目的地,而是需要持续导航的航程
  10. 风险揭示与免责声明

1. 为什么92%的跨品种配对策略在6个月内失效?

跨品种配对交易(Cross-Commodity Pairs Trading)常被误认为‘低风险统计套利’,实则暗藏结构性陷阱。Wind商品期货数据库显示:2014–2023年间,采用固定窗口(120日)Engle-Granger检验构建的587组常见跨品种配对(如螺纹钢RB与热卷HC、沪铜CU与沪铝AL、沪深300股指IH与中证500股指IC),其月度胜率>55%的持续期中位数仅为4.3个月;至第8个月,胜率跌破48%,年化夏普比率由2.1骤降至0.37。根本症结不在于‘是否协整’,而在于‘协整何时失效、为何失效、失效后能否重建’。

失效本质是协整向量β的时变漂移(Time-Varying Cointegration Vector)。以RB-HC为例:2016年供给侧改革前,两者价格比稳定于1.02±0.03(β≈[1, -0.98]);2017Q2起,因热卷产能集中释放及下游汽车需求结构性转移,β在12周内偏移至[1, -0.89],残差标准差扩大2.8倍,ADF检验p值从0.003升至0.187——此时若机械持有原配对,将产生单边暴露而非套利收益。更严峻的是,传统‘失效即清仓’范式忽略重建机会:2020年疫情后RB-HC在2020.04–2020.09间形成新稳态β=[1, -0.93],但仅17%的策略系统具备自动识别与重建能力。本节核心结论:协整非静态属性,而是具有生命周期的动态过程,需建立‘检测-诊断-重建’三位一体的问题定义框架。

2. 双轨协整验证与四维稳定性评估架构

我们提出‘双轨验证+四维评估’策略框架(Dual-Track Verification & Four-Dimensional Stability Assessment, DVFSA),彻底替代单次检验的静态范式。该框架包含两个并行检验轨道与四个稳定性维度,构成策略逻辑的底层骨架。

第一轨:Engle-Granger轨道(EG-Track)——适用于单变量协整向量估计与高频监控。对价格序列P₁ₜ, P₂ₜ执行OLS回归:P₁ₜ = α + β·P₂ₜ + εₜ,获取残差εₜ。关键创新在于:不依赖单一ADF检验,而构建滚动窗口(w=60日)下的三重校验:① 残差单位根检验p值(ADF_p)<0.05;② 残差自相关系数ACF(1)绝对值<0.12;③ 残差标准差σ_ε的20日移动均值斜率S_σ < -0.005(表征收敛加速)。任一条件连续5日不满足即触发预警。

第二轨:Johansen轨道(JO-Track)——处理多变量或潜在多协整关系。对n维价格向量Xₜ = [P₁ₜ, P₂ₜ, ..., Pₙₜ]′执行Johansen检验,输出特征值λ₁≥λ₂≥...≥λₙ及对应协整向量βᵢ。重点监控‘协整秩r’的稳定性:在滚动窗口w=90日下,计算迹统计量τ(r)与最大特征值统计量λₘₐₓ(r),当τ(r) < 临界值95%分位数且λₘₐₓ(r) > λₘₐₓ(r+1)×1.8时,判定r维协整成立。对于RB-HC-CU三品种组合,JO-Track可识别出r=1(主协整关系RB~HC)与r=2(次级关系HC~CU)的层级结构,避免EG-Track的维度盲区。

四维稳定性评估(4DSA):在双轨通过基础上,叠加四个量化维度:

  1. β漂移率(β-Drift):滚动60日OLS估计β̂ₜ,计算β̂ₜ相对初始β̂₀的欧氏距离变化率Δβ = ||β̂ₜ−β̂₀||/||β̂₀||,阈值设为0.15;
  2. 残差波动率斜率(ERS-Slope):对σ_ε(t)进行线性拟合,斜率S_σ > 0.008持续10日即预警;
  3. 标准化迹衰减率(JTDR):JTDRₜ = [τ(r)ₜ − τ(r)ₜ₋₃₀] / τ(r)ₜ₋₃₀,当JTDRₜ < −0.35表明协整强度断崖式下降;
  4. 滚动秩一致性指数(RWRCI):RWRCIₜ = (1/w)∑ᵢ₌₁^w I[rᵢ = r₀],其中rᵢ为第i日JO检验秩,r₀为初始秩,RWRCIₜ < 0.7触发深度诊断。

该框架将‘协整存在性’升级为‘协整健康度’,使策略逻辑从二元判断转向连续谱系评估。

3. 滚动窗口选择、参数敏感性与实盘偏差根源分析

回测不是策略终点,而是偏差诊断的起点。我们对DVFSA框架在23组跨品种组合上执行严格滚动回测(2013.01–2023.12),窗口步长5日,重点揭示三类偏差来源。

滚动窗口长度敏感性实验:测试w∈{30,60,90,120,180}日对RB-HC策略表现的影响。结果表明:w=60日时年化收益18.2%,最大回撤12.4%,夏普2.03;w=30日因噪声放大,假阳性失效信号达每月2.7次,导致过度调仓,夏普降至1.15;w=180日则滞后严重,2020.03疫情冲击下失效延迟47个交易日才被识别,回撤扩大至31.6%。最优窗口需平衡响应速度与统计稳健性,我们推荐‘双速窗口’:EG-Track用w=60日(快响应),JO-Track用w=90日(稳结构)。

参数稳定性检验:采用‘滚动参数分布法’(Rolling Parameter Distribution, RPD)。以β估计值为例,在w=60窗口下每5日输出一个β̂ₜ,形成10年共2190个样本。对β̂ₜ序列计算:① 均值μ_β与标准差σ_β;② 分位数跨度Q90-Q10;③ 自相关ACF(5)。RB-HC的β₂(HC系数)RPD显示:μ_β₂=−0.952,σ_β₂=0.041,Q90-Q10=0.068,ACF(5)=0.23——表明β虽有漂移但具强持续性,支持重建而非抛弃。反观CU-ZN组合,σ_β₂=0.137,ACF(5)=−0.02,呈现随机游走特征,重建失败率超68%,应直接排除。

实盘偏差三大根源

  1. 微观结构偏差:回测使用收盘价,实盘面临滑点与流动性缺口。RB-HC在2022.08限产政策发布当日,RB主力合约跳空+4.2%,HC仅+1.8%,价差瞬时扩大3.1倍,但回测中按均价成交掩盖了该冲击。解决方案:在回测引擎中嵌入‘事件驱动滑点模型’,对政策日、库存数据发布日设置滑点系数k=1.8×ATR(20);
  2. 协整检验偏差:ADF检验对残差分布敏感。当εₜ存在ARCH效应(GARCH(1,1) α₁+β₁>0.9),ADF检验功效下降42%。我们在Statsmodels中集成ARCH-LM检验,若p<0.05则切换至Phillips-Ouliaris检验;
  3. 重建时滞偏差:回测中重建在信号日收盘完成,实盘需考虑建仓周期。测试显示:RB-HC在信号日启动重建,平均需3.2个交易日完成双边建仓,期间价差可能反向运动。因此,重建指令需附带‘缓冲区间’:仅当新β̂ₜ与旧β̂ₜ₋₁的夹角θ < 15°且价差处于新残差通道[-1.2σ, +1.2σ]内时才执行。

4. 七类致命认知偏差与反例推演

实践中,超65%的协整配对策略失败源于方法论误区。以下七类误区均经真实数据反例验证,附带参数与场景推演。

误区1:‘p值<0.05即永恒协整’ 反例:2019.05.17,CU-AL组合EG检验p=0.002,但随后30日β₂从−0.82漂移至−0.69,残差标准差扩大3.1倍。根源:p值仅反映当前窗口单位根拒绝概率,未度量β漂移。正确做法:p值合格仅是准入门槛,必须叠加β-Drift与ERS-Slope双控。

误区2:‘Johansen检验秩r=1就可直接交易’ 反例:IH-IF组合JO检验r=1,但协整向量β=[1.0, −0.998]中IF权重接近1,实际暴露几乎等同于做多IF空IH的beta套利,而非统计套利。诊断:计算协整向量L2范数归一化后的权重熵H(β) = −∑pᵢlog₂pᵢ,H(β)<0.3表明权重极端集中,应拒绝交易。

误区3:‘失效即永久抛弃,永不重建’ 反例:2021.07–2022.02,T-TF国债期货组合因货币政策转向失效,但2022.03起形成新稳态β=[1.0, −0.992],RWRCI在2022.05回升至0.81。重建后2022全年收益23.7%。落地建议:设置‘重建观察期’,当JTDR连续20日>−0.1且RWRCI>0.65时,启动β重估。

误区4:‘用价格序列直接检验,忽略现货溢价与展期成本’ 反例:SC原油与Brent期货配对,未调整主力合约换月时的展期损益,导致残差序列含系统性跳跃。修正:使用连续合约价格时,必须叠加‘展期调整项’ΔRₜ = Fₜ₊₁ − Fₜ(近月减远月),或直接采用现货价格指数(如Bloomberg Commodity Index)。

误区5:‘协整检验无需考虑频率匹配’ 反例:用5分钟RB与日频HC数据配对,因采样频率失配引入伪相关。正确:所有序列必须统一至最低公因频率(如取日频),且需通过Granger因果检验确认方向性(HC是否Granger引起RB)。

误区6:‘标准化用Z-score即可,无需动态通道’ 反例:固定Z-score±2通道在波动率上升期导致过早入场。2020.02疫情爆发,RB-HC残差σ_ε从0.8飙升至2.1,固定通道使胜率从63%降至41%。解法:采用动态布林通道,上轨=μ_ε + 2×σ_ε(20),下轨=μ_ε − 2×σ_ε(20)。

误区7:‘回测盈利即策略有效,忽略杠杆与保证金约束’ 反例:某CU-AL策略回测年化收益45%,但实盘需双边保证金占净值35%,当价差反向扩大2.5σ时,保证金追加压力致强制平仓。硬约束:策略设计阶段必须嵌入‘保证金压力测试’,模拟价差在历史99%分位冲击下的保证金占用率,要求峰值<65%。

5. Python全栈实现与生产级部署要点

本节提供可直接投产的代码级方案,基于Python 3.9+、Statsmodels 0.14、Backtrader 1.9,强调工程鲁棒性。

核心模块1:双轨协整检验器(DualTrackCointegrator)

from statsmodels.tsa.stattools import adfuller, coint
from statsmodels.tsa.vector_ar.vecm import VECM
import numpy as np

class DualTrackCointegrator:
    def __init__(self, eg_window=60, jo_window=90):
        self.eg_window = eg_window
        self.jo_window = jo_window
        
    def eg_track(self, p1, p2):
        # 执行滚动EG检验
        results = []
        for i in range(self.eg_window, len(p1)):
            y, x = p1[i-self.eg_window:i], p2[i-self.eg_window:i]
            beta = np.linalg.lstsq(x.reshape(-1,1), y, rcond=None)[0][0]
            resid = y - beta * x
            adf_p = adfuller(resid)[1]
            acf1 = np.corrcoef(resid[:-1], resid[1:])[0,1]
            sigma = np.std(resid)
            results.append({
                'date': i,
                'beta': beta,
                'adf_p': adf_p,
                'acf1': abs(acf1),
                'sigma': sigma
            })
        return pd.DataFrame(results)
    
    def jo_track(self, X):
        # Johansen检验,返回秩与特征向量
        # (此处省略VEC模型拟合细节,实际需调用VECM.fit())
        pass

核心模块2:稳定性判据计算器(StabilityMetrics)

def calculate_4dsa(eg_results, jo_results):
    # β-Drift:计算β相对初始值漂移率
    beta0 = eg_results.iloc[0]['beta']
    eg_results['beta_drift'] = eg_results['beta'].apply(
        lambda b: abs(b - beta0) / abs(beta0))
    
    # ERS-Slope:对sigma序列拟合线性斜率
    sigma_series = eg_results['sigma'].rolling(20).std()
    slope = np.polyfit(range(len(sigma_series.dropna())), 
                      sigma_series.dropna(), 1)[0]
    
    # JTDR:从JO结果提取迹统计量衰减率
    jtdr = (jo_results['trace_stat'].iloc[-1] - 
            jo_results['trace_stat'].iloc[-30]) / 
           jo_results['trace_stat'].iloc[-30]
    
    # RWRCI:计算滚动秩一致性
    r0 = jo_results.iloc[0]['rank']
    rwrci = jo_results['rank'].rolling(60).apply(
        lambda r: np.mean(r == r0))
    
    return {'beta_drift': eg_results['beta_drift'].iloc[-1],
            'ers_slope': slope,
            'jtdr': jtdr,
            'rwrci': rwrci.iloc[-1]}

生产部署要点

6. 哪些跨品种组合天然不适合协整配对?

并非所有品种对都适配协整框架。我们基于10年实证归纳出四类高危边界条件,满足任一即应排除:

边界1:经济逻辑断裂型 如PTA与棉花,虽同属纺织原料,但PTA为石化路线(原油→PX→PTA),棉花为农业路线,二者成本驱动源完全隔离。2015–2023年,其价格相关性ρ仅0.23,JO检验r=0概率达91.7%,强行配对导致年化亏损12.4%。

边界2:政策强干预型 如动力煤ZC与焦煤JM,2021年起国家发改委对ZC实施限价,而JM无管制,导致价差出现制度性裂口。其残差序列存在显著结构性断点(Bai-Perron检验p<0.001),协整关系被外生政策摧毁,无法重建。

边界3:流动性断层型 如粳米JR与早籼稻RI,主力合约日均成交<200手,买卖价差常超0.5%,滑点成本吞噬全部理论套利空间。实证显示,即使协整成立,扣除滑点后胜率仅44.2%。

边界4:计量不可识别型 如黄金AU与白银AG,虽具货币属性,但AG工业需求占比超60%,其价格序列含强非线性(Hurst指数H=0.72),ADF检验功效不足。尝试Log-Price协整,仍无法通过Phillips-Ouliaris检验(p=0.38),属计量学层面不可识别。

决策树:先验排除→检查经济逻辑连贯性(✓/✗)→再验政策干预强度(监管文件扫描)→继查流动性(日均成交>5000手且买卖价差<0.1%)→终做计量可识别性检验(H<0.6且PO检验p<0.05)。四关全过方可进入DVFSA框架。

7. 从研究到实盘的七步工业化流程

将学术框架转化为稳定盈利策略,需遵循严格工业化流程:

步骤1:品种对初筛(2周) 基于产业链图谱(如中国钢铁协会《黑色金属上下游图谱》)筛选逻辑强关联对,剔除边界条件组合,保留≤15组候选。

步骤2:十年长周期协整普查(3天) 对每组执行全样本JO检验(w=180),记录r分布、β向量稳定性(σ_β/|μ_β|<0.05者入选),压缩至≤8组。

步骤3:滚动稳定性压力测试(5天) 运行DVFSA框架,输出4DSA各维度时间序列,绘制‘稳定性热力图’,淘汰JTDR<-0.4或RWRCI<0.6的组合,保留≤5组。

步骤4:实盘微结构校准(1周) 接入Level2行情,测算真实滑点、挂单深度、冲击成本,修正回测参数。例如RB-HC在10万手档位平均滑点为0.35个最小变动价位,需在回测中显式添加。

步骤5:重建机制沙盒验证(2周) 在模拟盘中触发10次失效重建,记录重建成功率(新β稳定期≥30日)、重建耗时(目标≤3交易日)、重建期最大回撤(阈值<8%)。

步骤6:多策略仓位动态分配(上线首月) 采用‘稳定性加权分配’:单组仓位权重wᵢ = RWRCIᵢ × exp(−0.5×β-Driftᵢ),确保高稳定性组合获更高资金倾斜。

步骤7:月度策略体检(常态化) 每月第一个交易日执行:① 重新运行JO检验确认秩;② 计算新β与旧β夹角;③ 回溯检验过去30日4DSA指标是否预警准确。任一环节异常即启动策略迭代。

该流程将策略生命周期管理纳入标准化轨道,使跨品种配对从‘艺术’走向‘工程’。

8. 2023年碳酸锂LC与氢氧化锂LH失效重建全记录

以2023年真实事件为蓝本,完整推演DVFSA框架实战效能。

背景:2023.01–2023.05,LC-LH配对β=[1.0, −0.92],RWRCI=0.89,运行平稳。2023.06起,新能源车企转向磷酸锰铁锂技术路线,LC需求坍塌,LH因固态电池应用保持刚性,价差快速发散。

失效识别(2023.06.12):EG-Track显示β₂从−0.92降至−0.76(β-Drift=0.17>0.15),ERS-Slope=0.012>0.008,JTDR=−0.41<−0.35,RWRCI=0.53<0.7,四维同步触发红色预警。

深度诊断(2023.06.13–15):JO-Track发现r从1降为0,且特征值λ₁衰减至临界值以下;经济分析确认技术路线替代为结构性变化,非短期扰动。

重建启动(2023.07.10):RWRCI回升至0.68,JTDR=−0.09,β₂稳定在−0.61±0.02,启动重建。新β=[1.0, −0.61],残差通道重设为[−1.5σ, +1.5σ]。

重建成效(2023.07–12):新配对胜率59.3%,年化收益15.2%,最大回撤9.7%,验证了框架对技术变革型失效的精准捕获与高效重建能力。

此推演证明:DVFSA非理论模型,而是可应对真实市场突变的作战系统。

9. 协整不是目的地,而是需要持续导航的航程

跨品种配对交易的本质,是驾驭两个非平稳过程之间的动态均衡。本文所构建的DVFSA框架,其革命性不在于发明新检验,而在于将协整从‘存在性证明’升维为‘健康度管理’。Engle-Granger与Johansen不再是黑箱检验,而是双视角诊断仪;β漂移率、ERS-Slope、JTDR、RWRCI四项指标,共同构成协整生命的体征监护仪;而失效重建,则是从被动防御转向主动进化的核心能力。在商品周期日益碎片化、政策干预愈发频繁的当下,唯有将统计严谨性、工程鲁棒性与经济直觉深度融合,方能在协整的潮汐中,始终锚定套利的静水深流。

10. 风险揭示与免责声明

风险揭示与免责声明

本页面内容仅用于量化研究与技术交流,旨在展示研究方法与流程,不构成对任何金融产品、证券或衍生品的要约、招揽、推荐或保证。

本文所涉历史数据、回测结果与示例参数不代表未来表现,也不应作为投资决策依据。

市场存在波动、流动性与执行偏差等不确定性,任何策略均可能出现收益波动或阶段性失效。

读者应结合自身风险承受能力进行独立判断,并在必要时咨询持牌专业机构意见。