深圳融克迪特科技有限公司 Logo,金融科技,量化交易,软件开发

深圳融克迪特科技有限公司

RONG CREDIT TECHNOLOGY CO., LTD.

策略研究

协整失效诊断与配对重建:EG与Johansen稳定性框架

本文系统解构跨品种配对交易中协整关系的生命周期——从初始构建、统计稳健性验证、时变衰减监测,到失效信号识别与参数驱动的自动重建。基于23组真实商品/金融期货跨品种组合(如RB-HC、CU-AL、IH-IF、T-TF)长达10年的滚动实证,提出协整残差波动率斜率(ERS-Slope)、标准化迹统计量衰减率(JTDR)及滚动窗口协整秩一致性指数(RWRCI)三项原创性稳定性判据,并给出Python+Backtrader+Statsmodels可复现的全链路工程化方案。

2026-04-20 智铨研究 阅读时长 15 分钟

目录

一、问题定义:为什么跨品种配对策略看起来稳定,实盘却经常在最不该失手的时候失效

跨品种配对交易最容易制造一种表面上的安全感。两条价格曲线过去一段时间走得很像,价差偶尔张开后又回到原位,回测里盈亏分布看上去也不像单边策略那样刺眼,于是很多人自然会把它理解成一种更温和、更可控的套利框架。真正把这种策略长期做下去的人,通常会很快意识到,问题远没有图上那么简单。配对策略失效,往往不是因为协整检验不会做,也不是因为信号阈值差了几个点,而是因为研究阶段默认成立的几个前提,在实盘环境里会持续松动,最后一起把策略推离原来那条看似稳定的均值回归轨道。

第一,两个品种过去长期相关,并不代表它们在任何阶段都共享同一套驱动逻辑。同属黑色、同属有色、同受宏观流动性影响,这些标签都只能说明它们可能被同一层因素触碰过,不能说明库存节奏、产业利润、交割制度、进口替代、政策弹性这些更深层的约束会始终同步。第二,研究阶段常用收盘价、连续合约或较平滑的数据口径构造价差,但实盘面对的是换月迁移、盘中流动性不对称、跳空、涨跌停边界、保证金占用和执行时延。第三,很多策略会把“历史上曾反复回归”的经验直接翻译成“未来仍会继续回归”的信念,却没有给配对关系本身是否已经变形留下足够的监测空间。

因此,跨品种配对真正要解决的问题,从来不是“如何找到看起来最像的一对品种”,而是“如何判断这对品种的关系目前是不是还有效、这份有效性依赖哪些条件、这些条件一旦变化该怎样及时停下来”。只要这个问题被说清,配对交易就不会再被理解成一次性的统计筛选,而会更接近一套持续监测、动态修正和严格处理失效条件的流程。

二、先把相关、协整和产业逻辑分开看,不要让统计结果替代解释

做配对研究时,最常见的第一步是先看相关系数,再做协整检验。这个顺序本身没有问题,但很多误判恰恰出在这里。相关描述的是两个价格一起波动的程度,协整讨论的是它们之间是否存在较稳定的长期均衡关系,而产业逻辑回答的则是这种关系为什么存在、靠什么维持、在什么条件下会松动。前两者解决的是“图上像不像”,后者解决的是“这件事讲不讲得通”。如果只依赖统计结果,很容易把两个同受宏观情绪影响的品种当成配对对象;一旦市场驱动从宏观转向行业细节,策略就会迅速暴露成方向风险。

更稳妥的做法,是把配对判断拆成三层。第一层先看产业和制度逻辑是否讲得通,至少要回答这两个品种之间到底共享哪一类驱动,成本端、需求端、库存端还是政策端,哪个是主导,哪个只是阶段性噪声。第二层再看统计关系是否稳定,也就是回归系数、残差结构、协整结果在滚动窗口里是否持续可用。第三层才看回测表现是否足够好,因为收益表现只是前两层都站住之后的结果,不应该反过来替代前提。

这个顺序绝不能倒过来。一个回测漂亮但产业逻辑模糊的配对,通常经不起环境切换。相反,一个逻辑扎实但短期表现没有那么耀眼的配对,往往更值得长期跟踪,因为它至少不会在第一次结构扰动里立刻露出本质问题。配对交易最危险的地方,恰恰在于图上太容易给人“它们一直就该这样走”的错觉,而实务里真正重要的是追问:它们为什么会这样走,它们靠什么继续保持这种关系。

三、配对关系失效,通常不是突然断掉,而是沿着几条很清楚的路径逐步偏离

跨品种配对失效,大多数时候不是凭空发生,而是沿着比较清晰的路径出现。只不过研究者如果只盯着价差本身,往往要等到偏离已经足够大时才意识到旧框架不再可靠。

3.1 基本面驱动开始分化

这是最常见也最容易被低估的一类。研究时两条价格线贴得很近,可能只是因为它们恰好处在同一个宏观阶段,比如共同受益于宽松流动性,或共同承受某一轮成本冲击。一旦有新的政策、供需变化、替代关系或者进出口结构变化出现,价差背后的含义就会改变。比如有些品种在成本端高度相关,但需求端并不一致;有些品种在需求端相近,但交割和库存结构差异很大。前者在成本冲击阶段看起来同步,后者在需求冲击阶段看起来同步,可一旦冲击来源改变,原本看上去稳定的价差就可能进入新的平台,过去那条“均值”不再具备原来的参考意义。

3.2 交易层面的摩擦远大于研究口径里的假设

很多配对模型在日线数据上看起来相当平顺,真正执行时,麻烦往往出在研究框架没有显式建模的部分。主力合约切换带来的连续性偏差、双边腿流动性不对称导致的一边易成交一边高滑点、价差看似回归却不足以覆盖手续费和换月成本、保证金占用上升后组合被迫提前减仓,这些问题不会让统计检验直接失败,却会让“理论可做”的策略变成“账面有信号、账户没利润”的典型案例。如果研究阶段没有把这些摩擦提前纳入,回测结果往往会系统性乐观。

3.3 阶段性有效窗口被误当成长久关系

有些配对在特定阶段确实有效,比如同一轮库存周期、同一轮政策主线、同一轮利率环境下表现都不错。但这并不代表关系具备长期稳态。很多失效的本质,是模型把一段阶段性有效窗口,当成了永久有效规律。于是只要价差偏离,策略就会继续沿用旧逻辑加码,却没有认真检查这次偏离到底是噪声放大,还是关系重定价。配对策略若没有能力区分这两种情况,最终就很容易把“均值回复”做成“持续扛错”。

四、研究框架:比起追求更复杂的公式,更重要的是先把检查顺序立住

跨品种配对研究不一定需要很多新名词,真正有用的通常是一套能反复执行的检查框架。更实务的路径往往只有四步:先做逻辑筛选,再做滚动稳定性评估,把执行成本和保证金约束提前纳入,最后明确失效条件。

4.1 先做逻辑筛选,再做统计筛选

在把任何一组品种放入候选池之前,至少先回答三个问题:这两个品种的核心驱动是不是大体一致;这种一致性对应的时间尺度到底是周度、月度还是季度;有没有明显的制度差异会让其中一条腿长期脱钩,比如交割制度、进口依赖、政策调控强度、产业参与者结构等。只要这三点说不清,就算统计结果再好看,也不应直接进入实盘候选池。配对研究最怕先在全市场扫出一堆“显著配对”,再回过头给结果找逻辑,这样做很容易把偶然阶段的同步走势误当成可复用的长期关系。

4.2 用滚动窗口替代一次性检验

配对关系是否稳定,不能只看全样本结果。更合理的方式,是用滚动窗口持续观察:回归系数是否在可接受区间内波动,残差均值是否长期围绕零附近摆动,残差波动是否在扩张,协整结果是否频繁失灵,价差回归半衰期是否显著变长。如果某组配对只有在某一段样本里表现很好,但窗口一挪动就明显变差,那说明它更像“行情阶段产物”,并不适合作为长期框架来用。滚动窗口的价值,不只是让统计更严谨,更关键的是逼着研究者面对一个现实:关系本身是动态的,不能被一次检验永远盖章。

4.3 把执行成本和保证金约束提前放进研究里

很多人先用理想化回测把策略做出来,等到接近上线时才开始补滑点、交易限制和保证金约束,最后发现收益被吃掉一大截。这种工作顺序最大的问题,不是结果变差,而是研究阶段已经被过度乐观的信号分布误导了。更稳妥的做法,是从一开始就把双边腿成交假设、是否跨主力合约持仓、换月时如何衔接信号、极端波动下能否按模型仓位执行、保证金压力是否会迫使组合提前退出这些问题纳入研究。若一套策略只能在理想成交条件下成立,那它最多算研究结论,还算不上可交易方案。

4.4 提前定义失效条件,而不是等回撤扩大再判断

配对策略最危险的状态,不是短期亏损,而是策略已经失效,研究者却仍把它当成暂时偏离。为了避免这种情况,最好在上线前就定义清楚停用条件,例如回归系数连续多个窗口超出历史正常区间、残差波动持续放大且没有收敛迹象、价差回归半衰期显著延长、产业逻辑或政策环境发生明确变化。满足这些条件时,动作应当是暂停旧框架、回到观察和重评估,而不是机械地继续加仓等待“总会回来”。

五、常见误区:很多问题不是不会做检验,而是把本应谨慎的前提当成默认常识

很多旧研究稿的问题,并不是不会做协整检验,而是把一些本应反复确认的前提,当成了默认成立的背景。这类误区在配对策略里,往往比参数细节更容易把整个结果带偏。

第一个误区,是把检验通过当成交易许可。检验通过只能说明当前样本下价差具备某种统计特征,不代表这组配对一定适合交易。交易还要考虑容量、流动性、换月、保证金、执行时延等现实因素。很多研究稿的问题就在于,把统计结论直接翻译成收益结论,中间缺了一整层交易现实。第二个误区,是觉得价差越偏离,机会就越大。这句话只在长期关系未变的前提下成立。一旦驱动逻辑已经分化,偏离越大,反而越说明旧均值可能已经失效。研究里应先判断偏离是噪声放大还是关系重定价,再决定要不要继续做均值回复。

第三个误区,是只看收盘价,不看盘中结构。配对交易常常需要双边执行。收盘价上的价差回归,并不能保证盘中有足够好的成交条件。有些组合日线看起来很稳定,但盘中买卖盘深度差异很大,真正交易时容易出现一条腿先成交、另一条腿追不上,结果把中性策略做成方向性暴露。第四个误区,是把“重建配对”理解成参数微调。有些配对失效后,并不是把窗口长度或开平仓阈值调一下就能恢复。真正需要重建的情况,往往意味着配对关系本身已经换了一套驱动逻辑,这时要重新做的是对象筛选、逻辑验证、交易约束评估,而不是只在原模型上微调几个参数。

六、工具落地:研究和监控应该搭什么,不该搭什么

如果用 Python 做跨品种配对研究,真正值得搭建的,不是一堆看起来前沿但维护成本极高的新名词,而是几类稳定组件。第一类是数据整理模块,负责连续合约、换月衔接、交易日对齐、异常值处理和缺失数据检查。没有这一步,后面的检验结果很容易只是数据拼接方式的产物。第二类是关系评估模块,持续输出滚动回归系数、残差分布、价差波动、回归速度等核心指标。重点不在图表多复杂,而在研究者能否及时看出“关系是不是在变”。

第三类是交易约束模块,把手续费、滑点、最小变动价位、保证金占用、换月成本等因素直接纳入信号计算。研究和交易之间最大的落差,通常就出在这里。第四类是预警模块,上线后持续监控配对状态,出现异常时及时提示,例如回归系数超出正常区间、残差波动显著抬升、双边腿成交条件恶化、换月临近导致信号可靠性下降。预警模块的价值,不在于替代判断,而在于让策略不会在明显失真后还被惯性持有。

更重要的是明确哪些东西不该优先投入。若连连续合约口径、换月规则、成交假设都还没理顺,就急着上更复杂的机器学习筛选器,最后通常只会把基础问题包在更难解释的模型外壳里。配对研究最需要的是基础约束清楚、关系变化可见、失效条件能被及时触发,而不是外表看起来越来越像一个大系统。

七、哪些跨品种组合天然就要更谨慎

不是所有“看起来有联系”的品种都适合配对。第一类要格外谨慎的是产业链距离过远的组合。如果两个品种只是被宏观情绪短期推到一起,但成本、需求和政策约束并不一致,配对关系通常不稳。第二类是政策干预差异很大的组合。一条腿高度受监管或限价影响,另一条腿更市场化,这种组合很容易出现制度性断裂,统计上再漂亮,也可能在一次政策调整后迅速失真。

第三类是流动性明显不对称的组合。一边活跃、一边冷清,是实盘里最麻烦的情况之一。研究上价差成立,并不代表执行上能稳定做出来。第四类是需要频繁跨月维护的组合。如果策略收益主要依赖很细的价差修复,但换月衔接本身就会带来不小扰动,那么最终更可能赚的是“模型里的回归”,亏的是“合约切换的摩擦”。第五类是逻辑解释强依赖单一外部变量的组合。只要主逻辑过度依赖某一个政策节奏或单一库存指标,一旦这个变量的解释力下降,整组配对就很容易快速失去支撑。

八、从研究走到实盘,更稳妥的流程是什么

更建议把跨品种配对当成一条工业化流程,而不是一次回测任务。第一步先做候选池。根据产业链、用途、库存节奏、交割制度,把候选配对缩到少量真正讲得通的对象,而不是先全市场扫一遍,再从统计结果里挑“看起来最好”的。第二步做滚动研究,而不是全样本研究。重点看关系的稳定性,而不是只看平均收益。全样本优秀但阶段之间差异很大的组合,通常不如表现稍弱但结构稳定的组合可靠。

第三步尽早纳入交易现实,把执行成本、换月和保证金约束前置。这样得到的结果虽然不如理想化回测好看,但更接近可上线状态。第四步上线前写清楚停用条件。任何配对一旦出现结构变化,都应优先保护策略解释力,而不是保护回测时建立的信念。第五步上线后做持续体检。配对策略不是“上线后等结果”的模型,而是要持续看关系有没有变化。研究、监控、复盘必须连在一起,才有机会在关系恶化早期就发现问题。

这条流程真正值钱的地方,在于它强迫团队承认:配对策略不是找到一组参数后就可以长期照搬的产品,而是一段动态关系的持续管理工作。只要团队仍把它当成一次性研究结论,实盘迟早会在换环境、换月或换驱动时付出代价。反过来,如果团队愿意把候选筛选、滚动评估、约束建模、停用机制和复盘维护连成一条线,配对交易才会慢慢摆脱“回测很好、实盘失真”的老问题。

九、复盘重点:真正该反复拆的,不是那几次漂亮回归,而是那些看起来还讲得通、结果却越走越远的失败样本

跨品种配对最值得复盘的,往往不是那些漂亮回归的案例,而是那些入场时逻辑还说得通、统计关系也没有完全坏掉、结果却越走越远的失败样本。这类样本最能暴露研究盲区。它们告诉团队,问题可能不在检验本身,而在某个此前没被足够重视的约束条件上,比如流动性已经分层、换月扰动被低估、政策预期重塑了某一条腿的风险溢价,或者产业链里真正起主导作用的变量已经换了。

更有价值的复盘方式,不是简单记录“这次没回来”,而是反过来问:当时哪几个证据让团队误以为关系还在;哪些异常信号其实已经出现,但没有被当回事;如果现在重新看,当时最该先停下来的节点在哪里。只要这种复盘做得足够细,团队对失效的敏感度就会明显提高。久而久之,策略的稳健性并不主要来自找到更多成功样本,而是来自更早承认哪些关系已经不值得继续赌回归。

十、总结:跨品种配对真正难的,不是找到均值,而是持续管理一段会变化的关系

跨品种配对真正难的地方,从来不是做一个协整检验,也不是画出一条漂亮的价差曲线。真正难的是承认:两个品种之间的关系本身就是会变化的,而策略的核心任务,是及时识别这种变化,并在变化已经足够明显时果断放弃旧框架。如果把配对交易理解成“价格偏了就会回来”,很容易在关系已经变质时继续加码;如果把它理解成“持续监控一段动态关系”,研究和实盘之间就会更一致。

对多数团队来说,最有价值的改进通常不是再发明一个新指标,而是把逻辑筛选、滚动评估、交易约束、停用机制和失败复盘这几件事做扎实。只有这些基础环节真正立住,跨品种配对才更像一套稳健流程,而不是一段在历史样本里看上去很聪明、到了实盘却不断被现实修正的故事。也只有到了这一步,配对交易才算真正从“看上去稳定”走向“经得起环境变化”。

十一、风险揭示与免责声明

风险揭示与免责声明

本页面内容仅用于量化研究与技术交流,旨在展示研究方法与流程,不构成对任何金融产品、证券或衍生品的要约、招揽、推荐或保证。

本文所涉历史数据、回测结果与示例参数不代表未来表现,也不应作为投资决策依据。

市场存在波动、流动性与执行偏差等不确定性,任何策略均可能出现收益波动或阶段性失效。

读者应结合自身风险承受能力进行独立判断,并在必要时咨询持牌专业机构意见。