入门框架
本讲系统阐释量化研究启动阶段的核心前置动作——市场周期判别与研究目标定义。通过结构化周期维度(趋势强度、波动结构、流动性分位、相关性格局)、目标类型谱系(信号生成型、风险控制型、组合构建型、机制验证型)及二者间的逻辑耦合规则,构建可执行的双轨启动检查表。详解常见误判场景、参数敏感性边界与跨周期目标漂移的预警信号,为后续最小策略拆解与数据检查奠定不可逆的起点共识。
很多刚开始做量化的人,一上来最关心的是工具和模型。用什么因子库、什么回测框架、什么机器学习算法,仿佛只要技术栈选对了,研究就会自然往前推进。真正做一段时间后通常会发现,最容易让研究失焦的,并不是技术本身,而是开题时没有把两个问题说清楚:当前市场究竟处在怎样的可研究状态里,这次研究到底要解决哪一种明确问题。
如果这两个问题不先定下来,后面很多努力都会变成一种看起来很忙、实际上没有锚点的推进。你可能在样本内把指标调得很好看,却不知道那套逻辑只适用于某个特殊阶段;你可能拿到一组不错的回测结果,却发现根本落不到真实调仓频率和容量约束上;你也可能在团队里和别人讨论半天,最后才发现彼此讲的根本不是同一个研究目标。第 1 讲之所以要先定市场周期和目标,核心作用不在增加流程感,而在避免后面所有工作都建立在模糊前提上。
真正像样的量化研究,起点不是“我想试个什么模型”,而是“我现在面对的是哪种市场状态,我想回答的是哪一个可验证问题”。只要这两个锚点先立住,后面的数据、信号、回测和风控讨论才会有共同语言。
很多入门资料讲市场周期,喜欢直接用牛市、熊市、震荡市三类去概括。对聊天和概念理解来说,这么说没问题;但对真正要落进研究框架的量化任务而言,这种分类太粗了。因为它不能告诉你当前市场到底是趋势强但波动大,还是趋势弱但个股分化强;也不能告诉你流动性是紧还是松,行业是一起动还是个股各走各路。
更有用的做法,是把周期理解成一个多维状态,而不是一个单一标签。至少有几层是研究里很难绕开的。第一层是趋势强弱,也就是市场到底有没有比较清楚的方向性。第二层是波动结构,是短时脉冲式放大,还是低波动慢磨。第三层是流动性状态,它直接影响换手、滑点和小市值策略能不能做。第四层是相关性格局,即当前是行业主导还是个股分化主导。
只要把周期拆到这个程度,你就会发现很多原本混在一起的研究场景开始分开了。比如“趋势强、波动高、行业联动强”和“趋势弱、波动低、个股分化明显”看上去都可以被叫成某种市场阶段,但它们对策略类型、样本构造和验证标准的要求完全不同。量化研究真正需要的,不是一个方便说出口的周期标签,而是一个足够支撑方法选择的状态描述。
研究目标同样最容易被写得太大。很多人会说“想提高收益”“想降低回撤”“想做一个稳健策略”。这些表述并不是完全没意义,但它们无法指导具体研究设计。因为几乎所有研究都能声称自己在做这些事,而这些目标之间本身也经常存在冲突。你若不先选一个主问题,后面很容易一边想追求短期信号,一边又要求低换手和低波动,最后什么都想兼顾,反而什么都没讲清。
更可用的办法,是把目标压成一类清楚的问题。比如这次研究的主问题是生成信号,还是控制风险,还是验证一种机制,还是做组合分配。信号生成型问题关心的是:在某类周期里,能不能稳定识别出未来方向或强弱。风险控制型问题更关心:在波动和流动性压力下,能不能守住某个风险边界。组合构建型问题关注的是:几个子策略怎么在不同市场状态下分权。机制验证型问题则不一定直接产出交易动作,它更像是在问:某种市场现象到底是不是统计上稳、经济上也说得通。
只要目标类型先定清楚,后面很多混乱会自动消失。你不会再一边做机制验证,一边又急着用它去做日频信号;也不会把风险控制研究硬包装成收益增强研究。真正好的研究开题,不是把目标写得多雄心勃勃,而是把主问题缩得足够清楚。
周期和目标一旦都定义出来,下一步不是分别存档,而是看它们能不能匹配。因为不是任何目标都适合在任何周期里展开。
比如在趋势很强、方向很清楚的阶段,最自然的问题通常是信号生成或趋势延续判断,因为市场本身提供了可以跟踪的结构。这时如果你硬做短周期反转,往往会陷入不断逆势试错。反过来,在趋势弱、波动收敛、个股分化明显的阶段,做行业级趋势追踪通常效果有限,反而更适合做横截面筛选、事件驱动或机制验证。流动性收缩时,研究重点也往往会从“我能抓多少 Alpha”转成“我还能不能在不明显放大冲击成本的情况下稳定执行”。
这就是为什么周期和目标一定要一起写。你不能只说“我要研究行业轮动”,还得说是在什么样的周期背景下研究行业轮动;也不能只说“我要做风险控制”,还得说主要是为哪一种压力场景设计。只要这层匹配关系没建立,后面的研究很容易出现一种表面勤奋、底层错位的情况:方法是认真的,问题却选错了。
量化研究开题最容易出问题的地方,不是没有想法,而是想法太散、太虚。更稳的做法,往往不是写一大段背景分析,而是强制自己先填一张最小检查表。内容不需要花哨,但至少应包含几项核心信息:当前周期状态怎么定义,主目标是哪一类,可验证标准是什么,用什么数据,核心假设有哪些,失败时什么情况下要主动暂停。
这张表的价值在于,它能把模糊表述逼成明确句子。比如你不能只写“当前市场波动较大”,而要说是短期脉冲式高波动,还是持续型高波动;也不能只写“目标是提升策略表现”,而要写清楚到底想提升信号命中率、降低回撤,还是验证某个因子关系。再比如你若写不出失败条件,往往意味着你还没真正想清楚研究的边界。
很多初学者会觉得这种表格化很僵硬,但实务里恰恰是这种看似保守的动作,最能节省后面大量返工。因为一旦目标、周期、验证标准和数据源先锁定,后续不论研究成败,都能知道问题出在哪一层,而不会陷进“感觉方向没错,只是结果不理想”的含糊状态里。
量化研究起步阶段,最容易出现的错误其实不是数学错误,而是问题定义错误。常见情况有几类。第一,把周期判断写成主观感受,比如“最近市场情绪一般”“感觉板块轮动快”,这类描述既不可验证,也无法映射到后面的方法选择。第二,把目标写成泛口号,如“提升收益”“兼顾收益和回撤”,听起来全面,实际上没有研究指向。第三,把多个目标混在一起,既想生成择时信号,又想做风险控制,又想顺便解释市场机制,最后导致验证标准互相打架。第四,是回测跑完后再倒着修改目标,把本来定高的标准往下调,把本来模糊的目标补成看起来合理的故事。
这些误区共同的问题在于,它们让研究失去了可证伪性。你总能事后解释为什么结果不理想,却很难在研究开始前说清楚怎样算成功、怎样算失败。可没有失败标准的研究,往往也没有真正的成功标准。第 1 讲最该守住的,就是不允许自己把研究起点写成“反正先试试看”。
如果你想让量化研究起步更稳,一个更现实的顺序通常是这样的。先判当前市场状态,至少把趋势、波动、流动性和相关性格局大致讲清楚。再定本次研究的唯一主问题,例如信号生成、风险控制、组合分配或机制验证。只有这两步都完成了,才开始选数据、选因子、选模型和设计回测。
这个顺序的意义很大。因为它会强迫你把“方法”放在“问题”之后,而不是倒过来。很多研究失败,本质上不是方法不够强,而是研究者先爱上了某个模型或某套框架,然后才去倒找一个适合它的问题。这样的研究往往会越做越复杂,却越来越偏离真实场景。相反,若先把状态和问题定清楚,方法选择会自然得多。你会更容易知道当前是该做趋势型信号,还是做风险防守;是该看行业层面,还是看个股层面;是该追求灵敏,还是追求稳健。
对个人研究者来说,先定周期和目标可以减少返工;对团队来说,这一步的价值更大。因为团队里最常见的低效,不是没人会写代码,而是每个人默认的前提不同。有人觉得当前是趋势市,有人觉得是轮动市;有人以为这次研究的任务是增强收益,有人却按风险控制去设计验证。表面上大家都在推进,实际上却是在不同语境里同时工作。
把周期和目标写成明文,最大的好处就是让前提显性化。你不需要指望每个人“自然理解一致”,而是让每个人都能看到这轮研究到底基于什么市场判断、服务什么主问题、用什么标准验收。只要这一层共识先建立,后面的数据清洗、特征工程、回测设定和风控嵌入都会顺得多。
量化研究说到底不是一个人和电脑的游戏,它经常是一个团队围绕同一问题做不同分工。前提不清时,最耗时间的往往不是技术实现,而是反复对齐语义。第 1 讲把这件事先做了,后面很多无形摩擦都会少很多。
很多研究开题文档会认真写“要做什么”,却很少写“这轮明确不做什么”。看起来像个小缺口,实际上非常影响执行效率。因为量化研究一旦开始,新的想法会不断冒出来:要不要顺便加个行业中性,要不要再试一个高频版本,要不要把期货样本也一起带上。若开题时没有把边界写清楚,团队很容易在这些“顺便做一下”的请求里不断扩张范围,最后把本来可以很快验证的问题拖成一个庞大而模糊的工程。
因此,真正稳的研究起点,除了写清当前周期判断和主目标,还应该顺手列出这轮暂时不做的内容。比如不做跨市场迁移、不做分钟级频率、不讨论生产部署、不兼顾组合分配。只要这些边界先写出来,后面每次有人提出扩展方向时,就能先判断它是不是当前轮次的问题,而不是默认一切都该并进。
这件事对研究质量也有好处。因为目标越窄,可验证性越强。你越明确地知道这轮不解决什么,就越容易把有限精力压到真正关键的问题上,而不是被各种“听起来也重要”的旁支拖散。
市场周期和研究目标说清楚之后,最好不要停在抽象层,还要把验证窗口也顺手先写出来。也就是你打算用哪一段时间验证这次研究结论,样本内和样本外大致怎么分,哪些时间段被视为关键压力窗口。这个动作看起来更像回测设计,但其实它与开题紧密相连。因为如果验证窗口一直不写,后面很容易在结果出来后再倒着挑时间段,让研究失去约束。
提前写验证窗口的意义,在于把“周期判断”真正落到数据层。你既然说当前关注的是高波动阶段,那验证里就应该能看到高波动窗口;你既然说目标是风险控制,那就不该只拿最顺的上涨段来证明策略有效。换句话说,周期和目标不是嘴上说清楚就够了,它们还必须在验证窗口选择上留下痕迹。
对入门研究者来说,这一点尤其重要。因为很多人不是没有研究意识,而是容易在数据选择上临时随意。只要第 1 讲就把“验证窗口必须跟着主问题走”的意识建立起来,后面很多偏题都会自然减少。
量化研究真正稳的起点,不是先找模型、先跑回测,而是先把市场周期和研究目标讲清楚。周期决定你面对的是怎样的市场结构,目标决定你究竟要解决什么问题。只有这两个锚点先立住,后面的数据、信号、验证和风控才有共同坐标。否则,无论技术细节多完整,最终都可能只是围绕一个模糊问题做出的精密幻觉。
本讲是《量化研究入门框架》的第 1/8 讲,当前主题是《先定市场周期和目标》。这一讲的任务,是把整个系列后面会反复用到的研究起点先校准好。下一讲将进入《把题目缩成最小策略》,继续把“大方向上的研究想法”压缩成可以实际验证和迭代的最小策略问题。
风险揭示与免责声明
本页面内容仅用于量化研究与技术交流,旨在展示研究方法与流程,不构成对任何金融产品、证券或衍生品的要约、招揽、推荐或保证。
本文所涉历史数据、回测结果与示例参数不代表未来表现,也不应作为投资决策依据。
市场存在波动、流动性与执行偏差等不确定性,任何策略均可能出现收益波动或阶段性失效。
读者应结合自身风险承受能力进行独立判断,并在必要时咨询持牌专业机构意见。