【CatBoost 系列第6讲】概率输出与风险分层在选股模型中的应用

一、为什么 CatBoost 的概率输出不能被直接当成“仓位大小”，这是很多团队最容易踩的第一坑
二、为什么有些量化任务更适合先改写成分类问题，而不是强行做回归
三、为什么predict_proba最该被理解成“相对排序信号”，而不是收益率承诺
四、为什么比起“概率直接映射仓位”，先做分层通常更稳得多
五、为什么概率校准和排序能力是两件不同的事，混在一起会让判断失真
六、为什么高概率不等于可以无上限加仓，因为交易世界还有容量、换手和风险预算
七、为什么这一讲真正建立的，是“输出层治理”而不是只会取一个概率列
八、这一讲为后续跨市场迁移和更复杂落地准备了什么
九、为什么这一讲做完后，最好已经形成“输出不是答案，而是待治理对象”的认识
十、这一讲也在帮你建立“输出层评估要独立成层”的意识
十一、总结
十二、系列衔接
十三、风险揭示与免责声明

CatBoost · 工具实战

一、为什么 CatBoost 的概率输出不能被直接当成“仓位大小”，这是很多团队最容易踩的第一坑

CatBoost 做分类任务时，最容易让人产生行动冲动的输出就是概率。看起来它比单纯的 0/1 分类更细腻，也比连续回归值更像“可以直接拿来决策”的东西。很多团队训练出一个分类模型以后，下一步就会自然想着：既然这只股票上涨概率是 0.82，那是不是就应该比 0.61 的样本多配很多仓位？这个想法非常常见，也非常危险。因为概率输出和可直接映射成仓位的信号之间，还隔着好几层必要处理。

问题的根源在于，CatBoost 的概率首先是在当前标签定义和当前训练样本分布下，对“更像正样本”的一种相对置信刻画。它不是收益率预测，也不是风险调整后的收益承诺，更不自带容量、换手、回撤约束。你如果把这个数字直接当成仓位大小，就会把模型排序能力、概率刻度和交易执行三件本来不同的事情硬压到一个数字里，最后非常容易高估模型的实际可用性。

所以，本讲最先要讲清楚的，不是 predict_proba 怎么调用，而是概率输出在量化落地里真正应该扮演什么角色。只要这个角色没先放准，后面的分层、分组和仓位设计都会很容易跑偏。

二、为什么有些量化任务更适合先改写成分类问题，而不是强行做回归

很多人默认量化建模就该做回归，因为未来收益本来就是连续值，似乎这样最“原汁原味”。这个逻辑表面上很顺，但在实际落地里并不总是最稳。因为真实的未来收益标签往往噪声很大，且交易动作未必要求你精确预测一个连续数值。很多时候，你真正关心的是：从一批资产里，谁更值得进候选池，谁更像高质量样本，谁更可能在未来一段时间跑赢基准。

在这种任务下，把问题改写成分类，反而往往更贴近下游动作。比如未来 5 日是否跑赢基准、未来 10 日是否进入横截面前 30%、未来阶段性回撤是否低于某个阈值，这些标签都比直接回归未来收益更容易与筛选逻辑对接。CatBoost 的概率输出也因此更容易被解释为“属于优质样本的相对可能性”。

因此，本讲在谈概率输出之前，必须先强调一件事：只有当你的任务本身更适合分类化表达时，概率输出才会自然地进入后面的分层和分组工作流。否则，一开始任务定义就没贴近交易目标，后面的概率再细也不一定好用。

三、为什么predict_proba最该被理解成“相对排序信号”，而不是收益率承诺

一旦模型已经是分类任务，很多人接下来会顺理成章地把 predict_proba 读成“上涨概率”。这种说法不是完全错，但如果停在这里，容易引发过度直觉化的误用。更稳的理解是：predict_proba 给出的是在当前训练定义下，一个样本更像正类历史模式的相对置信度。它首先是排序信号，其次才是概率刻度。

这个区别非常重要。因为在量化落地里，真正更稳的用途往往不是“把 0.82 当成会涨 82% 的承诺”，而是把 0.82 和 0.61、0.47 放在一起比较，看看谁更值得排在前面。模型只要排序能力扎实，即便概率刻度不完美，也依然可能有不错的选股价值。相反，如果你过早把它当成绝对概率去设计仓位，就会把本来只是一个相对排序输出，误当成可以直接承担风险预算的精确刻度。

所以，本讲第一层真正要建立的，是把概率输出先理解成排序信号。只要这个顺序意识先立住，后面的分层和校准才会更自然。

四、为什么比起“概率直接映射仓位”，先做分层通常更稳得多

对量化团队来说，概率真正落地时最稳的路径，往往不是一个线性公式把它直接转成仓位，而是先按概率做分层。也就是说，先把全市场样本按概率从高到低排序，再切成若干层或若干桶，观察每一层的后验表现、回撤、换手和容量，再决定哪些层适合进候选池。这个过程听起来比“概率乘个系数就是仓位”麻烦一些，但它稳得多。

分层之所以更稳，有几个原因。第一，它能显著降低模型小幅波动被仓位无限放大的风险。第二，它更符合量化研究从信号验证到交易规则落地的常见路径。第三，它让你更容易直接检查“高分层是否真的整体更好”这件事，而不是一上来就在个体样本层面做过细决策。尤其当概率刻度还没充分校准时，分层是非常有价值的缓冲层。

因此，本讲很强调“先分层，再谈仓位”，不是因为分层显得保守，而是因为它更符合把模型信号逐步落地的稳健顺序。对很多团队来说，这一步能避免大量后续误用。

五、为什么概率校准和排序能力是两件不同的事，混在一起会让判断失真

很多人做分类模型时，只要看到 AUC 或排序效果不错，就会自然推断概率本身也很可靠。这个推断并不总成立。排序能力和概率校准其实是两件不同的事。模型可能非常擅长把更优样本排到前面，但它给出的 0.9、0.7、0.55 这些数值本身，并不一定和真实命中率严格对应。换句话说，它可能很会排序，却不一定很会把概率刻度压在正确区间里。

这对量化落地非常关键。因为如果你只是做分层排序，排序能力往往已经足够有用了；但如果你打算用概率阈值触发交易、控制风险额度，或者直接把概率和仓位绑定，那校准问题就变得非常重要。此时再只看 AUC 就不够了，你还得去看不同概率桶里的真实命中率是否大体匹配、模型在不同阶段里概率区间有没有明显漂移。

因此，本讲一定要先把这两件事拆开讲。否则你很容易因为“排序还不错”而过度相信概率刻度，最后在仓位层踩坑。

六、为什么高概率不等于可以无上限加仓，因为交易世界还有容量、换手和风险预算

这是概率落地里最值得反复提醒的一点。即便某个样本的正类概率明显高于其他样本，也不意味着你就可以无限上调它的仓位。因为交易世界里的限制，从来不只有模型信号。容量、流动性、换手成本、组合分散度、单标的风险预算、行业暴露约束，这些都会对仓位决策产生比概率本身更硬的边界。

也正因为如此，概率输出真正该扮演的角色，往往更像“候选优先级”或“分层依据”，而不是仓位唯一决定器。高概率样本可以帮助你进入更高优先级的候选池，但具体配多少，还得经过一层组合和风险约束处理。只要团队忽略了这一层，很容易出现一种典型误区：模型分数看起来很漂亮，组合却因为集中度和冲击成本失控而表现很差。

所以，本讲反复强调概率不能直接生硬映射仓位，本质上是在给模型输出加上一层现实交易约束视角。这一步非常重要，因为它会让你的研究更早贴近真正可执行的策略形态。

七、为什么这一讲真正建立的，是“输出层治理”而不是只会取一个概率列

从整个 CatBoost 系列往前看，你已经学过模型定位、输入规范、时间切分、事件样本和解释性。这些都主要发生在输入和模型层。而到了本讲，重点开始转向输出层。也就是模型已经给你一个概率列了，接下来你到底怎么读它、怎么分桶、怎么分层、怎么转进候选池、怎么避免过度使用这个数字。这一整套，其实可以概括为输出层治理。

这层治理非常重要，因为很多量化项目最后不是败在模型完全没信号，而是败在输出层过于粗糙。模型原本也许能提供稳定排序，但团队直接把概率当仓位；或者模型概率其实只适合做 5 桶分层，却被硬拿去做连续风险定价。这些都属于输出层治理不足。只要这一层先建立起来，模型的真实可用性才会被更准确地看出来。

因此，本讲不是在教你多会一条 API，而是在帮你把模型输出和交易动作之间那段最容易被简化、也最容易出错的桥梁搭起来。这个桥梁对量化落地极其关键。

八、这一讲为后续跨市场迁移和更复杂落地准备了什么

只要概率输出已经被正确地理解成排序和分层工具，后面的跨市场迁移和不同资产域适配才会更有基础。因为一旦市场从 A 股切到期货、从股票切到别的资产，概率本身的绝对刻度很可能会发生变化，但分层逻辑和输出治理思路仍然成立。你依然会先看排序、看分层单调性、看概率校准、看候选池容量，而不是直接把一个新的概率列原样塞进老的仓位公式里。

也就是说，本讲其实是在给更复杂的跨域使用提前打底。你开始知道，模型输出不是一个可以脱离市场结构和交易约束独立存在的数，而必须被放回具体资产域和执行框架里解读。这个意识一旦建立，后面的迁移讨论就不会停留在“模型能不能泛化”，而会更自然地延伸到“输出规则该怎么一起迁移和重估”。

所以，本讲虽然看起来聚焦在一个概率列，实际上却在为更大范围的模型落地能力打基础。

九、为什么这一讲做完后，最好已经形成“输出不是答案，而是待治理对象”的认识

很多人第一次看到模型给出概率时，会天然把它当成答案，好像数值越高就越接近最终交易动作。第 6 讲更值得建立的认识是，输出首先是待治理对象，而不是现成答案。它需要被排序、被分层、被校准、被放进候选池容量和风险约束里重新解释。只要这层认识已经建立，你就不会再轻易把一列概率直接等同于仓位指令。

这种认识很关键，因为它会直接改变后面做迁移和上线时的心态。你会更习惯先问“这列输出应该怎么被治理”，而不是急着问“它能不能直接拿去交易”。

十、这一讲也在帮你建立“输出层评估要独立成层”的意识

概率输出还有一个非常重要但常被忽略的点，就是输出层评估本身应该独立成层。也就是说，哪怕模型训练指标已经不错，你仍然需要单独检查分桶表现、层级单调性、校准误差和候选容量约束。第 6 讲其实就是在训练这种分层意识。训练层回答“模型学得怎样”，输出层回答“这个结果怎样才能被安全使用”，两者不能混成一件事。

这层分层意识对真实落地非常重要。因为很多问题不是模型没学到，而是输出在进入执行前没有经过足够治理。第 6 讲先把这一层立住，后面的跨市场适配才真正有基础。

十一、总结

这一讲的重点，不只是知道 predict_proba 能返回一个概率列，而是理解这个概率首先是排序信号，其次才是刻度值。你需要先确认任务是否更适合分类表达，再把概率输出先做分层和分桶分析，而不是直接映射成仓位，同时清楚排序能力和概率校准并不是一回事，高概率也不等于可以无上限加仓。只要这些输出层治理原则先建立起来，这一讲就真正完成了。

十二、系列衔接

本讲是《CatBoost量化建模完整学习计划》的第 6 讲，当前主题是《CatBoost 概率输出与风险分层在选股模型中的应用》。上一讲已经讨论了训练完成后怎样用解释性结果复核模型逻辑和异常样本，这一讲则进一步把视角推进到输出层，讨论概率如何真正转成可执行的分层规则。下一讲会继续往更复杂的落地方向走，讨论 CatBoost 在跨市场迁移时，A 股和期货等不同数据域之间该如何做输入和输出适配。

十三、风险揭示与免责声明

风险揭示与免责声明

本页面内容仅用于量化研究与技术交流，旨在展示研究方法与流程，不构成对任何金融产品、证券或衍生品的要约、招揽、推荐或保证。

本文所涉历史数据、回测结果与示例参数不代表未来表现，也不应作为投资决策依据。

市场存在波动、流动性与执行偏差等不确定性，任何策略均可能出现收益波动或阶段性失效。

读者应结合自身风险承受能力进行独立判断，并在必要时咨询持牌专业机构意见。

深圳融克迪特科技有限公司

【CatBoost 系列第6讲】概率输出与风险分层在选股模型中的应用

目录

CatBoost · 工具实战

一、为什么 CatBoost 的概率输出不能被直接当成“仓位大小”，这是很多团队最容易踩的第一坑

二、为什么有些量化任务更适合先改写成分类问题，而不是强行做回归

三、为什么predict_proba最该被理解成“相对排序信号”，而不是收益率承诺

四、为什么比起“概率直接映射仓位”，先做分层通常更稳得多

五、为什么概率校准和排序能力是两件不同的事，混在一起会让判断失真

六、为什么高概率不等于可以无上限加仓，因为交易世界还有容量、换手和风险预算

七、为什么这一讲真正建立的，是“输出层治理”而不是只会取一个概率列

八、这一讲为后续跨市场迁移和更复杂落地准备了什么

九、为什么这一讲做完后，最好已经形成“输出不是答案，而是待治理对象”的认识

十、这一讲也在帮你建立“输出层评估要独立成层”的意识

十一、总结

十二、系列衔接

十三、风险揭示与免责声明

【CatBoost 系列 第6讲】概率输出与风险分层在选股模型中的应用

目录

CatBoost · 工具实战

一、为什么 CatBoost 的概率输出不能被直接当成“仓位大小”，这是很多团队最容易踩的第一坑

二、为什么有些量化任务更适合先改写成分类问题，而不是强行做回归

三、为什么predict_proba最该被理解成“相对排序信号”，而不是收益率承诺

四、为什么比起“概率直接映射仓位”，先做分层通常更稳得多

五、为什么概率校准和排序能力是两件不同的事，混在一起会让判断失真

六、为什么高概率不等于可以无上限加仓，因为交易世界还有容量、换手和风险预算

七、为什么这一讲真正建立的，是“输出层治理”而不是只会取一个概率列

八、这一讲为后续跨市场迁移和更复杂落地准备了什么

九、为什么这一讲做完后，最好已经形成“输出不是答案，而是待治理对象”的认识

十、这一讲也在帮你建立“输出层评估要独立成层”的意识

十一、总结

十二、系列衔接

十三、风险揭示与免责声明

【CatBoost 系列第6讲】概率输出与风险分层在选股模型中的应用