工作需要,决定自己从头搭建一个系统的回测框架。开发至今,先暂停一会,思考下这个回测框架应该如何编写。

目前开发完全使用 Python 语言,已经完成了StratPerf 类和 NetWorthMaker 类,分别可以对净值序列生成绩效数据和对持仓数据生成净值。接下来,应该就是要对因子数据生成持仓。

由于量化策略的复杂性,一个显而易见的问题是,这些类是否能用于不同类型的策略?

目前根据我的观察,策略主要分为三类:择时策略、截面策略和规则型策略。当然,可能还有什么无法归结到这三个类别的策略。这套框架开发应当尽可能适用于这三类策略。首先,StratPerf 没有问题,因为这个最少只需要输入一个净值数据,而这一点对于所有策略是通用的;NetWorthMaker 应当也没有问题,因为这个类通过持仓生成净值,而任何策略当然都可以生成一个持仓表。

那么可能存在问题的环节就是生成持仓的类的编写了。首先讨论,一个类是否能够统一择时和截面因子?一般而言,我们参考截面因子来做多因子值偏高的品种,做空因子值偏低的品种;而对于择时因子,我们做多因子值为正的品种,做空因子值为负的品种。当然,我们也完全可能做一些变化,比如对于截面因子,我们也可以做多因子值为正的品种,做空因子值为负的品种;而对于择时因子,当然没有截面的相对大小可以比较,但是我们也可以控制当因子值大于某个非零值时做多,小于某个非零值时做空……

这样的问题可以通过增加一个参数解决,比如,可以在 __init__() 函数中增加一个 mode 参数,用于指定是根据相对值来多空还是根据绝对值来多空。而对于这两种模式,我们又可以设计更多的参数,比如是否只多不空,亦或只空不多;再如截面多空是选择几只品种还是选择排名前后多少占比的品种?如果是根据绝对值来多空,那么多和空的阈值又是多少?我在考虑用一串字符串来表示以上提到的所有参数。比如根据相对值来持仓、分别多空前后 10%-30% 的品种,就可以表示为r_l:10%-30%_s:70%-90%。嗯,看上去不错。

假设上面这个方法可以兼容择时和截面因子,那么如何兼容规则型策略呢?规则策略一般意味着达到某些条件就触发买入或者卖出的信号,看上去似乎和因子型策略形式大为不同,然而实际上,任何规则型策略都可以转换成因子型策略,只需将买卖信号作为因子,然后用绝对数值来生成持仓就可以了。基于这个思路,我们只需要在程序中根据我们的规则型策略生成买卖信号表,那么同样可以利用上述的类来生成持仓,剩下的流程就和普通因子型策略一样了。

当然,这样的方式也许有点为难使用者,因此也可以考虑再写一个类,用来根据规则来生成买卖信号。设想这个类可以接受一系列数据和一个函数,这个函数则可以根据这些数据来生成买卖信号。那么,这个类应当可以根据这个函数和这些数据来生成信号表或者因子表,不过这是后话。

除了上述考虑以外,受到舍友的启发,对于因子型的策略(其实规则型策略也一样),完全可以开发出一个标准化的开发流程,将因子编写集中到一个小小的函数中,然后利用整个系统来对这个因子进行测试、结合进入因子库。具体来说,可以实现一个人因子基类,然后令所有因子先继承这个类、指定需要读取的数据、根据数据给出生成因子值的逻辑。这样,策略的研究就可以大体上回归到对一个个因子本身的研究。也许大多数因子工厂就是这样的模式。

以上就是我目前对于回测框架的想法。