量化实习Day8
条评论今天顺利提前完成5篇研报,并四点跑到罗湖去自提了一个二手显示器(没有包装,提得我的手臂都要崩溃了)。总的来看现在阅读研报比之前要更快,也更容易提取关键信息。继续总结一下今天的思考与收获吧。
研报的可信度
这几天越来越强烈的一种感受是,对于阅读的这些研报中的结论没有信心。一方面是因为这些研报肯定有一定夸大成分,只挑好的数据展示;另一方面,很多研报对因子及其参数都采用搜索方式寻找,而回测的时候又都用的是相同的时间区间,可能会有过拟合的问题,样本外收益能不能达到回测结果都难说。因此我特别关注研报在测试的时候有没有划分训练集和测试集(绝大部分都没有),以及因子是否有经济解释(这样一般参数比较少,而且更令人信服)。
偶然发现有的研报并不是提供新的策略,而是跟踪此前的策略并发布新的收益情况,这种研报应该多加关注。比如今天读到两篇这样的研报,其中一篇很显然在样本外超额非常拉跨,而另一篇则继续保持了稳健的超额收益,这样的策略会让我非常感兴趣。
因子的超额收益
另一个思考关于“超额收益”这一指标。超额收益是用于检验因子是否能够带来比直接投资基准大盘更好的收益,通常的计算方法是直接将净值曲线减去基准曲线得到超额曲线,如果超额的符号为正则意味着因子带来了额外的收益。
但是我认为这样的做法存在一些隐患。超额收益实际上应该叫做“累计超额收益”,因为它涵盖了过去的回测信息。这个指标的问题在于,很多研报把正的累计超额收益当作是好因子的评价标准,但问题是,你的累计超额收益虽然在前面一直增长,但是最后两年却在下降,只不过没有下降到0以下。你的因子实际上已经失效了,只不过这不能反映在累计超额收益的符号上。基于这个想法,应该将“累计超额收益”转化回真正的“超额收益”,即每一期相对于基准多赚了多少钱。
这可能还不够。打个比方,假设存在一个10年的回测期,因子在第一年将资产扩大到基准的两倍,此后将所有资金直接用于配置基准大盘。那么如果大盘在今后9年里一直保持上升态势,那么超额收益就会一直扩大——因为超额收益的算法是净值减去资产,而资产上升的幅度一定大于基准上升的幅度。那么后面9年的超额收益完全不是因子的功劳,但在图像上看却像是因子在不断创造收益。
因此,考虑将净值与基准之比作为衡量标准。当这个比值扩大时,意味着因子继续带来额外的收益;当这个比值保持不变时,无论此时超额是扩大还是缩小,都不意味着因子继续带来任何额外的收益或者损失;当这个比值缩小时,则因子恐怕面临失效的风险。
这一类指标目前似乎没有看到什么研报在使用。量化本来就是极致的工程艺术,今后若要分析因子的好坏,需要以更加细致的标准进行评估。