量化实习Day7
条评论今天鼓起勇气向mentor问了一个问题。毕竟她之前电话似乎不满意我与她交流的频率,而我这几天读研报又没有啥很想问的问题😓。
今天的研报收获不多,分享一下对于一个因子好坏的判断方式。
好因子or坏因子?
挖因子是为了丰富策略,策略是为了赚钱。因此我们挖因子最终的目的还是为了赚钱。那么只有能赚钱的才是好因子吗?
因子的作用在于选出那些比较好的股票,或者在某一股票里选择一个好的时间买卖。然而众所周知,近年来大A指数行情很不好。在这种情况下,市场大部分的股票表现都相对糟糕。考虑一个因子的胜率在60%,假如市场处于震荡行情,那么我们可以预期这一因子选股带来的效果是稳定而缓慢的上升;而如果市场处于趋势上升行情,那么预期这一因子会带来相对更高的收益;而如果市场的趋势是掉头向下的,那么这个因子的效果可能是跌得比基准更少——但依然是下跌的!
同样的因子,在不同的市场行情中带来的收益也不同。从赚钱的角度来考虑,我们当然只想要正收益。但是在不理想的行情下,如果能少亏一点也能接受。这就是为什么因子的评估应该更加关注超额这一指标。即使总体收益不好,但是如果这一因子能够产生稳定的超额,那么当市场行情好转时,就可以预期这一因子会带来高收益。
因子评价标准
这部分根据我目前为止读到的研报,整理一系列用于评价因子好坏的标准(指标含义解释来自ChatGPT)。
IC类:
- IC (Information Coefficient):信息系数,衡量模型预测值与实际值之间的相关性。取值范围为[-1,1],越接近1表示模型预测与实际值越相关。
- IC均值 (Mean IC):信息系数的平均值,用于评估模型整体预测准确性。
- IC的t-统计量 (IC t-statistic):信息系数的t统计量,用于判断信息系数是否显著不同于0,通常t统计量的绝对值大于2表示显著性。
- 累计IC (Cumulative IC):信息系数的累积值,表示在一段时间内模型预测与实际值的累积相关性。
- IC_IR:信息系数的IR值,即IC均值除以IC的标准差,用于衡量预测的一致性和准确性。
回测类:
- 收益率 (Return):资产价格或投资组合价值的变化率,通常以百分比表示。
- 年化收益率 (Annualized Return):投资组合的年化收益率,通常用于比较不同时间跨度的投资表现。
- 超额收益率 (Excess Return):投资组合或资产的收益率减去某个基准收益率后的差值。
- 最大回撤 (Maximum Drawdown):投资组合或资产价值从最高点下降到最低点的最大幅度,用于衡量投资风险。
- 夏普比率 (Sharpe Ratio):投资组合或资产的平均超额收益率与风险(通常以标准差衡量)之比,用于衡量单位风险所获得的超额收益。
- 波动率 (Volatility):资产价格或投资组合价值的变动程度,通常用标准差表示。
- 年化波动率 (Annualized Volatility):波动率的年化值,用于比较不同时间跨度的波动性。
- 信息比率 (Information Ratio):投资组合或资产的超额收益率与基准超额收益率之比,用于衡量主动管理的有效性。
- 收益风险比 (Return/Risk Ratio):投资组合或资产的年化收益率与年化波动率之比,用于衡量风险调整后的收益。
- 胜率 (Winning Rate):投资组合或交易策略的获胜次数与总交易次数之比。
- 换手率 (Turnover Rate):投资组合中资产的交易频率与总资产的比率,用于衡量资产的交易活跃度。
- 盈亏比 (Profit/Loss Ratio):盈利交易的平均盈利额与亏损交易的平均亏损额之比。
- Calmar比率 (Calmar Ratio):投资组合或资产的年化收益率与最大回撤之比,用于衡量风险调整后的收益与风险之间的关系。
- 因子分组单调性 (Monotonicity of Factor Grouping):因子分组的单调性,指随着因子值增加(或减少),分组收益率的单调性,用于评估因子分组的有效性。