量化实习 v2丨Day 26:尝试拨茧抽丝

上午将周报提交到印象笔记之后,mentor 提出了很多意见,可能是因为对于进度稍有点急。mentor 说,如果数据挖掘的方式很难出活的话也可以考虑手搓因子或者复现一些研报,因此这些将成为我接下来的主线。 于是我决定先整理一下思路。由于之前研究的时候整理的习惯不好,文件一多就十分混乱,因此我重新整理了一遍文件(但是感觉之后还会变乱)。接着,我编写了一个小脚本,...

阅读全文

量化实习 v2丨Day 24:道阻且长

今天回到宿舍才想起来日记没写,简单写一写吧。 由于最近实际上在埋头开发回测框架,因此和 mentor 都没有什么交流,而实际上我这边在策略研发上也没有什么进度,正好不想被知道这一点。关于策略,我现在的想法主要有两点:一是把数据再做细一点,比如全部做成当月同比或累计同比这种数据;二是根据数据来做因子的方式上,可以采用数值在过去一年中的分位数的方法来尝试,看看能...

阅读全文

量化实习 v2丨Day 23:不破不立

昨晚我写的数据库写入函数被提出了一些新要求,因此我整个上午和下午的前半段都在重新编写这个数据库写入函数。过程还是挺顺利的,也学到了一些用 Python 的 SQLAlchemy 来读写数据库的方法。或许以后我也可以将数据保存在 SQLite 中,并且用 Python 来读写,避免数据量太大而混乱的问题。 完成这个工作之后,我再次对着此前的回测结果陷入了沉思,...

阅读全文

量化实习 v2丨Day 22:如何提升策略性能?

上午和老板开了个小会。老板提到了各个行业可以考虑的数据来源和基本面分析方向,还是有不少收获的。也许我最终筛选出来的因子有点太多,而且过于集中在少数的角度。比如,一个品种的基本面景气度本质上就是由供给和需求来决定,那么不妨将因子分成供给和需求两个方面,而需求又可以归纳为库存和下游产业对于品种的需求。通过这样的方式将基本面的分析分解为几个部分,且每个部分精选最重...

阅读全文

量化实习 v2丨Day 20:心情像坐过山车

上午简单合成了一下因子,方法是简单的标准化后等权平均,结果回测结果好得不得了,每个品种的收益曲线都昂首冲上天,超额收益率高得吓人。我当然知道这样的收益率不太现实,因此还是忍不住先按照品种回测了一下全样本数据,结果果然浇了我一盆冷水。 只见收益曲线以训练集和测试集的分界为中心,仿佛一座险峭的巨峰,左侧直上云霄,右侧则直挺挺坠落山崖,几年之内巨额收益一口气全亏完...

阅读全文

量化实习 v2丨Day 19:几无进展的上午

由于下午有一门期末考试,今天再次只坐了半天工位就走了。上午好像除了划分测试集重新测了一遍因子以外啥都没干。 回想起来好像常常这样,虽然上班时偶尔也会摸鱼,毕竟大部分时间还是在认真工作。然而下班时盘算一下好像基本上没做些什么,不禁怀疑自己效率原来这么低么?再仔细回想一下,似乎是在一些小细节方面耗费了不少时间。这些细节可能是一个程序 bug、一段代码的优化、一段...

阅读全文

量化实习 v2丨Day 18:大道至简

今天效率不高,上午又修补了一下回测函数,让它可以仅更改一个参数就分别输出多头、空头和多空的回测净值。由于回测跑得很慢,尝试使用 GPT-4o 修改一下函数,让它跑得更快。哪知这个模型信心满满地分析了一大通,“使用 Numpy 运算”“矢量化运算”云云,结果给出来的函数跑完结果差了十万八千里。遂放弃,耐心等待 10000 多条回测任务结束。 紧接着,尝试分析一...

阅读全文

量化实习 v2丨Day 17:回测初见成效

今天有点着急回学校考试,差点把写日记的事儿忘了。 其实今天没有太多值得记录的。现在的实习工作似乎进入一种更加连续的状态:用更长的时间来做同一件事情,而不是常常在不同的任务之间切换。 上午调整了一下回测代码再跑了一次,发现有些回测结果竟然无法计算年化收益率。仔细一看,发现某些行情数据不对劲,其间有数据缺失。反馈给 mentor 后,收到再次回到此前所用的 op...

阅读全文

量化实习 v2丨Day 16:无头苍蝇

接着上周的工作,我继续尝试寻找有用的因子。但是和上周一样,想不出来有什么办法可以用下游行业基本面数据来预测上游期货品种的价格。 中午跟 mentor 吃饭的时候提出了这个问题,她表示我不用想太多,可以直接先用下游行业基本面数据来回测期货(指数)价格,来寻找比较有效的因子;后续也可以读读其他的量化研报,来用更复杂的方式来寻找因子。 于是,我打算直接将所有期货品...

阅读全文

量化实习 v2丨Day 15:终于开始做因子了(吗?)

今天感冒还是有点头晕,不想说太多了。 上午一到公司,mentor 跟我说可以先用我之前整理的数据做一些因子,大致介绍了一下我的因子要整理成什么格式就让我走了。 这是我一直所期待的,但是真正到来时却不知如何下手了。拿这些指标怎么合成因子?是先读读相关研报找找灵感吗?还是先把各个指标都回测一下看看?要不要先算一算 IC 或者 IR 等指标?每个因子的频率、发布时...

阅读全文