量化实习 v2丨Day 4:在数据的海洋里扑腾
条评论今天早起的时候没有昨天那么困了,到公司的路程也总算是顺利一些。
继续昨天的工作,我对照兴证的研报,将各个行业的基本面数据名称复制下来,到同花顺或者 WIND 上面去查,然后将数据加入到候选池,查完之后将所有数据下载下来,用 Python 分别计算一下各个指标和行业指数的相关性,最后将所有数据整理好。期间,也常常发生某些数据找不到,需要尝试拿其他数据来替代的情况,总之就是没什么技术含量但是很费时的过程。也许我应该把这个流程也稍微自动化一下。
可以肯定的是这不是我想做的东西,但是似乎也是量化研究员不得不做的事情——毕竟数据永远不会凭空出现的。但还是不得不吐槽一下,为什么市面上的所有商业数据库都这么难用?现在总算知道像 AKShare 这种项目有多么可贵了,人家虽然数据没那么全,但是接口多么方便,起码比点来点去的要好多了。
下班前听到老师们聊天,提到现在的金融 AI 分析工具都快要取代研究所了,不得不说这个时代的 AI 冲击真是让未来捉摸不透。
今天就写到这里。