主要观点总结
该文章主要讨论的是中金公司关于另类数据策略的研究报告,重点分析了新闻数据在近期持续有效的原因以及主流价量因子的波动情况。文章认为新闻数据有效性和传统因子波动受到长短期双重因素影响,短期是个人投资者参与占比提升,长期是新媒体发展提升信息传导效率。此外,文章还提到了投资者结构变化对金融市场的影响以及新媒体在信息传播中的作用。
关键观点总结
关键观点1: 新闻数据在近期持续有效的原因分析
文章认为新闻数据的有效性源于A股市场个人投资者在过去只能从机构研究报告、官方新闻媒体等渠道单向获取信息,随着新媒体的快速发展,个人投资者逐渐从抖音、小红书等各类新媒体直接获取信息,这一变化提高了信息传导至个人投资者的效率。
关键观点2: 主流价量因子的波动情况
文章指出近期主流价量因子出现波动,观察到一些常见的风格因子有效性减弱,多头超额表现有所回撤。这种现象可能与投资者结构的变化、市场风格的切换、因子投资策略的普及等因素有关。
关键观点3: 投资者结构变化对金融市场的影响
文章讨论了投资者结构的变化对金融市场的影响,尤其是个人投资者参与度的提升和新媒体的发展对信息传播效率的影响。个人投资者参与度的提升使得市场共识形成速度加快,提高了资产定价能力。同时,新媒体的发展使得信息传播效率提高,个人投资者可以更快获取市场信息,从而影响投资决策。
正文
新闻数据应用在量化策略中的固有问题
在去年8月份的
《另类数据策略(2):如何优化新闻文本因子》
中我们提出,新闻数据用于量化策略有着其固有的诸多问题,如新闻冗余程度较高,信噪比较低等。针对这些问题我们使用标签筛选的方法确定了基于ChinaScope新闻数据的新闻筛选标准。在使用多个标签对新闻提出筛选后新闻信噪比大大提升,有效性也显著增强。
但对于股票来说,并不是新闻越利好未来股价就会上涨;也不见得新闻越负面,股价就会相应下跌,还要结合前期市场的预期综合分析。举例来说,如果谷歌公司在欧盟因反垄断调查被罚5亿欧元,消息传出后股价反而还会大幅上涨,因为之前市场预期谷歌公司会被罚款20亿欧元。因此当实际的负面新闻优于预期时,同样会引起股价上涨。也就是说对个股而言市场预期带来的涨跌会较大程度上干扰新闻的效果,改善个股预期对于新闻效果的影响可以选择将个股层面的得分聚合到行业上,尽可能抵消个股层面的预期差,得到相对纯粹的行业新闻情感得分。因此针对新闻数据的问题我们对新闻数据做两步处理:1. 筛选高质量新闻;2. 将个股新闻得分使用自由流通市值加权聚合到行业。
新闻数据优化后的行业配置模型有效性显著
做完筛选和聚合后的行业因子得分落到行业层面时,有效性较为显著。自2023年8月底报告发布以来多头行业组合相对中信一级行业等权的超额收益率达17.4%,最近12个月超额收益率也达到12.5%。尤其是在2024年2月和10月份A股市场发生较大波动的环境下仍能产生稳定甚至更高超额收益。
图表2:新闻情感得分行业配置策略超额基准持续稳定升高
资料来源:ChinaScope,Wind,中金公司研究部
图表3:新闻情感得分行业配置策略样本外实际配置情况
注:公用事业即中信一级电力及公用事业行业;统计区间2023/09/01-2024/11/29;2024年12月由于没有完整月度涨跌幅数据,因此仅展示持仓
资料来源:ChinaScope,Wind,中金公司研究部
新闻配置行业的关键时点切换及归因分析
从上节新闻情感因子的行业配置可以看出,在2023年8月至2024年8月的多头持仓以
煤炭、石油石化
等红利风格为主,而这个阶段也是价值长期跑赢成长的阶段。计算机和通信这种高成长风格的行业样本外被选择的次数相对较少,其中计算机在2024年9月模型首次推荐,而当月成长大幅跑赢价值指数,且模型及时调出偏价值的煤炭行业,
计算机、通信
行业在2024年9月、10月相对行业等权的超额收益均超过10%,计算机超过20%。
注:统计区间2023/08/01-2024/11/29
资料来源:Wind,中金公司研究部